题目:从模糊主观和客观角度评价教育网站的综合决策模型

摘要:随着信息技术和网络技术的进步,大量的数据被数字化,通过网站的建设为用户提供信息。不幸的是,它们在互联网上都是超载和重叠的,因此用户无法区分它们的质量。为了在教育中解决这一问题,黄、曾等人提出了一种基于用户和专家意见对教育网站质量进行评价的群体决策系统。他们的调查来源完全来自于人类的意图,被称为主观的观点,来判断网站的质量。然而,人类在决策中的本质在意图和行为之间有差距。人的行为,即客观的视角,是获得人类思维和实际行为的另一个基本来源。为此,我们可以使用数据挖掘方法来获取目标源。在本研究中,我们提出了一种综合决策模型,应用于从模糊主观和客观两方面评价教育网站。使用问卷查询人的意见来提取前者,后者由数据挖掘技术、模糊聚类自动获得。
1、介绍
随着信息技术和网络技术的进步,大量的数据被数字化,通过网站的建设为用户提供信息。根据Netcraft Web服务器的调查,在因特网上建立了超过2.35亿个网站。不幸的是,当用户试图寻找一些信息,却在海量的数据中迷失了他/她的信息时,信息超载和重叠问题成为了一个障碍。由于Web站点是连接这些信息的主要门户,因此评估网站的质量或效用就成为一种新方法。作为理解用户是否满意这些数据的一种方法。
原本中讨论了信息过载和重叠问题在教育网站的类型中是特别重要的。在台湾,对高等教育评估和认证的兴趣一直在进行大学评估。受教育部委托,一批专业人员制定了评估高等教育机构的标准。如果不考虑教育质量的维度,就不能保持教育的整体质量。几乎所有的教育资源都是以网站的形式呈现出来的。
作为对期刊质量的判断,保证网站也遇到同样的情况。在本研究中,提出了一个综合决策模型,称为 模糊主客观模型Fuzzy Subjective and Objective Perspectives (FuzzSOP),从模糊的主观和客观的角度来评价台湾的教育网站。
2、Fuzzy Subjective and Objective Perspectives (FuzzSOP)模糊主客观模型
对于该模型,我们还开发了一个FuzzSOP算法,该算法由三个阶段组成:客观、主观和组合过程。



2.1、利用模糊聚类获取模糊客观数据
在本小节中,我们将描述FCM方法是如何获取目标数据的。首先定义为给定对象,每一个
都是一组向量。
是一组
的矩阵,并且
,得到如下:

其中是
的成员级别
,FCM方法的目的是寻找最优模糊c段和相应的原型,使目标函数最小化如下:

其中是一个未知聚类中心的矩阵。
计算欧式距离。
(
)是一个加权指数会影响成员级别的常数。

给定新的聚类中心,就可以更新成员级别
:

当或者满足其他条件时,就停止,否则重复1.3步骤(看到上图)
在使用fcm方法之前,需要讨论三个参数:簇数、模糊参数
和终止参数
。
(1)簇数。簇数
是影响聚类结果的主要参数。通常,有两种方法:聚类有效性度量和迭代合并或插入集群,了解集群数量的不同的效果。在我们的研究中,我们应该预先确定集群的数量,即质量等级的数量,因此,第一种方法是测量结果的优良性。
(2)模糊参数。模糊指数M是一个相当重要的参数,因为它显著影响聚类结果的模糊性。如果
接近1,则分区变得很困难,即
是0或1,意味着它们是不同的。另外,如果
较大,则分区变得完全模糊(
),表明它们都是重叠的。一般把
设为
之间。
(3)终止参数。当连续两次迭代的
小于终止参数时,FCM方法停止迭代。
最后,计算一个满足终止准则的最终矩阵来描述所有网站的簇的程度。如果对网站的质量感兴趣,我们只需要画出
列去得到目标向量
.这个
将被用来进一步组合
的主观数据。
2.2 用Palmer问卷获取模糊主观数据
为了获得用户的意见,可以采用Palmer开发的度量来进行研究。在问卷中有18项用于确定可用性,设计N、Web站点的性能构建。为了直接获取模糊主观数据,我们用语言术语代替了问卷的清晰尺度。用户将被要求回答关于web站点质量的18个问题
(其中
和
)。在完成问卷后,每个项目的得分被转移到总结十八个项目的平均值
(图2,第2.2行)。分数会被分为5个等级。然后,根据给定的函数对
进行模糊化,得到表示用户模糊主观数据的主观模糊向量
。
2.3 模糊主客观数据相结合
为了将这两种数据结合到Web站点中,必须给出计算模糊关系的主客观权重。在下面,我们使用一个组合操作来获得最终的模糊向量
:


其中代表乘积,
代表有界和,
等价于
。主观和客观的权重,
和
,由决策者或管理者决定,一般来说
。
下面来举个例子:
例1:设,则
。我们设定了三个层次的互联网使用体验:
——不到一年,
——一年到三年,
——超过三年。有三个互联网用户,
对应
,
对应
,
对应
。我们定义
,我们可以算到他们主观权重
,三者之和
。
最后的向量表示为网站的等级的成员程度。为了确定Web站点
的质量等级,我们要获取最大等级
,来自其中一个
。
为了达成共识,解决最终结果的冲突,可以进行敏感性分析。..可以调整和
的值,以观察对
的影响。如果
是不敏感的,我们认为是稳定的。如果
中有较大的变化,我们可以使用一种冲突解决方法,例如Delphi方法或面对面的讨论来解决这一问题。
4、 评价研究
4.1 实例
4.11 客观程序
首先,我们开始收集网站用户浏览行为的客观数据。根据前人的研究,我们可以使用不同类型的统计分析,以提取用户访问网站的知识,如查看时间(VT)、页面查看频率(PVF)或导航路径长度(LNP)。在我们的经历中由于LNP仅用于找到Web使用模式,所以我们只将前两个(VT、PVF)作为我们的观察结果。假设有两个Web用户的访问数据。然后,我们采用数据清理、用户标识和数据预处理的会话标识的技术。结果如表1所示。

接下来,我们执行FCM方法,从两个变量VT和PVF中获得七个Web站点的向量和等级。两个变量的平均值计算如下表:

选择将网站的质量分为优秀、好、中、差、坏五个等级,等级受VT和PVF的程度所影响。标准如下:

根据和
的公式可以计算出
:

可以计算出
,
,
,
,
。
在生成五个团的中心后,我们计算出对象与五个中心之间的新距离,从而获得一个新的分区矩阵,如下所示:

还没满足条件,就继续迭代图2的1.3、1.4和1.5迭代到
时,满足条件,停止迭代。最后
矩阵得到下图:

我们将这五个等级分别划分为五个组。下图展示了七个网站的聚类结果:

接下来,我们只使用网站2的实例来讨论如何结合主观数据来确定其最终等级。从中提取出网站2 的客观向量,
.
4.12 主观程序
通过分析用户访问网站时生成的网站日志来收集目标数据。在我们的实验设计中,当用户完成访问网站时,我们请求他们填写EPalmer根据访问网站进行问卷调查,同时计算平均值,结果如下图:

在这个例子中,我们获得了10个网站用户的10份问卷,对网站2进行了评价。在这里,文章中给出了表3中的10个模糊主观向量及其主观权重。

4.2 实证研究与实验结果

上表总结了时间的频率与比例。数据表明,大量的参与者每天在互联网上浏览时间长,并且有足够的互联网体验。
接下来,我们将报告客观和主观数据的数量以及每个网站(24个网站)的可用数据的数量。如果参与者对网站的调查问卷有答复,但没有浏览,我们将此数据视为不可忽略的记录。如下表:

我们还提供了24个网站的浏览时间(VT)、页面查看频率(PVF)和问卷评分的描述性统计数据:

然后还进行了4个不同的测试,第一个测试是
,第二个测试是
,第三个测试是
,第四个测试是使用等权方法分配相同的主观子权重,
。下表是根据四项测试总结的二十四个网站的评分结果:

根据测试1的结果,我们从坏的和优秀的两个等级中选择了五个网站来检查他们的网站的设计。观察前三个网站,我们发现它们都存在类似的问题,包括:(1)网站的排序、布局和安排不当;(2)界面不友好;(3)数字资源贫乏。然而,后面两个网站都不存在这种问题。
接下来,我们对CrispSOP模型和FuzzSOP模型以及HEEACT的分级结果进行了比较研究,以比较它们的差异。其中P——优秀、很好,O——中等、观察,P——失败、很差。CrispSOP模型客观结果用传统的k-均值方法计算。聚类中的所有等级都是绝对分配给1或0的,主观等级是通过问卷得分来获得的。下表比较了三种模型的评分结果。

首先,我们将HEEACT的结果与FuzzSOP的结果进行了比较。正如我们所观察到的,我们知道网站2(第2号)和第13号网站(第13号)在HEEACT模型中呗判为(P)成绩,但在FuzzSOP模型中被判为了失败(F)和观察(O)。通过详细查看这两个网站的演示文稿,我们发现它们的网站布局和数字资源都很差。这证明了HEEACT模型的判断是有点出入的。
其次,我们将FuzzSOP和CRISPSOP结果与HEEACT进行比较。如观察到的,我们发现有四个网站6、8、10、23,其中在FuzzSOP产生的结果和CRISPSOP的是不同的,但是FuzzSOP和HEEAT是一样的。另外,有两个网站16和20,其中CRISPSOP和FuzzSOP的结果不同但在CRISPSOP和HEEACT之间是一样的。因此,我们知道FuzzSOP模型的结果可能更接近HEEAT,而CrispSOP模型的结果则不然。这一发现还表明,在评价问题中使用的模糊模型能够比清晰的模糊模型更精确地反映现实生活环境。
最后,我们根据测试1的评分结果,讨论了客观、主观和最终成绩的一致性问题,如下表。只有网站2之间的差距很大。三个结果。总的来说,这三个结果基本一致。当我们仔细浏览网站2(第2号)时,我们发现它提供了非常丰富的数字内容可供访问对于用户来说,但是是一个糟糕的Web布局问题。因此,尽管网站2的内容在他们的脑海中是令人满意的,但糟糕的布局仍然阻碍了他们在实践中的使用。

5.结论
一般来说,评估必须考虑到主观和客观的观点,因为两者之间的差距妨碍了对事实问题的认识。
针对主客观数据不一致的严峻挑战,提出了一种综合模型FuzzSOP,并提出了一种FuzzSOP算法。该算法被用来评估教育网站,以了解网络中数字资源的质量。
FuzzSOP模型有两个局限性,可以在今后的工作中解决。第一个限制来自客观数据的收集。另外,PAR的大小由于资源的限制,每个网站的数据数量和数量是我们实证研究的第二个限制因素。
网友评论