教育中的“数据清洗”有多难?

作者: 智能观 | 来源:发表于2018-10-15 17:53 被阅读0次

美国一个由25所大学组成的联盟,上月公布了一个新的平台,该平台将从大学的系统中获取信息,为大学课堂带来更丰富的数据分析。

但是平台方发现,将所有的数据转化成教授可以实际使用的形式,是一个棘手的挑战,第一个面临的问题就是 “数据清洗”。

说得明白一点,你不能把数据洗得太干净,全都是积极正面的信息。该组织表示,他们正在努力做一些枯燥但重要的工作,对信息进行标准化和组织,以便分析学生的努力。

运行该平台的财团被称为Unizin,到目前为止,他们正对五个大学进行数据清理:印第安纳大学、俄亥俄州立大学、爱荷华大学、密歇根大学和威斯康星大学-麦迪逊分校。他们希望创造一个其他人也可以使用的流程,并促使EdTech公司更严格地遵循标准,这样就不需要进行太多的清洗工作了。

如此一来,大学总有一天会有一个信息检索引擎,包括来自学习管理系统( LMS )、学生记录、出版商提供的在线教科书平台以及教授使用的许多工具的信息。

Unizin首席技术官Etienne Pelaprat说:“如果你想有意义地使用数据,很大程度上取决于所处理的数据的质量。”

移交数据集

第一个障碍是说服科技公司分享数据。

明尼苏达大学学业技术系统分析师Drew LaChapelle表示:“人们在LMS上使用了很多第三方工具,我们对第三方应用程序内发生的事没有任何了解。所有这些都被卖家抓住了,他们通常不会和我们分享。"

Unizin在过去几年里,与几家软件公司签署了一些联合许可协议,在所有协议中,它都要求这些公司允许大学访问他们用户创建的数据。Unizin要求公司遵循非营利组织IMS Global开发的名为caller Analytics的技术数据标准。

爱荷华大学企业教学技术主管Annette Beck认为:“我们正在对供应商产生影响,让他们明白自己在高等教育中有着重要的地位。Unizin财团做的这件事,使我们真正有影响力。但我们会永远得到想要的一切吗?不。”

锁定数据

一些大学暂时没有尝试新的数据平台,部分原因是出于安全考虑。

Unizin组织最近聘请了一名“担保官”,他正与校园安全方面的工作人员合作,制定政策来管理系统中的数据如何处理和保护,免受潜在黑客的攻击。

Unizin的Pelaprat说:“我们摄入了大量敏感数据。一些机构仍在等待这些政策的制定。"

即使解决了数据收集和清洗问题,大学也处于开发工具和策略的早期阶段。

高等教育中不是每个人都认为收集数据是值得的,一些人担心过多地关注数据会降低大学教学的质量和活力。

pelaprat认为,大学只是处于学习分析的早期阶段,数据平台的一个目标是支持研究和实验。如果该系统运行正常,它可以让大学进行跨校区实验,这在以前是不可能的。

他说:“许多对学习分析持怀疑态度的人,认为大量数据被翻出来,但由数据驱动的成功干预却很少。然而数据的获取、使用是与实际的教学实践共同发展的。"

换句话说,随着教授们学习整合实时数据,教学看起来可能会大不相同。“前者也会成就后者。”他争辩道。

Unizin自2014年成立以来一直面临批评,因为它向大学收取高额费用,还质疑大学的关注方向。但在上个月明尼苏达大学的一次会议上,与该组织合作的几位大学领导说,这个数据平台是该联盟一个成熟的“作品”。

来源:EdSurge

作者:Jeffrey R. Young

智能观 编译

—完—

声明

编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。

相关文章

  • 教育中的“数据清洗”有多难?

    美国一个由25所大学组成的联盟,上月公布了一个新的平台,该平台将从大学的系统中获取信息,为大学课堂带来更丰富的数据...

  • 走进大数据丨 ETL - 数据清洗过程

    我们已经对数据清洗有了一定概念:“数据清洗确保无法辨认的数据不会进入数据仓库。无法辨认的数据将影响到数据仓库中通过...

  • 数据清洗的步骤是什么(上)

    数据清洗工作是数据分析工作中不可缺少的步骤,这是因为数据清洗能够处理掉肮脏数据,如果不清洗数据的话,那么数据分析的...

  • SAS中的数据清洗

    1.数据合并 (1)利用set语句纵向合并 data数据集; set数据集1(数据集选项)数据集2(数据集选项...

  • sqoop导出数据

    应用场景1:把需要清洗的结构化数据导入到hdfs中,通过hive进行清洗后,把清洗结果导出到结构化数据表中,进行展...

  • scrapy-4.pipeline

    pipeline是清洗数据存入数据库的清洗数据看每个人的需求,但是存入数据库是有套路的。就是在这个class里有三...

  • 缺失值处理1

    数据预处理步骤有数据清洗、数据集成、数据变换、数据规约。实际工作中不是每一步都必须。 数据清洗包括缺失值和异常值,...

  • 数据分析实战45讲 笔记五

    11 | 数据科学家80%时间都花费在了这些清洗任务上? 在数据挖掘中,数据清洗就是这样的前期准备工作。对于数据科...

  • 第三章-数据预处理

    数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 3.1数据清洗 数据清洗主要是删除原始数据集中的...

  • 赏识教育有多难?

    因为孩子的教育方式问题,又和孩子爸爸发生了分歧。我不禁想起《阿甘正传》和一句话:只有你能欣赏我。 很多家长,尤其是...

网友评论

    本文标题:教育中的“数据清洗”有多难?

    本文链接:https://www.haomeiwen.com/subject/bezfzftx.html