巨量资料即将彻底改变教育/《大数据:教育篇》


巨量资料即将彻底改变教育/《大数据:教育篇》

史丹佛大学资讯工程教授吴恩达
是线上授课公司Coursera的共同创始人
他在网路上开设的机器学习课程
正是巨量资料即将让教育彻底改变的前兆

达瓦(Dawa)全神贯注,在笔尖蘸了一点颜料,小心翼翼的画出一条细细的黑线;然后又蘸了一点颜料,再画出另一条细细的线。时间慢慢流逝,一幅拥有迷人几何细节的唐卡(一种丝质的佛教卷轴画)也渐渐成形。
屋外,白雪皑皑的喜马拉雅山峰围绕着不丹王国的首都廷布(Thimphu),山峰在夕阳映照下,闪闪发光。屋内,达瓦和他的同学都大概只有二十多岁,穿着相同的蓝色长袍,专心致力于手头上的精细工作,岁数中年的师傅则在一旁仔细监督。
唐卡艺术家的训练还是遵循古老传统,达瓦和他的同学来到这里的目的,不是接受教育、开拓心灵,而是要从学徒制,学到纪律。这里的学习方式不是询问,而是模仿。早从数百年前,就已经有人定下无数的规矩,规定只准在什幺地方、以什幺方式、画出什幺东西来。
达瓦的师傅就是要确保这些年轻艺术家,完完全全遵照指示,重複做着之前世世代代唐卡绘画家所做的事。如果胆敢稍稍偏离、或是不符过去的规定,可不只是下次小心一点就好,而会被视为大逆不道。在这里,所谓最好的画家,就是要能够完美複製师傅的作品。师傅会不断指出各个不完美的地方。虽然学员能够即时得到师傅的意见回馈,但这种学习方式仍然算是缺少资料和数据的回馈。
相对的,世界上还有一种可说是天差地别的教学方式,譬如史丹佛大学资讯工程教授吴恩达(Andrew Ng),他是在网路上开设「机器学习课程」(machine learning,这是资讯工程的一个分支)。
吴恩达是线上授课公司Coursera的共同创始人,他的这种教学方式,也正是巨量资料(俗称大数据)即将让教育彻底改变的前兆。
吴恩达会蒐集一切跟学习活动相关的资料,涵盖学生的各项作为。这样一来,他就能知道哪些课程安排的效果最好;而且系统经过仔细设计,能够自动将结果导回课程中,据以改善教学、提升学生的理解和表现,也能依据每一位学生的个别需求调整教学。
举例来说,吴恩达会追蹤学生观看教学影片时的动作,像是他们会不会按暂停、快转,甚至是提前切掉影片(这等于是一种数位跷课的行为吧?)。
吴恩达能够知道:学生是不是同一部影片观看了很多次,又或是他们会不会回头观看某一部先前的教学影片来複习。此外,他也会在教学影片课程之间,放进小考;但这可不是为了测试学生专不专心,课堂秩序这种老掉牙的事完全不在他的考量之中。吴恩达之所以要小考,是真的想知道学生是不是都懂了,而且他还能针对任何一位学生,看看学生是不是在某个地方卡住了、想不通。
吴恩达可以追蹤任何一台电脑或平板电脑的课后作业和考试结果,所以他能够判断某一位学生是否在某个特定课题,需要加强协助。而只要分析全班的所有资料,他也能看出学生整体的学习情形,据以调整课程。甚至,他还可以将今年的学生资料与前几年、或是其他班级的资料做比较,就知道哪一种教学方式最有效。

吴恩达教授的修课学生人数都有数千、甚至上万人,所以各种发现在统计上都够稳健,而不会有一般教学研究计画只能依靠小规模观察的问题,这也算是一大好处。但在这里,最关键的要点并不在于修课人数有多少,而是在于巨量资料。
吴恩达教授彻底利用巨量资料,让巨量资料大显神威。例如,他追蹤学生观看教学影片的顺序,就发现了一个令人意想不到的反常现象。大部分学生都是依照顺序,一部一部往下看,但是过了几个星期,大约看到第7堂课的时候,学生会跳回第3堂课。这是为什幺呢?
吴恩达进一步调查,发现第7堂课是要求学生用线性代数写一条公式,而第3堂课则是在帮助学生複习数学。很显然,许多学生对于自己的数学程度没那幺有信心。于是,吴恩达就知道应该修改一下课程,在学生觉得压力太大、有点灰心的时候,用更多的数学複习内容帮他们一把;这正是巨量资料告诉了他,某些学习关卡的时间点。
还有一次,吴恩达看到不少学生反覆观看某个主题的影片,而且他是真的「看到」了:大约在第75堂课到第80堂课之间,学生观看教学影片的顺序就大乱了,学生会重複观看,但没有一定的顺序。(吴恩达事先製作了一套让巨量资料视觉化的程式,只要统计上显示「使用者观看影片的顺序异于常态的次数大增」,就会从深蓝色转为鲜红色。)
吴恩达教授的结论是:学生对于理解这些概念有困难,正在努力想要搞懂。于是他意识到,如果教师能知道这些事,就能够改进、重新录製那几堂课的影片;而且接下来,也能够明确检核,看看学生的学习情况是不是有好转。

吴恩达教授看到的巨量资料威力,还远远不止如此。一般人使用线上论坛的时候,会看的是贴文有多少人已读,再请读者对贴文评分、判断贴文内容是否有帮助。但吴恩达对于自己课程的线上论坛,则是跑了一回很複杂的统计调查,能够真正看出某篇论坛贴文「有没有帮助」:他会先找出答错某个主题相关作业或考题的学生,再看看他们读过某篇特定的论坛贴文之后,下次碰到同样问题能够答对的百分比。
例如,在2011年关于机器学习的课程上,有几千名学生答错了「线性迴归」的一题成本计算题。但只要是后来读过论坛第830号贴文的同学,下次能够答对的机率就高达64%。
于是从现在开始,只要是答错那个主题的习题的同学,系统就会自动把第830号贴文寄给他们。这是一种以巨量资料为垫脚石的教学方式,能够找出哪些论坛贴文确实有助于学习,而不是只倚赖学生对贴文的主观评分。
而且,这种使用巨量资料的方式,绝不只是史丹佛大学吴恩达课堂的专利;它已经点出未来的教育大趋势!巨量资料正在进入教育的所有层面,对于全世界的教学与学习活动,必然会产生深远的影响。

这本《大数据:教育篇》就是要谈谈巨量资料如何改变教育。巨量资料让我们拥有前所未见的方式和观点,能够看到究竟什幺有用、什幺没用。我们现在可以看到以前不可能观察到的学习层面,从而改善学生的学习成效。课程可以依据学生个人的需求,进行调整,有效提升他们的理解和成绩。
教师也能够找出最有效的教学方式:教师的工作不是「被取代」,而是「更有效」,而且很可能也「更有趣」。学校领导者和政府决策人员,也能用更低的成本,提供更多的教育机会,而这正是减少社会贫富差距和社经地位差距的重要因素。史上首次,我们终于拥有了强大、具实证效果的工具,能够了解「怎样教学」与「如何学习」。
但是请别误会,这本书要谈的并不是「大规模开放式线上课程」(massive open online course, MOOC)而已。吴恩达教授在史丹佛大学开设的MOOC课程,过去几年已经广受瞩目,多次跃上新闻头条。MOOC可说是让人人都有了普及受教的机会,种种可能性让全球都深深着迷,这无疑是一项美好的发展。然而有时候,MOOC也只是旧教育换个新样子,仍然是「我讲你听」,只是上课机会更多、求学的门槛降低而已。
然而,MOOC确实有一点是全新而潜力无穷的:它们会产生巨量资料!有了这些巨量资料,我们就能知道什幺教学方式最有效;我们现在已经拥有了犀利的工具,能够解开过去无法解开的谜团,知道前所未知的祕密。这个犀利工具,就是为了分析巨量资料而发展的种种概念与技术。

上一篇:
下一篇: