所谓简单基于规则的自适应,对学习不但没有用,很有可能还会有害。
目前,人工智能在教育行业的应用场景,无外乎几种:智能测评、拍照搜题、智能排课、教育机器人、自适应系统。
有的公司选择先发力「智能测评」,如中小学在线 1 对 1 辅导品牌掌门 1 对 1 就极其看重课前测评和学生与老师之间的匹配;有的公司选择深挖「智能排课」,如面向 4-12 岁的在线少儿英语小班课产品「魔力耳朵」;还有的公司如「作业盒子」则致力于开发能教育机器人,实现 AI 教师落地。
但在自适应系统这个绕不开的话题上,国内提及的人不少,专攻的却寥寥无几。因为其核心算法的不透明性以及攻克的难度,自适应系统相较于其他几类人工智能在教育行业的落地场景更容易被贴上「忽悠」的标签。2016 年,论答(learnta)同时在上海和纽约成立,是为数不多专注于自适应系统开发的公司。其CEO王枫认为,中国是AI+教育最合适的商业市场,因为应试教育是AI+教育最能发挥价值的场景,而这一点的实现还得通过自适应学习(Adaptive Learning)。
在国外,自适应学习并不是个新鲜概念,相反,其是在上世纪七十年代随着人工智能的概念逐渐为人熟知。难怪王枫说,自适应学习就是人工智能在教育里的深度应用。根据维基百科的解释,自适应学习,也称为自适应教育,是一种教育方法,它使用计算机算法来协调与学习者的交互,并提供定制的资源和学习活动,以满足每个学习者的个性化需求。(Adaptive learning, also known as adaptive teaching, is an educational method which uses computer algorithm to orchestrate the interaction with the learner and deliver customized resources and learning activities to address the unique needs of each learner.)
2008 年成立于美国纽约的 Knewton 是该行业的代表,在 2015 年也曾来到中国并引发了国内对于自适应教育的第一次集中关注,但最终结果却显得有些「水土不服」。极客公园和论答 CEO 王枫聊了聊他眼中的自适应系统,做到自适应需要什么条件,以及 Knewton 失败的原因等问题。
真假
Geekpark:能讲讲自适应学习到底指的是什么吗?它与人工智能有什么区别?
王枫:自适应学习不是什么新名词,90 年代初卡耐基梅隆就已经开发出了 Cognitive tutor(认知向导),同时加州大学和纽约大学开发出来的 ALEKS。其实这两个产品已经比较成熟了,不是什么新产品。当然,产品的发展和许多人工智能领域的算法类似,受制于当时计算机的运算能力。现在这些年下来,自适应学习已经能够成熟开始商业化应用,Knewton 不是第一家做自适应学习的,但是第一家把它做到大规模商业化应用的。对我们算法来说,自适应学习是找到孩子学习问题,推荐下一步学什么,并在最短的时间内,帮助你攻克这个知识点。
其实自适应学习本身就是 AI 在教育里的应用,最早不说 AI,是因为那时候算法非常初级。但是教育里面的 AI 就是自适应学习,当然还有现在大家说的人脸情感识别,这些我就不说了。
Geekpark:现在国内所讲的自适应和真正的自适应有什么区别?
王枫:2015 年初我回国时,国内一些同行零零星星的在讲自适应学习,但当时很多理解都非常不准确。对教育来说,是根据学生实时的学习情况,来不断调整下一步学生要学哪个知识点,或者做什么试题,这叫 Adaptive。
但这里面水在什么地方?Adaptive 简单说来有基于规则和基于算法两种,比如说当一个学生做错了一元二次方程,系统根据提前埋好的点推荐几个一元一次方程的题目,再推几个因式分解题目,这就是基于规则。但不能说这是真正有用的自适应,因为 A 学生可能是一元二次方程不会,B 学生可能是一元一次方程不会,C 学生可能是因式分解不会,而 D 学生可能连小学的乘法快速运算都不会。按照埋点的方式,无法预先知道学生到底是哪个知识点不会。如果按照设定规则的方式,74 个知识点,就得需要设定 2 的 74 次方程的规则(每一道题都有会与不会两种情况)。
换句话说,所谓简单基于规则的自适应,对学习不但没有用,很有可能还会有害,因为学生需要浪费时间去重复学习他可能已经掌握的知识。真正有用的自适应一定是基于算法的,这就基于机器学习,基于 AI 了。
Geekpark:论答现在能做到的自适应是怎样的?
王枫:前面说的 74 个知识点,论答只需要用 8 道题就能检测 74 个知识点,有 66 个知识点是不用出题就可以判断学生的掌握情况。但可能还不止,因为一些知识点下面可能会有很多道题。
学生每做完一道题,下一道题在哪个知识点上给他出题,我们没有任何人知道。论答的系统就像一个黑匣子,但本质上就像一个名师一样。一个名师来测试整个中考代数,可能也只需要 5 至 8 道题。因为他有多年的教育经验来不停地判断每道题之间的关联性,他大脑中的判断是个非常复杂的过程。对于机器而言,每做完一道题系统都在不断更新,判断你在每一个知识点上面掌握的可能性。
Geekpark:如何判定这个黑匣子中的算法就是有效的?
王枫:首先可以通过直观感受,多做几套测试来看看效果,看到底是不是靠谱,我们机器得出来的判断和作为一个好老师的判断,或者你对自己理解的判断是否一致,这是第一点。比如在实数运算这一节,我全是乱点的答案,但蒙对了 3 个,可是系统对我的判定是掌握了 0 个知识点。有意思的是实数加法法则与运算率这个知识点,相关的两道题我都猜对了,这种概率已经是 25%×25% 了,系统应当完全可以判断我掌握了这个知识点,不过通过相关的算法,机器最后还是认定我没有掌握这个知识点。
从严谨的实证研究来说,我们完成了中国有关自适应学习第一个严谨的实证研究,研究结果发表在全球顶级的研究杂志《交互学习研究杂志》(Journal of Interactive Learning Research)2018 年第一期上面。在这个实验中,与一个主流学习系统相比,我们的学习效果显然更好,我们的学习效率是在它的 3-27 倍之间。
Geekpark:为什么论答能做到通过8道题测评74个知识点?这背后的开发流程是怎样的?
王枫:我从 2015 年初回国开始,就在开发这个系统。一直到今年 5 月份才觉得系统基本打磨成熟,开始输出。算法的研发团队是纽约那边做数据科学相关的高端人材。首席数据科学家马镇筠博士在那儿负责,他是浙大数学系本科,弗吉尼亚大学统计学博士,他负责开发我们的核心算法。
这件事本质上是一个庞大的系统工程,算法开发、知识图谱设计、以及到最后相匹配的练习题、讲义的生产等都是非常复杂的过程。拿 6-9 年级系统中的数学测试题来说,我们专业的题目研发团队通过对知识点的拆解原创开发了十几万道题。开发出题目后还需要用人工打标签,每一道题从开发到入库,中间有几十道工序,有很多个标签要打。只有这样算法引擎才知道,每个知识点后面有哪些题,每个题后面的属性、难度、区分度以及与学生做题之前的知识掌握程度等。入库后算法会不断根据学生的使用情况调整这些题目的属性。
前景
Geekpark:自适应系统能解决教育市场中的什么痛点?
王枫:像论答这样的自适应系统,可以从根本上解决优秀老师供给的问题。这也是整个教育产业最核心的价值。在中国,不管是培训机构还是公立学校,最缺是优秀老师。像新东方跟学而思这样 200 亿美金的大公司,加起来所占的市场份额也不到 5%。为什么?因为他们根本没有那么多优秀的老师。论答现在可以做到让一个没有任何教学经验的兼职大学生,只需要 3-6 小时在线微信群培训,再加上我们人工智能系统,就能达到一个优秀老师的教学水平。
Geekpark:论答为什么能解决优秀老师的供给问题?
王枫:因为一个名师的必杀技 70% 都能被我们的系统替代掉,我们已经完全可以去做课堂。一个好老师其实有两种职能是机器难替以代的,第一是看场子即是说保障课堂秩序,第二是和学生一起保持很强的互动交流,鼓励学生真正投入到学习中去,即是说能够一步一步地把一道题拆开,让学生去思考到底是哪里不会。不过,如果要实现提分的目的,我们的系统在很多方面其实已经可以达到一个优秀老师,甚至名师的教学水平:找到每一个学生的薄弱知识点并有针对性的进行教学,在最短的时间之内攻克每一个薄弱知识点。所以通过短暂的培训就能让普通老师成为名师。
Geekpark:都知道Knewton是这个领域的领先者,为什么Knewton在中国没先跑出来?
王枫:自适应学习引擎是最核心的,但光有引擎是不够的。Knewton 吃了亏,以前全部都做,后面只做引擎。但是光有引擎,没有相匹配的内容和系统,最终的结果就没法保证。除此以外,中国的学科体系和美国的也不一样,所以在美国适用的那些经验,到中国就搞不定了。
对我们来说,除了引擎外还有一个庞大的学习系统,包括教师、学生以及相应的备课系统,甚至包括相应在线直播平台,以及相匹配的课程内容。这里面是一个完整的人工智能学习系统,而且我们还是开放式平台,任何老师可以在里面添加任何形式的教学内容,任何机构、任何学校都可以,是真正开放式平台。
Geekpark:中国的教育场景有什么不同特点?
王枫:应试教育是 AI+教育,最能发挥价值的场景。而全球最大的应试教育市场在哪儿?就在中国。所以对于 AI+教育公司来说,中国是最合适的商业市场。
为什么 AI 最有用的应用场景是应试教育呢?简单来说,AI 要能够判断,需要量化,必须有数据。像人脸识别、表情也不是说没有用,但是对于机器而言,要能最大发挥价值,还要能够最大限度量化,而且必须要明确测量的目标。从应试教育来说,中国家长从初中开始,只有一个诉求——提分,考一个好的高中,然后考一个好的大学,通过自适应系统能够很好的实现家长的这些诉求,在这方面机器的确能够发挥巨大的价值。
Geekpark:现在的商业模式是怎样的?
王枫:B2B2C 的模式。我们 5 月份开始向 B 端学校,还有培训机构输出,现在已经有几十所学校使用了。我认为 3-5 年之内,论答的系统至少成为整个中国培训产业的标配,而且对中国绝大部分中小学来说,他们会发现论答系统,对他们学校的教学来说,也都是极其关键的。
(责任编辑 卧虫)
(扫描二维码详细了解 thinkplus 高效能方案)