有道「子曰」教育大模型发布,虚拟人口语教练等六大应用成果正式落地

摘要

场景为先,国内首个教育大模型「子曰」

7 月 26 日,教育科技公司网易有道(NYSE: DAO)举办了「powered by 子曰」教育大模型应用成果发布会。会上重磅推出了国内首个教育领域垂直大模型「子曰」,并发布了基于「子曰」大模型研发的六大创新应用——「LLM 翻译」、「虚拟人口语教练」、「AI 作文指导」、「语法精讲」、「AIBox」以及「文档问答」。

「一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。通过软件、硬件、AI 技术的结合,做出精品是我们现在做的事」。发布会现场,网易有道 CEO 周枫多次强调「场景拉动」的重要性。他表示,「子曰」大模型在教育行业的应用,不仅可以帮助学生更好地学习,也可以帮助老师更好地教学,借此实现因材施教的教育理想。

国内首个教育大模型「子曰」 :引领教育个性化革命

作为国内领先的教育科技公司,网易有道深刻地认识到 AI 大模型正在为各行各业带来新的可能,并将颠覆性地改变教育的面貌。

大模型的出现能给教育带来的最大机会是什么?

周枫在发布会上表示:「我认为,是助力因材施教」。据介绍,之所以叫『子曰』,是因为孔子是我国的教育先贤,又是因材施教教育理念的奠基者。『夫子教人,各因其材』,我们希望子曰大模型可以朝着这样的教育理想去做。」

周枫向在场观众分享了大模型「因材施教」的三大优势。首先,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。

相比于通用大模型,「子曰」大模型从一开始就定位为是一个「场景为先」的教育垂类大模型。它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。基于此,有道研发团队在「子曰」大模型的基础上,为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。

「我们的目标很明确,就是以实际的教育场景驱动,用技术创新助力教育创新。」周枫表示,希望技术和产品的深度融合,可以根据学⽣不同能⼒和需求,提供因人而异的个性化教学。

六大创新成果发布,虚拟人口语教练惊艳现场

在发布会上,网易有道展示了「子曰」大模型在多个场景中的应用成果,覆盖口语训练、作文批改、习题答疑等六大教育的细分领域,充分展现了「子曰」大模型在自然语言处理领域的技术实力和教育领域的广泛应用前景。

最为瞩目的便是大模型时代的英语口语练习神器——虚拟人口语教练 Hi Echo。

发布会现场,有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文,并给出迅速反馈。她的面部表情和口型生动而自然,发音也非常地道,重音、弱读、升降调等细节处理得非常到位,现场观众纷纷赞叹。

在对话过程中,Echo 能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo 会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。

「中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境,其中的关键就在于缺乏语言环境。」有道词典业务负责人表示,Echo 恰恰能为用户带来这种真正贴合实际的「语境」,帮助他们更好地练习英语口语。

场景驱动、技术赋能,有道不仅关注用户在英语学习中「不敢开口说英语」的痛点,还覆盖了多种学习场景,借助「子曰」大模型的支持为用户提供多种高效学习方案。

例如,在写英语作业时,学生们不仅有解决具体问题的需求,还需要学会举一反三。「子曰」大模型赋能的「语法精讲」功能可以为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。

此外,有道在发布会上推出的「AI 作文指导」应用不仅具备「作文批改」功能,还具备「作文指导」功能。据介绍,该应用旨在解决「学生不会写」和「老师没时间改」的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生「下笔如有神」。批改环节中,AI 作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。

场景拉动,「AI+教育」技术沉淀与创新

不难发现,网易有道在策略上的关键词是「场景拉动」——依托在智能学习领域的深耕,积累了很多教育领域的业务数据和理解。通过深入调研和分析用户在不同场景下的需求,网易有道成功利用大模型的力量,在教育领域打造了诸如虚拟人口语教练、语法精讲、AI 写作指导等丰富的解决方案。这一策略不仅体现了网易有道对教育场景的深入理解,还为用户提供了更加个性化和高效的学习体验。

为什么有道能做成教育行业首个垂直大模型,成为国内率先将 AIGC 技术落地到教育场景内的企业?高光的背后,是多年来的技术积累与产品布局。

早在 2008 年,有道就推出自主研发的国内首家统计机器翻译线上引擎。经过 15 年技术迭代,有道神经网络翻译(NMT)已经进化成行业领先的「最强大脑」。根据 QUESTMOBILE 最新数据,到目前有道词典月活用户已经超过 1 亿,是国内词典翻译市场的第一名。

从 2016 年开始,有道协同构建 AI 基础能力,同步组建语言、视觉、声音等团队,目前积累了有道神经网络翻译(NMT)、计算机视觉、智能语音 AI 技术、高性能计算 (HPC)四大底层技术能力。

自 2017 年,有道就与主流技术 Transformer「双向奔赴」,将 AI 能力统一在大模型之下,并尤其重视在端侧的落地应用。有道词典笔 2 代 2019 年首次搭载离线 Transformer NMT。2022 年,有道词典笔 P5 中搭载了自研的离线 ASR,也已升级为 Transformer 技术。技术的持续赋能奠定了有道学习硬件在行业内的领先地位。

底层技术不断革新的同时,有道还在不断研发细分场景下的「黑科技」。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等多项技术能力的突破。

例如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让 Echo 在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者,不仅能判断用户说话的起始,还能让用户随时打断,智能触发后续流程。

在 AI 虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,实时驱动虚拟人的面部表情和语音同步的口型变化,使虚拟人能够贴近真人,以更加自然和生动的方式与用户一对一交互,从而显著提升对话的真实感和用户体验。

在当下大模型浪潮中,网易有道凭借其对教育场景的深入理解和对商业化的理性思考,为行业树立了垂直大模型的典范。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。