7 月 26 日,教育科技公司网易有道在“powered by 子曰”教育大模型应用成果发布会上,推出了国内首个教育领域垂直大模型“子曰”,并发布了基于“子曰”大模型研发的六大创新应用——“LLM 翻译”、“虚拟人口语教练”、“AI 作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
网易有道 CEO 周枫表示:“一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择以及细节的打磨。通过软件、硬件、AI 技术的结合,做出精品是我们现在做的事”。
大模型的出现能给教育带来的最大机会是什么?
周枫在发布会上表示:“我认为,是助力因材施教”。据介绍,之所以叫‘子曰’,是因为孔子是我国的教育先贤,又是因材施教教育理念的奠基者。‘夫子教人,各因其材’,我们希望子曰大模型可以朝着这样的教育理想去做。”
周枫向在场观众分享了大模型“因材施教”的三大优势。首先,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力。通过连接多模态知识库、跨学科整合知识内容,大模型能随时满足学生的动态需求,帮助孩子培养更综合的能力。
相比于通用大模型,“子曰”大模型从一开始就定位为是一个“场景为先”的教育垂类大模型。它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力。基于此,有道研发团队在“子曰”大模型的基础上,为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。
“我们的目标很明确,就是以实际的教育场景驱动,用技术创新助力教育创新。”周枫表示,希望技术和产品的深度融合,可以根据学⽣不同能⼒和需求,提供因人而异的个性化教学。
在发布会上,网易有道展示了“子曰”大模型在多个场景中的应用成果,包括“LLM 翻译”、“虚拟人口语教练”、“AI 作文指导”、“语法精讲”、“AI Box”以及“文档问答”。
其中,最为瞩目的是大模型时代的英语口语练习神器——虚拟人口语教练 Hi Echo。发布会现场,有道词典业务负责人与 Echo 进行了多组随机对话。Echo 能迅速理解场景和上下文,并给出迅速反馈,发音也很地道,重音、弱读、升降调等细节处理得非常到位。在对话过程中,Echo 能够像真人老师一样循循善诱,启发式进行对话引导,还能进行实时反馈。对话结束后,Echo 会从发音、语法等维度给予建议和润色,能有效解决长期困扰英语口语学习者无话可说、不知从何说起、害怕说错等问题。
“中国人在说英语时往往面临开口难、不敢说、不知道该从何说起的困境,其中的关键就在于缺乏语言环境。” 有道词典业务负责人表示,Echo 恰恰能为用户带来这种真正贴合实际的“语境”,帮助他们更好地练习英语口语。
此外,“子曰”大模型还覆盖了多种学习场景。例如,在写英语作业时,学生们不仅有解决具体问题的需求,还需要学会举一反三。“子曰”大模型赋能的“语法精讲”功能可以为学生提供针对性的解题思路和方法,还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。
“AI 作文指导”应用不仅具备“作文批改”功能,还具备“作文指导”功能。据介绍,该应用旨在解决“学生不会写”和“老师没时间改”的问题。针对学生在写作、前、中后过程中面临的题目主旨难确定、写作素材匮乏等难题,该应用都能够给予指导,帮助学生“下笔如有神”。批改环节中,AI 作文指导还会从表达、结构、内容深度、情感丰富度四大维度全面提供改进建议。
会上,周枫多次强调“场景拉动”的重要性。他表示,“子曰”大模型在教育行业的应用,不仅可以帮助学生更好地学习,也可以帮助老师更好地教学,借此实现因材施教的教育理想。
通过深入调研和分析用户在不同场景下的需求,网易有道成功利用大模型的力量,在教育领域打造了诸如虚拟人口语教练、语法精讲、AI 写作指导等丰富的解决方案。这一策略不仅体现了网易有道对教育场景的深入理解,还为用户提供了更加个性化和高效的学习体验。
早在 2008 年,有道就推出自主研发的国内首家统计机器翻译线上引擎。经过 15 年技术迭代,有道神经网络翻译(NMT)已经进化成行业领先的“最强大脑”。根据 QUESTMOBILE 最新数据,到目前有道词典月活用户已经超过 1 亿,是国内词典翻译市场的第一名。
从 2016 年开始,有道协同构建 AI 基础能力,同步组建语言、视觉、声音等团队,目前积累了有道神经网络翻译(NMT)、计算机视觉、智能语音 AI 技术、高性能计算 (HPC)四大底层技术能力。
自 2017 年,有道就与主流技术 Transformer“双向奔赴”,将 AI 能力统一在大模型之下,并尤其重视在端侧的落地应用。有道词典笔 2 代 2019 年首次搭载离线 Transformer NMT。2022 年,有道词典笔 P5 中搭载了自研的离线 ASR,也已升级为 Transformer 技术。技术的持续赋能奠定了有道学习硬件在行业内的领先地位。
底层技术不断革新的同时,有道还在不断研发细分场景下的“黑科技”。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等多项技术能力的突破。例如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让 Echo 在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者,不仅能判断用户说话的起始,还能让用户随时打断,智能触发后续流程。
在 AI 虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,实时驱动虚拟人的面部表情和语音同步的口型变化,使虚拟人能够贴近真人,以更加自然和生动的方式与用户一对一交互,从而显著提升对话的真实感和用户体验。
点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!
Web 开放性或遭重大打击!谷歌四名工程师推出 WEI 方案,可让广告拦截变成历史
文章引用微信公众号"InfoQ",如有侵权,请联系管理员删除!