讯飞星火迎来首次大更新，数学能力大幅提升，带来1对1口语陪练功能

2023-06-15 23:29 131 0

导语

短短半年时间，AI 头部玩家们已纷纷推出自己的大模型产品，并迅速展开竞争。业界关注的焦点也从“谁能开发出中国版ChatGPT”到“谁能真正对标 ChatGPT”。6 月 9 日，科大讯飞星火大模型迎来发布后的首次大更新，距离其设定的“ 10 月 24 日与 ChatGPT 对标”的目标又近了一步。

比“炫技”更重要的是变现

在 5 月 6 日的首场发布会后，科大讯飞就星火大模型今年后续的规划给出了三步走的答案：

6 月 9 日：突破开放式问答（即实时问答），通过类搜索插件获取知识，以更人性化的方式呈现。此外，升级多轮对话能力，数学能力还会再上一个新的台阶。

8 月 15 日：升级代码能力，让开发者、合作伙伴高效方便使用讯飞内部已经在使用代码生成能力。同时，多模态交互能力正式开放给客户。

10 月 24 日（科大讯飞全球开发者节）：通过科学、系统的评测方法在通用认知大模型能力上能够对标 ChatGPT，在中文上超越，在英文上达到跟它相当的水平。

首场发布会后，科大讯飞T20、T20Pro成为星火大模型率先落地的产品。在产品介绍页面，科大讯飞标注了两款学习机的三大升级功能：中英作文类人批改、数学类人互动辅学、英语类人口语对话。

在此次发布会上，星火大模型的多轮对话和数学能力得到了升级，此外，模型的“文本生成”“语言理解”“逻辑推理能力”都得到了持续提升。数据显示，星火认知大模型V1.5文本生成能力提升7%，语言理解能力提升8%，知识问答能力提升24%，逻辑推理能力提升10%，数字能力提升9%，代码能力提升8%。

在发布会展示的数学题测试中，科大讯飞选择了数学高考试卷前10道填空题，让市面上目前发布的主流AI 大模型进行回答。测试结果显示，这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题，正确率达到50%，成为大模型数学能力排名第一。ChatGPT答对了4题，正确率为40%，位列其后。

此外，在语文主观作答中，ChatGPT的高考作文得分最高，讯飞星火得分略低，但处于相同水平。而在英语考试中，讯飞星火和ChatGPT明显领先于其他模型。

值得关注的是，此次发布会上，科大讯飞还推出了星火语伴APP，这是科大讯飞星火认知大模型在教育领域的进一步落地。

根据科大讯飞的介绍，星火语伴可以实现1对1的口语陪练和随身翻译，帮助用户提高外语水平。星火语伴还可生成虚拟人，与使用者实时对话，让用户体验更加真实的语言环境。

此外，借助新发布的星火助手中心，在特定场景之下，用户可以与星火大模型实现更高效的交互。星火大模型能够根据用户的需求，提供更加个性化和智能化的服务。

科大讯飞称，星火大模型的落地，有效提升了其产品的销售表现。数据显示，科大讯飞AI学习机系列在 6 月第一周激活同比增长 214%；智能办公本系列同比增长 176%；听见网站新增用户同比增长 205%。

此前，科大讯飞就在第一场发布会中表示，讯飞星火将在教育、办公、汽车、数字员工四个领域寻找应用方向，与讯飞旗下教育产品AI学习机以及办公产品讯飞听见、讯飞智慧屏相结合，寻找落地场景。但能否真的依靠这些硬件和APP实现长期稳定的收入，还有待于未来进一步的观察。

大模型，科大讯飞必须打赢的一仗

在星火大模型发布的这一个月里，科大讯飞过得并不轻松。

首场发布会后不久，就有网友提出，讯飞星火大模型在部分问答中会出现“我是由OpenAI 开发的”等内容，由此引发了“讯飞星火大模型套壳ChatGPT”的舆论。

5月11日，科大讯飞在最新披露的投资者关系活动记录表中表示，星火大模型“套壳ChatGPT”既不符合事实，也不符合逻辑。如果是套壳 ChatGPT，就不可能出现讯飞星火大模型的响应速度比ChatGPT还快，更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。

5月24日，科大讯飞午后股价跳水，盘中跌幅一度超过9%。当日收盘报56.57元/股，收跌4.26%。而股价跳水的起因，源于一篇由文心一言生成的小作文。文章称，“讯飞可能通过其语音识别服务非法获取了用户的个人信息，并将其用于研究”“严重侵犯了用户的隐私权，引发了公众的强烈不满和抵制”，由此引发了科大讯飞和百度之间的口水战。