讯飞星火迎来首次大更新,数学能力大幅提升,带来1对1口语陪练功能

新闻资讯   2023-06-15 23:29   64   0  
教育部:调整部分直属事业单位机构


导语

短短半年时间,AI 头部玩家们已纷纷推出自己的大模型产品,并迅速展开竞争。业界注的焦点也从“谁能开发出中国版ChatGPT”到“谁能真正对标 ChatGPT”。6 月 9 日,科大讯飞星火大模型迎来发布后的首次大更新,距离其设定的 10 月 24 日与 ChatGPT 对标的目标又近了一步。


                                             

1


 比“炫技”更重要的是变现



在 5 月 6 日的首场发布会后,科大讯飞就星火大模型今年后续的规划给出了三步走的答案:


6 月 9 日:突破开放式问答(即实时问答),通过类搜索插件获取知识,以更人性化的方式呈现。此外,升级多轮对话能力,数学能力还会再上一个新的台阶。


8 月 15 日:升级代码能力,让开发者、合作伙伴高效方便使用讯飞内部已经在使用代码生成能力。同时,多模态交互能力正式开放给客户。


10 月 24 日(科大讯飞全球开发者节):通过科学、系统的评测方法在通用认知大模型能力上能够对标 ChatGPT,在中文上超越,在英文上达到跟它相当的水平。


首场发布会后,科大讯飞T20、T20Pro成为星火大模型率先落地的产品。在产品介绍页面,科大讯飞标注了两款学习机的三大升级功能:中英作文类人批改、数学类人互动辅学、英语类人口语对话。


在此次发布会上,星火大模型的多轮对话和数学能力得到了升级,此外,模型的“文本生成”“语言理解”“逻辑推理能力”都得到了持续提升。数据显示,星火认知大模型V1.5文本生成能力提升7%,语言理解能力提升8%,知识问答能力提升24%,逻辑推理能力提升10%,数字能力提升9%,代码能力提升8%。


在发布会展示的数学题测试中,科大讯飞选择了数学高考试卷前10道填空题,让市面上目前发布的主流AI 大模型进行回答。测试结果显示,这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题,正确率达到50%,成为大模型数学能力排名第一。ChatGPT答对了4题,正确率为40%,位列其后。


此外,在语文主观作答中,ChatGPT的高考作文得分最高,讯飞星火得分略低,但处于相同水平。而在英语考试中,讯飞星火和ChatGPT明显领先于其他模型。


值得关注的是,此次发布会上,科大讯飞还推出了星火语伴APP,这是科大讯飞星火认知大模型在教育领域的进一步落地。



根据科大讯飞的介绍,星火语伴可以实现1对1的口语陪练和随身翻译,帮助用户提高外语水平。星火语伴还可生成虚拟人,与使用者实时对话,让用户体验更加真实的语言环境。


此外,借助新发布的星火助手中心,在特定场景之下,用户可以与星火大模型实现更高效的交互。星火大模型能够根据用户的需求,提供更加个性化和智能化的服务。


科大讯飞称,星火大模型的落地,有效提升了其产品的销售表现。数据显示,科大讯飞AI学习机系列在 6 月第一周激活同比增长 214%;智能办公本系列同比增长 176%;听见网站新增用户同比增长 205%。



此前,科大讯飞就在第一场发布会中表示,讯飞星火将在教育、办公、汽车、数字员工四个领域寻找应用方向,与讯飞旗下教育产品AI学习机以及办公产品讯飞听见、讯飞智慧屏相结合,寻找落地场景。但能否真的依靠这些硬件和APP实现长期稳定的收入,还有待于未来进一步的观察。


                                             

2


 大模型,科大讯飞必须打赢的一仗



在星火大模型发布的这一个月里,科大讯飞过得并不轻松。


首场发布会后不久,就有网友提出,讯飞星火大模型在部分问答中会出现“我是由OpenAI 开发的”等内容,由此引发了“讯飞星火大模型套壳ChatGPT”的舆论。


5月11日,科大讯飞在最新披露的投资者关系活动记录表中表示,星火大模型“套壳ChatGPT”既不符合事实,也不符合逻辑。如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快,更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。


5月24日,科大讯飞午后股价跳水,盘中跌幅一度超过9%。当日收盘报56.57元/股,收跌4.26%。而股价跳水的起因,源于一篇由文心一言生成的小作文。文章称,“讯飞可能通过其语音识别服务非法获取了用户的个人信息,并将其用于研究”“严重侵犯了用户的隐私权,引发了公众的强烈不满和抵制”,由此引发了科大讯飞和百度之间的口水战。


(图源来自联网)


科大讯飞表示,使用大模型编造虚假信息属于违法行为,将受到法律制裁。当前已有刑事案例。“对于恶意抹黑、捏造虚假信息,损害我司名誉权的机构或个人,公司会借助法律武器保护公司和投资者利益。”


百度的负责人则表示,“要把精力放在正事儿上,请友商解决好自己的问题,别动不动就碰瓷别人。”


(图源来自网络)


争吵背后,一场 AI 大模型的军备竞赛已然开启。


从技术层面上来看,百度和科大讯飞都是都在 AI 赛道进行了长期投入,拥有强大的技术实力和研发团队,也都对 AI 大模型寄予厚望。


不过,在AI的基础层——算力和数据上来看,相比拥有海量中文搜索数据和昆仑芯支持的百度,科大讯飞并不具备绝对的优势。面对投资者的疑问,科大讯飞在前不久表示,现在星火大模型和国内主流芯片厂商都有相关合作,目前讯飞的算力能够满足大模型的训练。


可以预见的是,在AI大模型持续“烧钱”的当下,商业化变现将是众多AI企业在下一阶段面对的难题,这对于刚刚终结10年业绩增长神话,急需找到新的增长点的科大讯飞尤甚。



- END -



更多精彩内容



鲸推荐

●  都说 AI 在颠覆教育,教育工作者们怎么看?

  量子之歌公布2023财年Q3财报,营收增长超预期

  高途交出转型后最好单季业绩,将大力投入AI+教育

●  用户70%上以是学习场景是练习场景,小猿学练机如何顺势而为?

  网易有道2023Q1,词典类会员月收入同比增长近200%

  知乎2023一季度报:职业教育营收首破1 亿元


文章引用微信公众号"鲸媒体",如有侵权,请联系管理员删除!

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。