讯飞星火认知大模型发布行业应用,半年后赶超 ChatGPT

摘要

共建人工智能「星火」生态。

星星之火,可以燎原。5 月 6 日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。

发布会现场,语音输入,实时互动,无论是文本生成、语言理解,还是知识问答、逻辑推理,亦或是数学能力等,星火大模型都表现出色。现场真机实测的互动提问,大模型的精彩回答,引发掌声不断。

刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现「智能涌现」。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超 ChatGPT。他进一步公布大模型年内三次升级时间点,10 月底将整体赶超 ChatGPT。后续科大讯飞还将联合开发者推动大模型应用落地,共建人工智能「星火」生态。

提出通用人工智能七大维度 481 项评测体系

赶超 GPT 要有科学的方法和体系

自去年 11 月 30 日 ChatGPT 发布以来,认知大模型技术阶跃持续进化,人工智能在全球引起了广泛关注,掀起了全新的热潮。在多个领域,认知智能都表现出了非常强大的能力。对于人工智能来说,认知大模型成为通用人工智能的「曙光」,它出现的历史意义不亚于 PC 或者互联网的诞生。

刘庆峰表示,从 ChatGPT 关注的 48 个主要任务方向和讯飞开放平台上 400 多万开发者团队的需求分析,通用人工智能应当具备七大维度能力,包括文本生成、语言理解,知识问答、逻辑推理、数学能力、代码能力、多模态能力等。

认知大模型的「智能涌现」也将带来解决人类刚需的全新机遇。比如,改变信息分发获取模式,革新内容生产模式,全自然交互完成任务,实现专家级的虚拟助手,颠覆传统手工编程方式以及成为科研工作的加速器等。「让未来每一个有创意的人,都能成为数字经济中的创业者。」刘庆峰说。

面向全新的人工智能时代机遇,科大讯飞已为认知大模型的「智能涌现」做好了源头核心技术的储备。

2011 年科大讯飞便承建了语音及语言信息处理国家工程实验室,「我们提出让机器像人一样能听会说,这一次认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。」刘庆峰说。

2014 年科大讯飞推出「讯飞超脑计划」,明确提出:让机器像人一样能理解会思考。2022 年,又升级为「讯飞超脑 2030 计划」,提出让懂知识、善学习、能进化的通用人工智能技术成为每个人未来发展的重要机会,让机器人走进家庭。

「在国家平台和讯飞超脑计划的支撑下,过去几年我们在认知智能领域取得了一系列全球领先的成果。」2017 年,科大讯飞承建认知智能国家重点实验室,也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了 96.3% 参加考试的医生,并且在 SQuAD 机器阅读理解中全球首次超过人类平均水平,刚刚过去的 2022 年在 OpenBookQA 科学知识推理中,单模型也超过人类平均水平。「可以说多年来,科大讯飞已在认知智能领域有了丰富的储备和积累。」

刘庆峰透露,在 2022 年 12 月 15 日,科大讯飞正式启动「1+N」认知大模型专项攻关,其中「1」就是指通用认知智能大模型,「N」就是大模型在教育、办公、汽车、人机交互等各个领域的落地。

作为人工智能「国家队」之一,刘庆峰表示:「我们要向 OpenAI 致敬和学习,同时也要快速追赶并努力超越,而这需要一套科学系统的评测体系。「科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系,并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖 7 大类 481 个细分任务类型。在科学的评测体系中,推动大模型的发展。

刘庆峰强调,「今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试。」

讯飞星火认知大模型三大能力已超 ChatGPT

现场语音输入流畅 多维实测燃爆全场

发布会现场,科大讯飞围绕讯飞星火认知大模型的七大核心能力,即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力,展开现场实测。大模型更是在文本生成、语言理解、数学能力上表现出「智慧」的火花,效果惊艳。

写邮件、做方案、讲故事,讯飞星火大模型到底有多会写?

「你为什么叫星火?」科大讯飞研究院院长刘聪直接语音输入,讯飞星火认知大模型不仅准确的进行了语音转文字,而且迅速给出了它的回答。

「今天是科大讯飞星火认知大模型的发布会,线下和线上观看发布会的朋友们一直以来对科大讯飞都非常关心和支持,非常感谢大家,请帮我写一篇欢迎词。」短短几秒钟,一篇要点俱全的欢迎词随机生成。

星火大模型编故事的能力也很出彩。「孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。」星火大模型随即脑洞大开,一段生动的故事就娓娓道来。「每一次重新生成,结果都是不一样的,这也是我们星火大模型的魅力所在。」刘庆峰表示。

此外,它还能写邮件、做方案、写新闻通稿等,它还能生成英文宣传,修改英语语法错误,展现作为 AI 助手的多才多艺。

刘庆峰表示,在长文本生成上,讯飞星火大模型在国内明显领先,并且在中文方面超过了 Chat GPT,并且在持续进步中。

中文理解十级测试,现场观众:讯飞星火满分!

在语言理解上,星火大模型的变现也很出彩。刘聪现场问到:

「俗话说男子汉大丈夫宁死不屈,但是俗话又说男子汉大丈夫要能屈能伸,请问这两句话怎么理解?」

「如果一个小伙子跟女朋友吵架了,他应该宁死不屈还是能屈能伸呢?」

大模型都很好的理解了特定的句子和场景含义,随着问题的变化,灵活调整自己的答案。精彩的回答也让现场观众报以热烈掌声。

这还不够,大模型现场还展示了「情感分析」能力,展现出跟人类共情的潜力。

「今天小明参加比赛获得了冠军,拿到奖杯后他默默地站了一分钟。今天我上课被老师批评了,走出教室后我默默地站了一分钟。请问上面这两个默默地站了一分钟分别表达了什么心情?」

刘庆峰表示,科大讯飞现在的语言能理解能力相比 ChatGPT 还略有差距,但已超越国内同类产品。

大模型聪明与否看数学,讯飞星火数学能力远超过国内外大模型

在数学能力中,讯飞星火大模型展现出「学霸」气质。除了常规计算、几何、情景应用等,刘聪现场也抛出了复杂的计算题:「花坛里有三种花,一共 88 朵,其中月季花的数量是菊花的 4 倍,牡丹花的数量是菊花的 5 倍少 2 朵,那么请问花坛里一共有多少朵牡丹花?」

星火大模型很快准确给出了答案,并给出了解题步骤。刘庆峰表示,数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先,也超过了 ChatGPT。

此外,刘聪还展示了大模型面向泛领域开放式知识问答,它具备很好的通识知识,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如,该能力也已超过 ChatGPT。此外,星火大模型也具备逻辑推理能力与代码能力,为了还将进一步升级多模态输入和表达能力,不断实现自身迭代进化。

刘庆峰表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易「张冠李戴」,史实、传统典籍等容易「编造情节」等,但这些问题在今年会有明显的改进。

同时他公布了年内大模型技术持续升级的三个关键里程碑节点:6 月 9 日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8 月 15 日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;10 月 24 日,将实现通用模型对标 ChatGPT,中文超越 ChatGPT 的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

赋能教育、办公、汽车、数字员工

讯飞星火认知大模型落地四大行业应用

讯飞星火认知大模型技术正逐渐为更多行业赋能。在本次发布会上,围绕星火认知大模型「1+N」架构中「N」个领域的内容,科大讯飞还发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。

「大模型+AI 学习机」,让 AI 像老师一样批改作文,像口语老师一样实景对话。在作文批改上,搭载认知大模型的科大讯飞 AI 学习机 T20 系列可实现中英文作文类人批改。相比于传统学习机只能针对字词标点纠错、识别句式修辞错误这些基础批改,讯飞 AI 学习机实现了围绕写作要求、分析全篇结构和文采的深度高阶批改。像老师一样层层批改点评,让作文批改更高效。它还可以实现写作思路启发,利用 AI 润色技术生成片段优化参考和写作建议提升,让孩子在启发中精准提升。在口语对话方面,讯飞 AI 学习机精通中英双语,不仅发音纯正、表达地道,孩子直接说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。陪伴式对话练习,让孩子更愿意开口说,告别哑巴英语,提升口语表达能力。

刘庆峰相信,这两项功能的升级将会促进语言学习再上一个全新的台阶,科大讯飞希望用「星火」点燃每一个孩子的想象力。

长篇大论不想看?口水稿成文太费力?讯飞智能办公本搭载大模型阅读效率提升 60%

「大模型+智能办公本」,根据手写要点自动生成会议纪要,助力办公效能进一步提升。面对口语稿阅读困难、纪要整理耗费精力、已有素材难成稿、长篇章难抓要点等痛点,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能。在会议纪要方面,将语音实时转写与墨水屏纸感书写相结合,并且可以对会议记录内容形成一份精简的会议纪要,有助于快速回溯会议内容。在语篇规整方面,可以去除语音转写文稿中的口语化词汇、过滤冗余词汇,对文本进行润色等,轻松将一篇语音转写文稿规整成书面化内容,阅读效率提升 50%。

AI写稿抢头条,记者采访后 30 秒生成新闻!讯飞听见会写到底多会写?

「大模型+讯飞听见」,一段录音、一键成稿,一分钟输出流畅会议文案。输入音频录音后,除了能够实现语音转文字外,讯飞听见通过 AI 分析文字内容,可以一键生成包括全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本,还可以根据原文件内容,进行 AI 对话并对原文内容进行提问追溯。此外还有讯飞智能录音笔、讯飞智能麦克风等办公产品的相关功能也在持续更新中,智慧办公将迈入全新阶段。

汽车语音市场占有率第一的科大讯飞有望推出搭载大模型的智能座舱

「大模型+智能座舱」,实现车内跨业务、跨场景人车自由交流。科大讯飞已为数千个车型提供业界领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互,累计服务用户已经超过 4610 万,在国内汽车智能语音应用市场保持占有率第一。这一次认知大模型技术会让车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通,让汽车驾驶更智能、更安全、更有乐趣。

科大讯飞首创新一代基于大模型的生成式 RPA,让数字员工更智能

「大模型+数字员工」,基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作。现场以公司招聘事项为例,输入指令后,系统即可自动按照事先设计的 RPA 脚本,操作计算机中的相应软件,实现业务流程的自动化操作并输出结果,还能进行数据分析,大幅减轻一线工作人员的压力。另外,科大讯飞推出的虚拟人智能交互机,消费者通过对话直接说出需求,数字员工即可为消费者推荐相关产品,从咨询到购买的全过程能实现 24 小时不打烊的服务,首批 10 家讯飞官方直营店将率先上线。

除了上述领域外,讯飞星火认知大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业,满足更多专业领域的需求,向更广阔的产业领域延伸。

四、开放合作 共建人工智能「星火」生态

与华为强强联合,让大模型建立在安全可控的国产算力平台之上

「科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。」刘庆峰说。

讯飞开放平台新增星火认知大模型,将赋能开发者打造更具价值的 AI 应用。目前,讯飞开放平台已经开放了 560 项 AI 能力,并聚集了超过 500 万生态合作伙伴。在新时代的机遇下,科大讯飞将通过能力开放、插件开放、行业共创,与千行百业共建生态。

刘庆峰宣布,首批来自 36 个行业的 3000 余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型「星火」生态。与生态伙伴一起,燎原新一轮产业变革。

为全面深度赋能开放平台合作伙伴,科大讯飞启动「2023 科大讯飞 AI 星火营生态计划」,面向千行百业的开发者,提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源,推动大模型的应用落地。

「今天在我们发布会的同时,苏州、武汉、青岛、太原四座城市将会率先启动星火营计划,我们期待与开发者一起用星火燎原产业生态。」刘庆峰说。

据了解,此次发布会还设有 7 个分论坛,从办公、座舱、医疗、金融,到面向儿童的阿尔法蛋,以及到智慧营销和算力平台方面的共 7 个专题。刘庆峰介绍,算力方面科大讯飞将联手华为,「使我们未来认知大模型的持续进化,要在我们自主可控的平台上,不断地提升。」

面向未来,科大讯飞将秉持源头创新、自主可控、信息安全、人文伦理的原则,在保护伦理和安全的前提下健康发展。

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。