
2022 年底 ChatGPT 的横空出世,毫无疑问是人类 AI 发展史上的划时代事件。相比 2012 年 AlexNet 横扫 ImageNet 掀起深度学习浪潮,2016 年 AlphaGo 击败李世石掀起全球人工智能热潮,ChatGPT 似乎一夜之间跨过了遥不可及的「图灵测试」门槛,开启了 AGI 的新范式,也宣告 AI 行业正式进入 2.0 时代。
2022 年底 ChatGPT 的横空出世,毫无疑问是人类 AI 发展史上的划时代事件。相比 2012 年 AlexNet 横扫 ImageNet 掀起深度学习浪潮,2016 年 AlphaGo 击败李世石掀起全球人工智能热潮,ChatGPT 似乎一夜之间跨过了遥不可及的「图灵测试」门槛,开启了 AGI 的新范式,也宣告 AI 行业正式进入 2.0 时代。
站在新的时代浪潮之上,云知声凭借十余年在 AI 算法和工程能力、数据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,紧接着又实现了大模型的规模化商业落地,成为业内为数不多的大模型技术创新和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏上通往 AGI 时代的新征程。
具体而言,云知声作为算法和工程能力深厚的 AI 新锐企业,凭借过去十余年在深度学习、BERT 预训练大模型、Atlas 基础架构、海量数据及产业应用等全方位的深厚积累,于 2023 年 5 月 24 日正式发布山海大模型(UniGPT),成为国内首批实现 GPT 大模型技术升级的团队。
目前,最新版本的山海大模型通用大模型能力已超越 GPT3.5,接近 GPT-4 的 90% 水平,医疗行业大模型领先于 GPT-4 和谷歌的 Med-PaLM2,实现了云知声年初的 AGI 升级愿景:通用能力世界一流,专业能力世界第一。
山海启航,文理兼修
以 ChatGPT 为代表的大模型技术范式升级,不同于以往单纯的算法升级,也并非简单的「大力出奇迹」,而是对一家 AI 公司算法功底和工程实力的综合考验,包括前沿机器学习算法和海量优质数据的深厚积累,以及大规模机器学习的算力储备和工程优化能力。
云知声从 2012 年起,不断跟进 CNN、LSTM、Transformer、BERT、GPT 等深度学习前沿算法,持续积累海量优质的语音和文本数据,并在 2016 年开始构建 Atlas 大规模机器学习平台,能高效调度上千块 GPU 完成大规模机器学习任务,为生成式大模型训练奠定了坚实基础。在 2022 年底决心打造山海大模型(UniGPT)之后,云知声迅速完成高性能 GPU 算力的及时扩充,并实现千亿参数大模型的多机多卡分割,以及数据、模型及流水线的并行计算优化,将大模型预训练效率(单卡利用率占理论峰值的比例)提升到 60%,显著处于行业领先水平(行业知名公司是 50% 水平)。
在海量数据、前沿算法及工程能力加持下,山海大模型不仅通用能力上跻身行业前列,在多项全球通用任务上表现优异,还在医疗垂直领域的专业评测表现中实现了对 GPT-4 和 Med-PaLM2 的超越,标志着山海正式起航。
通用模型能力持续演进,跻身行业前列
2023 年 7 月和 8 月,山海百亿及千亿级大模型在 C-Eval 全球大模型综合性考试评测中分别取得 60.3 分和 70.0 分的优异成绩,百亿级模型跻身行业前列,千亿级模型通用能力入围三甲,充分印证了山海大模型在通用基础能力上达到业界第一梯队水准。
中文大模型对齐评测集 (AlignBench) 是一个多维度细致评测模型和人类意图对齐水平的评测基准,最新版本的山海大模型在 AlignBench 上得分为 6.55 分,根据公开榜单 (https://llmbench.ai/align/data),这是国内最接近 GPT4 水平的大模型。其中中文理解能力已经超过 GPT-4,中文语言、文本写作、综合问答和专业能力都在 GPT-4 水平的 90% 以上。
医疗增强大模型能力遥遥领先行业水平
2023 年 6 月,山海大模型医疗专业能力获得新突破,在 MedQA 任务上超过了 Google MedPaLM2,达到了 87.1% 的优异成绩。此外,在临床执业医师资格考试中,山海大模型的分数提升到了 523 分(满分 600 分),这一成绩超越了 99% 的考生水平。
2023 年 8 月,云知声基于山海大模型孵化的 UNIGPT-MED 模型在 CCKS 2023 PromptCBLUE 医疗大模型评测(通用赛道)中夺得第一名的好成绩,大模型医疗能力再获业界认可。
智慧医疗是典型的严肃场景、知识密集和高专业度应用领域,云知声凭借智慧医疗领域多年的行业数据、知识和应用经验积累,打造了世界领先的医疗增强大模型,在性能上不但远超 GPT-4 通用大模型,还胜过 Google 数千亿参数的 MedPaLM2 医疗领域大模型,为智慧医疗应用方案升级奠定坚实基础。
深入场景,提升效果,拓展边界
山海大模型全面的通用能力以及在医疗领域的强大表现,为云知声打造「U+X」实战应用,把大模型技术落地到诸多复杂的应用与场景提供了有力技术支撑。结合多年服务龙头企业客户累计的领域知识和行业落地经验,云知声面向智慧物联和智慧医疗等行业升级,提供更具竞争力的 AI 产品及解决方案,成为国内率先将大模型技术落地于行业应用的第一梯队企业。主要应用包括:门诊病历生成、智慧政务服务、车载/轨交人机交互、智能口语学习、蓝藻 AIGC 平台等。山海大模型不但让人机交互等实现质的飞跃,更是让门诊病历生成等全新应用成为现实,极大拓展了 AI 2.0 的应用边界。
2023 年 9 月,云知声基于山海大模型打造的门诊病历生成系统落地北京友谊医院,通过一键生成门诊病历,有效提升病历撰写效率与质量,成为国内首批大模型技术在严肃医疗场景下的商业化落地案例。
2023 年 10 月,云知声携手深圳市龙华数据有限公司,以山海大模型为底座,率先开发出深圳首个政务大模型「龙知政」,颠覆传统线上机器问答,实现了信息服务由被动式的人工查找向主动、双向、实时的智能全程引导转变,赋能提升政府治理水平。
2023 年 10 月,云知声山海大模型「入驻」南宁火车东站,打造更具人性化的智能客服,助力实现换乘节点无缝高效换乘,为乘客带来更快捷、更便利的出行体验,相关案例也于近期被央视《焦点访谈》栏目报道。
2023 年 10 月,云知声携手吉利旗下新能源品牌睿蓝,基于山海大模型打造睿蓝 AI 大模型,携手打造情感型虚拟助手,实现深度理解用户需求,解锁全车全场景情感化智能交互体验。
2023 年 12 月,基于山海大模型打造的英语学伴 Utalk 正式上线,围绕读写听说进行全方位学习训练,致力满足用户多场景英语学习需求。目前,Utalk 用户量已超过 10 万。
2024 年 1 月,基于山海大模型打造的 AIGC 内容创作平台蓝藻 AI 开启公测,可为创作者提供 AI 声音克隆、AI 文字配音、AI 文案创作服务,助力内容生产更快、更好、更具个性化。
山海相逢,屡获行业权威认可
清风拂明月,山海有相逢。2023 年,凭借山海大模型在技术创新、场景落地、产品适配等方面的出色表现,云知声不断获得客户、资本、媒体及政府的广泛认可和赞誉,再次证明了山海大模型的领先性和竞争力。
2023 年 6 月,基于山海大模型打造的门诊病历生成系统入选北京市首批 10 个人工智能行业大模型应用案例。
2023 年 7 月,云知声凭借山海大模型入选「北京市通用人工智能产业创新伙伴计划」第二批成员「模型伙伴」;同时,基于山海大模型打造的门诊病历生成系统入选 2023 北京人工智能行业赋能典型案例。
2023 年 8 月,凭借在大模型领域的持续深耕与拓展,云知声成功入选「2023 年中国 AIGC 产业图谱」。
2023 年 10 月,山海大模型荣获北京算法交易服务中心算法模型认证证书授牌,云知声成为北京算法交易服务中心首批认证企业。
2023 年 11 月,基于山海大模型打造的门诊病历生成系统入选《北京市人工智能行业大模型创新应用白皮书(2023 年)》典型案例。
2023 年 12 月,人民网科技公司发起成立「大模型责任联盟」,云知声成为「大模型责任联盟」首批成员单位。
2023 年 12 月,山海大模型正式通过《生成式人工智能服务管理暂行办法》大模型上线备案。
2024 年 1 月,山海大模型通过与华为 Atlas 800 训练服务器、华为 AI 框架昇思 MindSpore 的相互兼容性测试,正式获得 HUAWEI COMPATIBLE 证书及认证徽标的使用权。
2023 年 11 月,凭借山海大模型杰出的商业化应用价值,云知声入选甲子光年「2023 中国 AI 大模型领域最具商业潜力榜」。
2023 年 12 月,基于在大模型领域的创新实践,云知声入选投资家网·2023 中国价值企业榜「2023 年度人工智能领域创新企业 TOP30」榜单。
山海启航,加速构建互联直觉的世界
过去十年,是云知声「奔赴山海」的十年——以十年的技术及产业化应用积累,为山海大模型打造奠定坚实基础;未来十年,是云知声以「山海启航」的十年,以山海大模型为起点,开启 AGI 的新征程——以通用智能,创造互联、直觉的世界。
在云知大脑(UniBrain)的核心山海大模型成功实现升级的同时,其多模态感知、生成与知识图谱等全栈 AI 技术组件,也在持续演进,保持行业领先优势:
语音识别 (ASR) 方面,云知声于 2023 年某国际芯片巨头的技术 POC(原型验证)评测中,在安静环境与噪音环境下的 WER 测评指标均低于参评的全球 3 家顶尖科技公司竞品,取得第一名的优异成绩,再次用实力证明了其在业界的技术领先性,并有望于 2024 年在全球大规模推广应用。
指令识别 (KWS) 方面,云知声 KWS 自由说摆脱了固定命令词的限制,让用户可以更自由地表达自己的需求和意图,目前已在 TCL 空调等产品中成功落地应用,为用户带来了更智能化、便利化的使用体验,基于此技术的语音芯片出货量同比增长超过 100%。
声纹识别 (VPR) 方面,云知声声纹识别技术在 VoxSRC 2023 声纹领域权威国际评测中取得 Track1(固定训练集说话人确认)第一名、Track2(开放训练集说话人确认)第二名的优异成绩,充分印证其算法先进性。
辅助创作 (AIGC) 方面,云知声 TTS、2D 数字人、3D 渲染、文生图等多模态生成技术也在持续拓展,为技术与场景的更好融合提供了更多可能。
每次技术升级,都标志着云知声在以 AGI 赋能百业道路上的重大进步。步入 2024 年,云知声将继续秉承以人工智能赋能千行百业的初心,不断加码技术创新,持续拓展人工智能技术应用边界,与各行各业合作伙伴携手推动新质生产力发展。让我们期待并共同见证 AGI 技术与产业的下一个飞跃!
来源:互联网