12 月 29 日,百度开发者大会期间,小度智能生活分论坛上,百度正式发布了全新的小度核心人机交互操作系统——小度助手(DuerOS)7.0 版本。
12 月 29 日,百度开发者大会期间,小度智能生活分论坛上,百度正式发布了全新的小度核心人机交互操作系统——小度助手(DuerOS)7.0 版本。新版本的小度助手可以赋予设备多模态的感知和理解能力,并且通过许多先进技术的应用,进一步提升 AI 人机交互体验。
简单的说,升级最新版本之后,搭载小度 AI 的设备会变得更加智能。
不过,令外界感兴趣的不仅是对设备性能的提升。小度助手升级的背后透露出更多的行业意义也更值得人们关注,事实上,发布会背后似乎传递出这样一个信号:在消费端,小度 AI 正在开启全新的 AI 深度交互时代。
多模态感知+理解能力赋能终端,AI 交互进入「环绕智能」时代
AI 技术大规模的落地 C 端需有两个必经阶段,一个是规模化落地,另一个则是技术上的持续创新。
对于前者,小度 AI 的策略是破圈。
事实上,小度 AI 破圈的目的在于形成一个超大规模的交互体量,这保证了 AI 技术本身的生命力。因为 AI 的生长进化依赖大量的数据喂养,数据让 AI 理解并认识世界,是 AI 大楼构建的基础力量,而获取数据最好的路径之一就是通过规模化落地得到大量的用户训练。
小度所秉承的「普惠 AI」理念,降低 AI 交互门槛,让更多的人享受到智能生活。数据显示,目前搭载小度助手的设备月均交互次数达 66 亿次,可连接的 IoT 智能家居设备已超 2 亿。小度的庞大用户体量已经成为 AI 深入落地必不可少的土壤。
规模化落地后的数据增长,似乎也印证了过去百度 AI 加速全场景布局、丰富智能硬件矩阵策略的前瞻性。
有了土壤,接下来就是 AI 技术的迅速生长,在这个阶段,百度 AI 技术积累的深度就变得更加关键。依赖自身 AI 技术的持续创新落地能力,破圈之后,小度 AI 选择的道路是赋能。
从破圈到赋能,小度 AI 其实走到了 AI 落地 C 端的下个阶段:以深交互为核心的持续创新。
事实上,过去的 AI 仍处于「浅交互」阶段,人机交互技术的目标在于满足可用性,百度 AI 技术的积累,使得小度开始进入以「深交互」为核心的技术创新、应用阶段。
小度助手(DuerOS)在升级到 7.0 版本的同时,提出了「环绕智能」概念,可以为终端设备赋能,使其具备语音、视觉、以及多设备协同下的多模态感知与理解能力,实现更加自然、真实、更具人格化的人机交互体验。
「环绕智能」意味着多模态感知下,AI 本身有了更强大的感知能力,使得 AI 更能够理解语言交互背后的意图。能够听清,更能够听懂你在说什么,这不仅使得 AI 能够给予更准确的交流的反馈,而且能够适应用户习惯、了解用户偏好,在用户需要时及时响应,在不需要时隐入环境。在这背后则是小度 AI 在技术上的可持续创新、应用的能力体现。
比如在语音对话和听觉上,小度的「全双工免唤醒」能力在小度助手 7.0 上升级到 2.0 模式,可以实现「延长聆听」,支持全场景全领域下,用户只需一次唤醒小度,就能进行多轮对话。在视觉感知理解方面,添添智能健身镜搭载了全新升级的小度助手 7.0,独创「火柴人」投影技术,在用户锻炼时,添添智能健身镜镜面可实时生成用户的 AI「火柴人」,给予精准的运动反馈等。除此,在用户隐私方面,小度依然做的很到位。据悉,相关视觉理解计算都只在设备侧本地运行,安全级别和手机上的人脸解锁一样,杜绝了隐私泄露的风险。
对于 AI 的技术来说,交互能力的全面升级,其实是一次由浅到深的交互迭代。
基于基础 AI 理解能力的交互本质上是一种的浅交互,AI 更多的在于做数据的分析匹配,所谓深交互,更强调交互的逻辑性,比如 AI 根据上下文的语义关联,做出最终的正确反馈。
事实上,从浅交互到深交互的迭代对行业来说也颇具意义。
在 AI 商业化的过程中,一开始是 AI 在应用层的开发和落地,但随着交互能力的升级,AI 在 C 端的落地会越来越深。
比如,在零售、医疗、金融等领域的应用,但 AI 技术的目的,是成为新的生产力。换言之,AI 逐步会演化为适应各个场景下的智能平台,比如 AI 智能驾驶、AI 助手,后者更直接服务于 C 端消费者。
小度 AI 通过多模态感知+理解能力赋能终端,其实也是随着 AI 交互能力的深化,百度把自身的 AI 技术积累开放到 C 端市场的应用层,这带来的结果就是小度助手在不断链接新的服务场景。
一方面,百度把更多的 AI 技术能力开放给伙伴,让百度的 AI 能力极大程度向外释放。另一方面,从技术进步到应用落地再到反哺技术,商业的发展将为 AI 带来新的动力。通过 AI 的持续落地、创新,反促 AI 技术的发展,进而也会引导 AI 技术在 C 端的深度落地。
比如,在刚刚过去的一年,小度一口气推出添添智能健身镜、添添旋转智能屏、小度教育智能屏、小度智能摄像头电视、小度智能词典笔等多款新品,小度助手的对话能力也开放给了手表、手机、老人机等第三方产品。这使得 AI 技术在 C 端的商业化进一步加深,同时也促进了整个智能硬件产业中 AI 技术的含金量,长期来看,这有助于 AI 技术加速与 C 端产业融合。
小度黑科技的背后:一场待来的 AI 生产力变革
百度不仅是 AI 技术的创造者,也同样是 AI 技术的赋能者。从历史来看,人与信息之间的交互变革,总是在推动产业的变革。
鼠标键盘时代,苹果带来了图形界面的变革,这改变了生产力形态,不仅催生了新的行业,也改变了人们沟通交流的方式,从而促进了各个产业生产力的发展。
智能手机时代,交互方式迎来变革,于是诞生了电商、物流等产业,零售、服务产业发生了进一步迭代。
AI 带来的深度交互很可能会带来这样的变革,但不仅需要有强大的技术适应能力,而且要在 B 端、C 端双向充分落地。
这其实也是百度一直在做的事情。小度作为百度 AI 能力的代表,其实一直都在深度思考如何把 AI 技术更好地落地到 C 端。
百度集团副总裁、百度智能生活事业群组(SLG)总经理、小度科技 CEO 景鲲在采访中曾表示:「小度不是一家硬件公司,依然是一家 AI 科技公司。」
我们能够看到,无论硬件如何更新,小度的核心产品始终是跨平台、跨终端的自然交互对话系统 DuerOS,即小度助手。小度做的并不是某一垂类的单品,而是以小度助手及多模态交互系统为核心,向各个智能场景辐射切入。而小度的最终目标,是做一个面向各种品牌产品的开放式对话系统。
小度 AI 技术的不断演化,也似乎印证了百度 AI 技术有很强的适应能力,而一项技术要生存发展,就必须深嵌到产业中去,就像百度 AI 在云计算、智能驾驶等领域的落地。
AI 技术的强大适应能力会带来两个结果,一方面,AI 交互能够加强 C 端联系,AI 技术让普通人的生活变得更加简单容易,这也符合百度的愿景和使命。
百度的愿景是「成为最懂用户,并能帮助人们成长的全球顶级高科技公司」。这可能也是为什么小度最在意的其实是产品体验维度的智能性,是否能带来更好的人机交互体验。
另一方面,AI 又能串起产业端,以交互为介质,未来有望承载更多 C端的消费和服务需求,进而赋能产业端,实现供需双端的 AI 效率。
AI 的发展一定是与产业端密不可分的,既要有技术生态,也要有产业生态。目前,小度已经形成了一套「1+X+Y」的生态发展思路。1,指的是小度助手(DuerOS);X,指的是交互硬件,包括小度自有产品和合作产品;Y,指的是生态硬件,智能家居及 loT 产品;
据介绍,这一思路的目标,旨在打造一个以小度助手核心技术为基,通过自创产品以及赋能行业生态等多样方式,来构建一整个开放的 AloT 交互生态,最终扩大小度核心技术的应用规模,形成市场和品牌竞争力。
深耕人机交互、串联 C 端以及产业端的背后,能够看到小度 AI在深掘技术的复利。
AI 交互技术的迭代不是一蹴而就的。对于 AI 技术而言,相比磅礴的营销灌溉,润物无声的技术滋养,才能使得 AI 扎根商业化更深。AI 扎根越深,就越容易挖掘技术的复利。
小度 AI 深谙这一点。这也是为什么相比小度 AI 硬件产品的丰富的能力,很少有人注意到在小度 AI 背后,其实凝聚着 AI 人机交互最前沿的黑科技。
在小度助手 7.0 上,首创的 PCAN 模型「Personalized Contextual Attention Network for Large-scale Goal Tracking,个性化上下文注意力网络做超大规模需求追踪」得以应用。这使得小度 AI 能够通过用户过往的交流习惯、话术动作等,预判和理解用户的需求。
同时 PCAN 模型还能「自主」学习,用户使用小度的次数越多,小度助手就会越来越聪明,越来越懂你。
前沿 AI 技术的应用,使得 AI 更容易走进人日常生活,而这一点也是小度 AI 所坚持的。「我们的短长期目标都是希望将智能交互产品更快地渗透到用户生活,以及更多场景和品牌中。」小度 CEO 景鲲曾对媒体表示。
如今,越来越成熟的 AI 语音交互,正在让更多人的生活变得更丰富、多彩。事实上,相比短期内产品端带来的改变,AI 技术带来的影响是更加长期的。跨过时间的维度来看,AI 会在接下来相当长的人类历史中扮演重要角色。
人工智能进步飞快,已经广泛参与到 C 端用户生活的各个场景之中,成为社会进步的核心技术之一。未来随着持续的渗透与融合,我们有理由相信 AI 也会成为新时代的水电,也许,到那时我们才算是真正迎来了 AI 时代。
来源:互联网