语音之外,交互可以更多一些。
9 月 17 日,天猫精灵在云栖大会发布了首个全场景人机交互系统 AliGenie5.0,将视觉、语音、触觉等多种形态的交互方式融合在一起,能更精准地感知物理世界,深入理解使用者的意图。当天发布的三款新产品也全部搭载了 AliGenie5.0,提供了唇动唤醒、挥手唤醒等多种「拟人化」的唤醒方式。
天猫精灵事业部总经理库伟表示,从 AliGenie5.0 开始,天猫精灵将开始以服务为中心,应用微内核、多模态交互等技术,构建全场景智能化。据悉,该系统同步面向开发者、智能家居合作伙伴开放。此前,多模态交互技术多停留在学术层面,阿里是业内首个把「多模态唤醒」技术大规模应用在消费电子产品上的公司。
AliGenie5.0 是天猫精灵开发的多模态人机交互系统,首次将唇动、手势、语音语义等多种形态的信息输入融合在一起,可通过多模态感知的方式理解人类的交流意图,并直接给出反馈。同时支持分布式的微内核操作系统,能够覆盖更广阔的的应用场景。此外,AliGenie5.0 还支持「云应用」技术,能够突破硬件的配置和性能限制,跨平台、跨终端,流畅使用 Windows、Linux、Android 等系统的丰富应用,用户甚至可以在天猫精灵上玩电脑游戏、上网课、体验 3D 渲染等。
目前,这一系统已率先应用在此次发布的三款新品上,使天猫精灵具备了自然唤醒的能力。例如,用户在音箱端开启设置「自然唤醒」后,在 1 米左右的距离下,当机器识别到有人开始盯着它说话时,不用再喊出唤醒词,就能直接自然对话。
天猫精灵此次发布的三款新品分别为配备了 10 吋智能屏及大容量电池的天猫精灵 CC10 电池版、4 吋智能屏产品天猫精灵 CC MINI,以及第二代 IN 糖,上述新品全部搭载全新的 AliGenie5.0 系统。其中,CC MINI 还集成了阿里自研的微内核操作系统,也是全球首个搭载微内核系统的智能音箱,能够在小屏的产品上实现触屏交互,把追求高效生活常用的闹钟、日程、家居控制等功能进行整合,开发了晨起、睡眠等核心场景的极简模式,让生活中的微小需求也能被智能化。
据悉,这一系统很快也将面向天猫精灵的合作伙伴开放,今年内会陆续支持汽车、房产、智能健康、儿童教育等领域的联合定制产品,覆盖 80 多个终端品类。未来在生态内的智能场景中,天猫精灵的用户只要使用同一个账号登录,就可以进入个人界面,无差别的使用智能助手。
库伟表示,智能终端的设备量正处于快速爆发期,随身穿戴、车载、智能家居、智慧社区、酒店、养老院等需要终端设备来服务消费者的领域,都将逐步被智能化改造。他认为,智能音箱的形态,已经完成了「AI 智能助手」第一阶段的市场普及,未来将出现更多具备多种交互形态、提供 AI 助手能力的产品形态,天猫精灵也正在研发具备视觉交互、语音交互甚至行动能力的全场景智能设备。「当智能场景越来越繁杂时,就需要一个可动态适配所有场景的人机交互系统,来确保消费者体验的一致性,AliGenie 也将不断升级,为机器赋予认知、理解和行动力,让每个人、每个家庭都拥有一个专属的智能助手。」