在终结者之前,「远程操控」机器人可能是更现实的路径。
1981 年,年轻的詹姆斯·卡梅隆做了一个奇怪的梦,他梦见自己被机器人追杀,几年后,他将梦境搬上大银幕,以《终结者》这一形象征服了全世界观众,而在多年后回忆自己的创作动机,他说道:
「机器是我们的梦想,也是噩梦,问题在于,人类和机器能否共同打造未来?」
这个问题直到今天仍然没有定论,但卡梅隆以自己的方式给出了一个方向——在创作影片《阿凡达》的过程中,「将人类智力注入遥控的生物身体中」(即所谓的「化身」)这一概念成为整个故事的核心。
也指出了人与机器人,在未来世界共存的另一种可能性。
近日,由日本全日空(ANA)赞助的机器人赛事 Avatar XPRIZE,旨在全球寻找以人类智慧,远程操控机器人的「阿凡达机器人」的优秀团队。如果团队能使用「化身」完成数十项挑战,则有机会获得千万美元大奖。
奖金或许只是奖励,但是团队的尝试,或许会成为人类「阿凡达」之路重要的一环。
更「接地气」的机器人大赛
与 DARPA 的机器人大赛不同,尽管 XPRIZE 也通过面向全球的比赛推动技术发展,但其展开的比赛却围绕气候环境变化、粮食危机、热带雨林保护等领域。
本次面向机器人领域的 Avatar XPIZE 也和 DARPA 的机器人比赛有所不同,目的是寻找能够将人类感官、行为和存在实施部署至遥远地点的化身系统(即 Avatar),从而打造出联系更加紧密的世界。
显然,这样的目标相较于更加科幻的 AI 机器人来说显得更接地气。
正如其首席执行官 Anousheh Ansari 所说:「当某地出现危机时,另一个国家的人足不出户就能为其提供援助。」这种虚拟化身的方式将解决现实世界的问题,正是这种特殊之处让 Avatar XPRIZE 具有更贴近当前产业结合的现实意义。
正如大赛名称所代表的含义,该比赛更多地强调机器人是一种化身,而不是一种工具。操作员将需要能够识别,他们的机器人正在触摸的物体,听到机器人听到的声音,看到机器人看到的画面,并需要通过温度传感感知温度——这也是为何你会看到参赛队伍都在采用类似头戴式 VR 设备的重要原因。
其次,XPRIZE 将使用模拟的「高质量」网络连接,其中「可靠性、带宽、延迟和抖动将代表最佳可用的公共互联网服务」。很难说如果 DARPA 机器人大赛团队能够使用可用的最佳公共互联网服务,他们的效率会提高多少,但对于使用了 VR 设备,追求尽可能高同步率的 Avatar XPRIZE 比赛来说,网络质量相较于 DARPA 大赛会更胜一筹。
还有一点值得注意,参赛队伍必须在 20 分钟或更短时间内完成设定的目标,这实际上也变相增加了难度。
如此一来,你或许能明白,Avatar XPRIZE 不仅在考验参赛队伍设计出的机器人的灵敏度和多功能性,还对队伍的熟练度提出了很高的要求。这些都暗示了比赛项目一旦能够实现,将对现实具有的重要意义,而当我们再从一些参赛队伍的作品细节观察,又能进一步看到这项比赛的特殊之处。
从现实世界寻找「未来之路」
作为一项人机协作的赛事,Avatar XPRIZE 设定的任务看起来较基础但多样化,不仅仅是针对灾难场景,还有很多看似非常日常的任务目标。并且,现场也会给出其他的任务要求,虽然整体来看,这些项目难度并不大,但要在特定时间内完成却显得更加复杂,以下是此前在比赛时的目标项目,从中我们也可一窥该比赛的特点:
这些动作每一项看起来都很寻常,但综合在一起却体现出在特定场景中的复杂性,而一旦能够操控机器人快速完成,就意味着参赛队伍能够让机器人在一些特殊场景发挥出实际作用。
例如 2021 年半决赛中获得第一名的 NimbRo 团队,这个来自德国波恩大学自主智能系统实验室的设计出的机器人,由一个操作员站点和一个可移动化身机器人组成。
德国波恩大学自主智能系统实验室的 NimbRo 在进行比赛|IEEE
机器人有一个类似人类的上半身、两条手臂和完整的五个指头的双手,头部则装备有广角摄像头、麦克风阵列,和展示操作员面部表情的显示器。
在远程操控过程中,机器人能将操作员的面部表情和声音实时同步到现场,这一过程借由 VR 头戴设备内的多颗摄像头和眼球追踪技术得以实现,而其头部和手部动作则会被捕捉并传输给机器人,操作员通过 VR 设备控制器以及手部操控装置来「化身」成机器人完成各种动作。
NimbRo 团队在操控机器人|IEEE
NimbRo 团队指出,操作者可以通过手腕上的力-扭矩传感器,来感受化身机器人手掌抓握时的力度,也能通过电机的电流感应刺激,感受到手指的细微触感。
利用这套设备,在半决赛时,NimbRo 机器人完成了包括煮咖啡、下棋、玩拼图游戏,测量高血压、体温、血氧饱和度等操作,还帮助需要帮助的人穿上夹克,这都让这台机器人在疫情之后的当下具有更大的现实意义。
类似的,由伊利诺伊大学厄巴纳-香槟分校(UIUC)研发的 Avatrina 机器人也将 VR 技术与机器人技术进行融合,通过操控人员的 VR 设备来实现机器人的实时动作。
Avatrina 配备了视觉和听觉系统,可以让远程操控人员和机器人面前的人进行沟通,而机器人也能通过头部的平板电脑(即机器人的脸)看到机器人面前的一切。
在很多团队看来,这种机器人与 VR 技术结合的方式,让人类距离未来世界更进一步。相较于其他实现方式,该领域面临的问题并不那么致命,比如网络延迟、VR 设备的分辨率和视角不够高、化身机器人不够灵活等,这些都是会随着时间推移逐渐解决。
更重要的是,这种通过人来远程操控机器人的方式,在日益严重的「AI 取代人类」焦虑中,找到了另一种解决办法。
伊利诺伊大学厄巴纳-香槟分校团队的 Avatrina 机器人|IEEE
想象一下,当获胜团队能够结合最先进的技术,让任何未经培训的操作员在非常短时间训练之后,远程操控 100 公里外的化身机器人,在特定环境中完成从简单到复杂的各种任务,就将颠覆商业领域的部分工作形式,如商场引导、酒店服务、景区旅游、产品销售等,均可以在人们足不出户的情况下完成,并节约大量资源。
正如伊利诺伊大学厄巴纳-香槟分校计算机科学教授 Kris Hauser 所说:「虚拟体验不会完美替代所有面对面的互动,但即使我们可以替代 50% 的出行,这仍然是时间、成本和能源消耗方面的巨大胜利。」
「阿凡达」照进现实
在机器人研究中,具有自我决策能力的 AI 机器人作为当下最热门的话题时常登上热搜,也伴随「AI 取代人类」的焦虑被不断讨论,但实际情况或许并非如此。
如今的我们可以看到,无论是深空之中的太空舱机械臂,还是家庭当中的机器人助手,人类通过远程控制机器人完成一些特定工作早已成为现实,而 Avatar XPRIZE 的目标则是再向前一步,让机器和人的结合更加紧密。
「疫情期间,一些可远程操控的机器人,已经被用于为隔离在家的患者提供远程医疗服务,与亲人交流,通过远程操控还可以完成喷洒药物,或者紫外线消毒等任务。而更进一步,他们还出现在手术操作、爆炸物处理甚至太空探索中。」在 Kris Hauser 教授眼中,这类机器人依然是应对老龄化的重要工具,正如他所说:
「化身机器人即将出现的最大机遇之一是家庭保健。由于人口老龄化,美国到 2035 年将会出现超过 100 万的家庭保健助理缺口。老年人需要的很多帮助都是相当常规的,如果你可以在半夜登录机器人的虚拟化身花 10 分钟来帮助他们,而不必聘请全天候护理,那么对很多家庭来说将是一个巨大的帮助。」
更实际一些的应用在于,化身机器人与我们如今常见的商用 AI 机器人还能相互结合,实现 1+1>2 的效果。
挪威的HALODI机器人|HALODI
总部位于挪威的机器人公司 HALODI,其生产的商用人形机器人,可以使用 AI 执行诸如门迎、超市导购等预编程服务。
而当它需要完成那些超出预编程范围内的服务,例如为人开门、捡拾物品等内容时,位于后端的操作员便可以通过接入 VR 设备接管机器人,通过获得机器人的视线内容、听到机器人听到的声音,为机器人面前的人提供对应的服务和操作。
这种结合的方式不仅不会让人失业,还能极大减轻人们的工作负担。基于这种方式,HALODI 的机器人已在挪威落地商用,并成为部分医疗机构的「特殊服务生」。
从某种意义上看,机器人技术的发展和现在正火的自动驾驶类似,终极目标是 L4-L5 级别的完全自动驾驶汽车。但是,真正要达到这个目标,仍然需要很长的路要走。在此前之前,人类驾驶员依然是主角。
在科学家能够研发出「终结者」一样的通用 AI 型机器人之前,使用 VR 等方式,将远方的人类作为操作和决策主体,可能是未来机器人发展的重要变量,和非常可行的方式之一。
而 Avatar XPRIZE 大赛所展示的,则是人类向「阿凡达」机器人方向的努力。