从 IBM 深蓝(Deep Blue)到 Google「阿尔法狗」,一个个棋类大师「倒在」机器手下。如今「人机大战」的战火已蔓延到了辩论界,IBM 派出 AI「杠精」Project Debater对战人类顶级辩手展开了酣畅淋漓的「人机辩论赛」,最终 AI 竟然说服了现场听众成功逆转了结局这位 AI「辩手」究竟是如何做到的?今天就带大家探究一下它的前世今生……
故事要从很久很久以前说起……
我们都知道古希腊人非常擅长辩论,既有含着石头苦练说话的演讲大师德摩斯梯尼,也有百科全书式的人物亚里士多德,更有被誉为「西方孔子」的苏格拉底,那时,思想就是在辩论中产生的。将人工智能引入辩论这一探讨开放性问题的领域非常有趣,受到该灵感的启发,IBM 以色列海法实验室的科学家建议设计一个能够与人类辩论的人工智能系统。2012 年,Project Debater 项目正式立项。
IBM 海法研究院 Project Debater 首席研究员 Noam Slonim 博士(左)和他的同事 Project Debater 全球经理 Ranit Aharonov 博士(右)向我们介绍说:「我们在开始这个项目的时候,想的是如果我们确定 Project Debater 能做什么事情,或者说我们非常确定它不能做什么事情,对它能不能实现既定的目标都有百分之百的信心了,这个东西就没劲了。我们想的是语言理解一直都 AI 领域的重点,也是 IBM 所关注的一个重点。而且在这个方面的研究实际上是不够的,所以我们希望能够通过 Project Debater 进一步推进在促进 AI 发展的语言理解领域的研究。」
6 年后,Project Debater 首次和世人见面。
人机首次跨「物种」辩论,AI 成功逆袭了?
2018 年年中,在 IBM 美国旧金山的 Watson West 办公室里,首个能与人类进行复杂辩论的 AI 机器人 Project Debater 分别对阵以色列国际辩论协会主席 Dan Zafrir 和 2016 年以色列国家辩论冠军 Noa Ovadia,就「是否应当资助太空探索」、「是否增加远程医疗的使用」两大议题展开了激烈的辩论。比赛的规则是 1v1,人机双方各有 4 分钟陈述自己的观点、4 分钟反驳对方的观点,以及 2 分钟进行总结陈词。随后,将根据在场观众的投票数而判断输赢。
- 2012 年:以色列海法的一个 IBM 科学家小组开启了 Project Debater 的生命历程,并展开了第一次测试辩论。就像牙牙学语的宝贝一样,开始总是很吃力的。在「体育是否应该作为必修课」这样的话题上,甚至会引用「多个论文表示蜥蜴不会从运动中获得益处」这样的论据:
- 2013 年:科学家已经开始设想将来 Project Debater 要与真人进行辩论,因此邀请了一位纽约的女配音演员为 Project Debater 配音,赋予了它人类的声音;
- 2014 年:IBM 在第 25 届国际计算语言学会议上发表了该项目的首篇研究论文;
- 2016 年:Project Debater 第一次带着它全新的人类语音,进行实时辩论。Project Debater 表现很好,但是还会出现不少错误;同年,除了使用维基百科资料以外,项目组还为 Project Debater 添加了来自新闻报道中数十亿的语句,让它获得了更多的论据素材,也因此能就更广泛的话题进行辩论;
- 2017 年:Project Debater 取得了标志性的突破——它第一次成功说服人类同意了它的观点!同年,在 2017 年自然语言处理顶级会议的第 4 期论辩挖掘研讨会上,来自海法和都柏林的 IBM 科学家发表了新成果,形成共计 30 余篇论文和 10 余个公开的数据集。
- 2018 年:Project Debater 首次公开与人类专业辩手进行辩论,一鸣惊人!
在长期积累下,IBM 研究院 Project Debater 团队成员,在各个研究领域发表了 30 多篇论文,其中最突出的就是提出计算辩论(Computational Argumentation)这一迅速崛起的领域。期间提出的多个突破性的算法、工具、流程、框架等研究成果,推动了包括独特的自然语言处理(NLP)、机器学习和推理技术等多个关键技术的进步。研究 Project Debater 过程中取得的技术研究成果,对于其他应用类似技术的人工智能场景会有极大的推动作用。而这些技术的应用,对于 Project Debater 能够跨不同领域和数据集进行学习,从而产生新的知识和理解起了关键作用。
在这些尖端技术的武装下,Project Debater 被 IBM 研究员团队赋予了 3 大核心能力:包括数据驱动的演讲内容撰写和表达能力,在演讲中识别人类口语中的关键声明概念和观点的听力理解能力,以及通过模拟人类困境来提出制定原则性论点据辅助人类决策的能力,这无疑是人工智能的一次突破性的。
也就是说,Project Debater 具有非常强大的数据处理能力,拿到辩题后,它会迅速扫描其庞大的语料库文档中与主题相关的数百万篇新闻和论文等材料,找出与辩题相关性最高的观点,通过算法剔除多余且重复的信息,提取出一个最具说服力的观点加以阐述。
只要包含上亿篇主流报纸、杂志文章的语料库中有大量的相关内容,Project Debater 可以针对不同话题进行辩论,提出独具一格的观点。而针对具体的行业或细分的领域,比如金融、法律和公共政策等等,我们的科学家都可以向 Project Debater 添加语料库文档,不断丰富 Project Debater 的「知识面」。
换句话说,只要有足够的语料库,Project Debater 就有能力针对任何一个话题提出见解。虽然,目前距离真正掌握人类语言还有一定距离,但这将是人工智能发展的下一座里程碑——真正掌握语言,帮助人类更好地做出关键决策!
即使不能够彻底替代人类,但可以确信的是机器可以帮助人类更好地做决策。
和任何发展初期的新技术一样,Project Debater 还只是迈出了第一小步而已,但没有什么能够阻挡技术的发展,因为我们坚信它的价值——辩论丰富了决策制定的过程,可以帮助我们权衡新想法、新理念的利弊。人类辩论不只是为了说服他人认可我们的观点,也是为了理解和学习彼此的观点,拓展我们的思维,打破刻板观念。未来,相信机器可以帮助人类更好地权衡利弊,推翻偏见,做出更多「无偏颇」的决策。
AI 将如何辅助人类做出更「无偏颇」的决策?
得益于 Project Debater 庞大的语料库,可为决策提供更多有价值的信息,这些信息对于制定决策往往起到关键作用。因为人做决定时,或多或少都会受到自身经验的束缚,难免先入为主,有失偏颇。而机器则可更全面地收集信息,更中立地分析问题,为决策者提供更多维度的意见参考。未来 Project Debater 的应用潜力不可限量,尤其是商业价值,潜在用途可能且不限于以下领域:
▪ 金融顾问:训练 Project Debater 来找出金融事实,用以支持或反对金融分析师所思考的金融投资选择。
▪ 律师:通过 Project Debater 的汇总技术,律师可以借助 Project Debater 来寻找相关案件和主张,或借助 Project Debater 模拟法庭辩论来分析优势和劣势。
▪ 公共事务决策:通过 Project Debater 公正的优/缺点分析和对人类困境的模拟,可以就需要进行决策的问题,提供基于事实、没有人为偏见的观点。
▪ 学生助手:通过 Project Debater 帮助各个年龄段的学生改进他们的批判性思维和沟通技巧,或帮助他们找出更多信息以改进报告和论文。
▪ CEO 和高管:高层领导常常因拥有强烈的「直觉本能」而感到自豪,但是他们也必须避免所谓的「锚定偏见」。锚定偏见是指,我们在潜意识中有着两三个会不太客观地影响决策的事实时,就会将不适合这些观点的有价值信息排除在外不予考虑。Project Debater 可以拓宽高层领导的思路,在关键决策中纳入他们可能没有考虑到的新观点。
或许,辩论仅仅是 AI 的一个开始。让 AI 系统地掌握人类语言,帮助人类在各个领域做出更好的决策,才是 AI 科学家一直想突破的下一个边界。未来,AI 可能做到像人一样具备真正的逻辑推理能力,当我们在各个领域面临复杂问题难以决策时,AI 可以帮助人类做出更好的决策。
IBM 海法研究院 AI Tech 副总裁 Aya Soffer 博士近日在回答中国记者提问时说:「关于 AI 的下一步,就是智慧上越来越接近人类。我觉得 Project Debater 是一个很好的例子,它展示了我们是如何教授机器,只要有充足的时间、充分的数据和算法就可以充分前进。」
不仅如此,为了让 Project Debater 的表述更加自然,科学家们还教会了它「抖包袱」。例如:「今天有许多利害攸关的事情,对我来说尤其如此,但我不能热血沸腾,因为我没有血液」,「刚刚你的语速已经达到了惊人的每分钟 218 个字,你没有必要这么着急!」
那 Project Debater 是怎么学会讲段子的呢?项目组的科学家说,就像人们讲笑话一样,也是先听到了好笑的段子记下来,然后下次再讲给别人听。科学家们依法炮制,给了 Project Debater 很多幽默的素材,并教它在适当的时机「抖包袱」,从而调节辩论的气氛。不过,就像人一样,Debater 有时候也会在不合时宜的时候开玩笑。
文章结尾,附上两段视频:
1. Project Debater 背景介绍
2. 人机辩论,IBM人工智能与人类顶尖辩手首次交锋(现场实录)