告别高光时刻的 500 天里,搜狗「分身」。
2019 年两会期间,由「分身技术」合成的 AI 女主播「新小萌」正式上岗新华社。这款产品是以新华社主播屈萌为原型,不仅会用自然连贯的人声进行播报,就连唇形、面部表情也十分逼真。
这不是搜狗 AI 主播第一次引起轰动。2018 年的 11 月,搜狗分身技术第一次在媒体领域实现落地——以央视主持人新华社为原型的虚拟主播亮相乌镇世界互联网大会,眨眼、挑眉、唇动每个动作都自然得超过了预期,引得周围不停有人驻足、拍照、询问。
分身技术,这种基于多种模态识别融合的技术,包括语音、手写、唇语等维度的识别和模拟,能通过数个小时的视频资料就能合成一个比较逼真的真人形象。
这是搜狗上市后,在其 AI 故事框架活跃着的最新主角们。
AI 主播发布后,很多网友表示「看不懂」搜狗究竟想做什么。的确,500 天以来,翻译笔、虚拟主播以及在 3 月 18 日最新发布的录音笔,这些看起来「互不关联」的落地产品构成了搜狗 AI 战略的前行的一个个脚印。
溯源这些看不懂背后的原因,从小来看,是因为并不了解各个产品的使用场景以及到底如何产生价值。而更深层次的原因,是因为并不理解王小川心中确立的大目标。我们在极客公园 IF 大会后和王小川聊了聊,也与他的企业家朋友们进行了交流。试图理清搜狗正在真正讲着的故事。
王小川的新目标
自今近 500 天前,2017 年 11 月 9 日是属于搜狗的高光时刻。在上市缄默期结束的六个小时之后,王小川第一次提出了公司未来的 AI 战略——以语言为核心。其中包括两个部分:第一部分是人机交互,包括感知和认知层面对语言的理解,以及语音合成;第二部分以语言为核心,围绕机器阅读理解和推理能力,称为知识计算。
近来,王小川得出了更高维的目标。无论是公开对外接受采访时还是私底下与好友进行交流中,他都表示,用 AI 解决跨语言隔阂问题,优化人类沟通效率才是搜狗长期战略。
对于外界而言,直到今天,广告收入和流量成本是考量搜狗的核心指标,因为搜索依旧是搜狗收入的主力军。2019 年 2 月 1 日,搜狗公布了截至 2018 年 12 月 31 日全年未经审计的财务报告。其中显示,2018 年搜狗总营收达 11.2 亿美元,同比增长 24%。其中,搜狗搜索和搜索相关营收为 10.2 亿美元,较 2017 年增长 28%,仅 2018 年第四季度就达 2.77 亿美元。
面对搜索这块旱涝保收的「自留地」,许多人认为抓收入才是唯一正经事。为什么王小川却选择为搜狗勾勒了更抽象的未来?
用 AI 解决跨语言隔阂问题,优化人类沟通效率|视觉中国
外人的看法不难理解。在目前互联网所形成的商业价值体系中,技术取向的公司并不容易获得商业上的成功,因为没人会为技术直接买单。所以,常有的做法是在技术上套上场景,形成产品,再以此抓住用户获取流量,最后完成变现,整条链条的打通才能有价值。考虑到资本市场、股价等,这便是很多人认为抓住流量变现,是现在搜狗的核心任务的原因。
王小川的想法则源于发现了这套逻辑中将来存在的问题。这个过程会形成惯性,向「右侧」迁移,时间长了,技术公司成了流量公司。弊端之一是流量变现本身存在天花板,无限追求会出现获取成本大于价值回收的问题,更为严重的是,流量公司的流量资产往往会在技术换代时候遇到大风险。
所以,虽然搜索目前仍然能带给搜狗客观的收入,但如果只靠搜索,将来仍会面临极大的压力。对于搜狗而言,只强化搜索目前的市场份额并不是在面对技术跨代时的根本解决方案,真正回归一家技术公司的本质似乎才是王小川想做的。
搜狗的顿号
但要在加强搜索份额和收入的线性增长之外,建立一个基于 AI 时代的新技术目标并不能一步实现。需要拆解为技术的分步推进,局部应用,然后再汇聚成完整的目标实现。
分身技术、翻译笔再到录音笔都在不同程度上体现着这个 AI 目标。据搜狗语音交互技术中心高级总监,同时也是新华社 AI 主播项目的负责人陈伟介绍,在形成基于从识别到理解、认知,再到表达整个闭环过程中,团队里有两条不同的大线,一条线在做语音交互,怎么能够让人机交互更自然;另一条做语音翻译,语音同传的能力。
翻译笔更是优化沟通效率的直接体现,用搜狗的神经网络翻译技术和语音识别技术实现离线语音翻译、离线拍照翻译,能解决出境游时面对的跨语言沟通难题。3 月 18 日搜狗发布了最新硬件产品,智能录音笔 C1。该录音笔推出后,搜狗则又多打通了一个接触用户、搜集语音数据的入口,有了更多的积累,搜狗会逐渐将其 AI 战略的壁垒越筑越高。
而这些看似分散的产品,最终能拼凑成一张抵达王小川关于智能世界终极设想的蓝图。熟知王小川的好友对极客公园说:「分身、智能硬件只是一个大方向上的子集,一种阶段性成熟技术的应用。不是终点,也不是下一个业务,甚至不是逗号,是一个顿号。」对于搜狗而言,逗号意味着以特定产品作为阶段性目标,而顿号只是一个个尝试。在真正寻找下一个增长点时,搜狗还需要更多顿号去实验和实践。
轻松的方式是做好短期的事情,向华尔街呈现好看的报表,但公司也面临被画上句号的风险。困难的事情是努力让搜狗跨过时代,从输入法、浏览器、搜索的技术时代,进入下一个技术时代。但这个过程中,最终的目标,实现目标的耐心以及节奏都是企业需要过的关。正当年的王小川选择了后者。
据财务报告显示,2018 年研发支出为 2.017 亿美元,较 2017 年增长 17%,占总营收费用的 17.9%。而该项支出除了用于核心业务技术升级外,还用于探索分身技术、智能硬件等最新的商业应用场景探索。在技术跨越上持续投入,这也是搜狗让人保持期待的重要支撑点。
「你可以把技术作为单词,写成一句短语(产品),然后直接产生价值;也可以努力把单词打造成诗词,释放更大的价值。而传世的诗词,往往也会有经典的成语(产品)诞生其中。以我的了解,王小川这家伙不选择后者,那才奇怪了。」一位他的企业家朋友这样评价。
2019 年 1 月,在极客公园 IF 大会上,王小川分享了他最新的思考成果。看完这个视频,你就会更加理解这位企业家朋友的评价。
责任编辑 卧虫