央视点赞！声网赋能时空壶 AI 翻译耳机，让跨语种对话零障碍

在全球化浪潮推动下, 跨语言沟通需求呈井喷式增长,AI 翻译耳机市场迎来了前所未有的发展机遇。时空壶 (深圳时空壶技术有限公司) 深耕 AI 翻译耳机领域, 近日, 其研发的 AI 翻译耳机凭借卓越性能, 连续两次登上央视, 成为行业焦点。

在央视《朝闻天下》及《新闻联播》报道中提到, 时空壶团队耗时 3 年多, 进行 3 个产品迭代, 潜心攻克同声传译的通信、降噪等核心难题, 通过全球首创的算法, 让跨语种沟通更加准确、自然, 实现「无感」交流。

在卓越的使用体验背后, 既有时空壶在翻译耳机领域多年的深厚技术沉淀, 以及对海量使用场景的反复打磨, 也离不开声网 RTC 技术的关键支持。

AI 翻译耳机两大难题:降噪和双向通信近年来,AI 翻译耳机市场发展迅猛, 翻译耳机的全球出货量以年均 62% 的增速狂飙。然而, 要实现自然、流畅的跨语言沟通,AI 翻译耳机面临着诸多技术挑战, 降噪和双向通信两大难题。

2019 年, 时空壶发布了随身翻译机 Zero,Zero 一经面世便取得了不错的销量, 斩获多项国际大奖。但现实使用场景远比实验室复杂得多, 不到两个月, 产品遭遇大量退单。其中最主要的原因是, 不少用户反馈产品降噪功能欠佳, 严重影响翻译效果。在展会现场、喧闹的地铁站等嘈杂环境中, 耳机难以准确捕捉用户语音, 翻译的准确性和效率也会大打折扣。

与此同时, 在实时翻译过程中, 翻译延迟也是影响用户体验的重要因素, 延迟过高会导致沟通的连贯性被破坏。在进行语音识别时, 由于数据需在多个系统模块间流转, 会产生一定的时间损耗;此外, 在网络不佳的情况下, 传输延迟也会进一步加剧翻译延迟。

W4 Pro 响应延迟低至 0.2 秒, 媲美世界顶尖译员经过 3 年多时间的 3 次产品迭代, 时空壶在 2024 年 9 月推出了全球首款开放式 AI 同传翻译耳机 W4 Pro, 搭载其业内首创的 Babel OS 同传系统, 实现了「端、边、云」全链路信息处理能力的飞跃, 让响应延迟缩短至 0.2 秒, 几乎与原声同步, 极大提升了沟通的流畅性, 翻译延迟压缩至仅一句话的时间 (3-5 秒), 达到世界顶尖译员的水平。

在翻译准确率方面,W4Pro 支持 40 种语言及 93 种口音间的任意两种语言即时互译, 平均准确率高达 96%, 无论是常见语言还是小众方言, 都能精准解读, 远超同类产品平均水平。

在音频降噪方面,W4Pro 采用了三麦克风结构与矢量降噪技术, 有效过滤背景噪音, 大幅提高降噪效率, 确保翻译的准确性。测试数据显示, 在 85 分贝的嘈杂环境中, 其语音识别准确率仍保持在 92% 以上。

在网络传输方面,W4Pro 借助音频压缩算法的弱网优化, 以及声网的抗弱网传输和抗丢包算法, 即使在跨国视频会议中遭遇网络波动, 翻译稳定性仍也能提升 40%。

W4Pro 的应用场景十分广泛, 不仅能满足面对面翻译需求, 还能覆盖外语电话、远程会议、新闻演讲、网课等翻译场景, 将「个人翻译」的体验提升到新高度。

自推出以来, 时空壶 W4Pro 在市场上成绩亮眼。2024 年, 公司营收过亿, 增速达 60%, 其中 W 系列翻译耳机近三年出口每年增长超 100%。在国际电商平台亚马逊上,W4Pro 也脱颖而出, 摘得「亚马逊翻译机最佳销量」桂冠, 深受全球消费者青睐。

声网技术赋能, 让跨语种沟通零障碍在攻克 AI 翻译耳机在响应延迟与降噪方面的难题时, 声网凭借深厚的技术沉淀, 构建了一套完整的解决方案。从网络传输、音频算法处理, 到交互体验优化与硬件适配, 声网都具备行业领先的独特优势。

超低延时, 响应更快速

声网凭借专业的全球网络部署与超低延迟传输技术, 为 AI 翻译耳机的低延时响应提供了有力保障。声网自研的 SD-RTN™ 实时传输网络覆盖全球 200 多个国家与地区, 显著提升了用户接入速度, 降低了端到端延迟。

声网自研的抗弱网传输与抗丢包算法, 结合网络探测、抗丢包技术、自适应 jitter buffer、网络拥塞控制策略等, 能够在 80% 丢包的恶劣网络环境下, 依然保障音视频通话的流畅性, 确保翻译数据能够及时、稳定地传输, 避免因网络问题导致的翻译延迟。

AI 降噪, 对话更清晰

针对语音对话中经常会出现的噪音、回声等问题, 声网拥有行业领先的音频 3A 能力, 通过 AI 噪声抑制、背景人声过滤、音乐检测/过滤等算法, 能够智能屏蔽 95% 交互中的各类背景人声与噪声干扰, 确保语音不受环境干扰, 为用户打造清晰、流畅的对话体验。

智能打断, 对话更自然

在「双向同传」过程中, 用户只需开口说话、无需双手操作、无需等待对方翻译、随时都能插话。凭借声网先进的 AI 语音活动检测 (AI VAD) 技术, 可实现灵敏的自然语音打断, 模拟人类对话的自然流动, 让对话更加真实、自然。

主流芯片支持, 适配更广泛

在硬件场景构建音视频互动时, SDK 对芯片、系统的适配性以及包体的体积至关重要。声网支持适配支持 70+ 主流、高性价比的主流芯片/模组。集成包体积增量也<400KB, 支持在 RTOS、EmbedLinux 等低功耗系统流畅运行, 同时 SDK 还支持 PCM、G711U/A、G722、AAC、OPUS 等多种音频格式。

目前, 时空壶 AI 翻译耳机在全球市场上取得了亮眼的成绩, 产品远销全球 170 多个国家和地区, 北美市场占有率达到了 40%。

未来, 声网将与时空壶继续深化合作, 不断探索 AI 翻译耳机技术的新边界。双方将持续优化技术能力, 进一步提升产品性能, 为用户带来更加自然、流畅、高效的跨语言沟通体验, 共同推动 AI 翻译耳机行业的发展, 为全球用户搭建更加便捷的语言沟通桥梁。

来源：互联网

最新文章