![](https://imgslim.geekpark.net/uploads/image/file/70/cf/70cf0cd46ffa1588a28bb7c9c55cf645.png)
摘要
继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。
继视频、文本模型家族在新年迎来新成员后,MiniMax带来了全新升级的T2A-01系列语音模型,并全球同步上线海螺语音产品。
与传统语音生成技术相比,全新升级的T2A-01系列语音模型不仅具有音质稳定清晰、韵律自然、情绪精准表达、高准确度等特点,提供更快、更稳的语音生成能力,还能支持包括中文、粤语、英语、日语、韩语、阿拉伯语、西班牙语在内的17种语言及上百种预置音色可选,为企业与个人用户提供自然流畅的语音生成体验。
目前,海螺语音对全球用户开放。AI合成语音的魅力,邀您一起探索。
https://hailuoai.com/audio
https://platform.minimaxi.com/document/T2A%20V2
https://intl.minimaxi.com/document/T2A%20V2?key=66719005a427f0c8a5701643
依托于T2A-01系列语音模型,用户在海螺AI仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达10000字符。与此同时,用户可以根据需要自由配置输出语音的情绪、语速、音高,甚至调整音色效果,满足复杂场景的精细化需求。
多语种语言合成
综合能力可对标国际领军模型
海螺语音支持中文、粤语、英语、日语、韩语、阿拉伯语、葡萄牙语、西班牙语、法语、意大利语、印尼语、荷兰语、俄语、德语、越南语、土耳其语、乌克兰语等17种语言生成,能够提供真正地道的语言输出。在T2A-01模型的能力支持下,海螺语音在相似度、错误率和听感评测上均领先于同类产品。
我们用和Seed-TTS论文相同的评测集和评测工具(WER:合成音频的文本和asr识别结果计算词错率;SIM:用说话人识别工具计算合成音频和真实音频的距离,表示复刻相似度)来计算海螺语音的字错率和相似度(加粗数字评分代表更优结果)。结果显示,海螺语音在中文的字错率和相似度最好,英文的字错率、相似度和真实录音「Human」接近。
根据用户真实场景,我们建立了多语种评测集,并对17个语种进行客观评测。其中,每种语言选取2-10个音色,生成50条以上音频进行评估。结果显示,海螺语音相似度整体占优,综合能力媲美ElevenLabs。在中文、粤语、英语、日语、韩语和阿拉伯语等多个语种上,海螺语音的相似度、正确率方面大幅领先。
精准情绪表达
了解你的喜怒哀乐
海螺语音具备情感理解能力,能够智能地识别并重现语音中细微的情感差别,有效弥合了人工智能与人类配音演员之间的差距。用户既可以让系统自动检测情绪,也可以明确指定情绪,从而生成能够精准捕捉人类深层情感的语音输出。在指定情绪中,除了中性外,有开心、难过、生气、害怕、厌恶、惊讶效果可选,自然而逼真。
为了让声音更加鲜活,情绪表达更加精准,我们对长达超千万小时的高质量音频数据进行清洗、训练,最终实现高音质、情感丰富的声音效果,为用户带来前所未有的沉浸式体验。
我们指定不同情绪生成句子「关于这件事,我们可以好好谈一下」为例,感受其中的情绪差别。
上百种音色自由选择
效果器打造专属风格
海螺语音预置不同语种共计300+音色供用户选择,用户可按语言、口音、性别和年龄分类筛选。音色多变,不羁、诙谐、慈祥等风格丰富多样,有声书、ASMR耳语、新闻播报等场景均可适用。
在选定喜欢的音色后,用户可以在效果器中对该音色效果进行精细化微调。音色的通透性、力度可以由用户自由定义,也可以叠加回声、广播、失真、电音等特殊效果。
T2A-01系列包含T2A-01-HD,T2A-01-Turbo两款模型供用户使用,API服务已同步上线MiniMax开放平台,企业可以根据音频质量与生成速度的需求重点来选择。在海外内测期间,凭借超一流、超预期的多语种语音生成能力,海螺语音迅速收获一众海外AI工作室、创作者好评。
拥有一把打开语言与声音世界大门的钥匙,MiniMax持续为全球企业语音场景赋能,走在行业前沿——MiniMax是国内首个使用大模型语音技术开放多角色配音商用接口的公司;是国内首个开设语音模型海外API服务的公司;也是国内首个与声网、腾讯和即构科技联合研发Realtime API实时交互服务方案,综合效果可对标GPT-4o的公司。
自MiniMax初代语音模型发布以来,我们结合用户需求持续迭代模型能力,为语言学习、PC语音助手、语音声聊唱聊、超拟人情感配音等十余种场景提供落地解决方案,得到了海内外上万家企业与个人开发者的肯定。随着AI技术在声音领域的进一步创新,智能化的娱乐、工作应用场景将愈发丰富多元。MiniMax邀请你一起,谱写下一段AI创新赋能的新乐章。