音视频 AI 神器「通义听悟」重磅升级:超长视频自由问,还会做思维导图

摘要

「高校福利」:全国大学生可直接领 500 小时免费时长!

3 月 19 日,阿里大模型产品「通义听悟」发布多项新功能。音视频问答助手「小悟」上线,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长 6 小时、一次性上百条音视频的内容理解问答,用户可对超长音视频随心提问,让 AI 总结任意知识点。此外,针对学习科研场景对 AI 工具的强烈需求,通义听悟推出「高校公益计划」,向所有中国大陆高校师生直接赠送价值数千元的 500 小时音视频转写时长。

超长音视频自由提问,AI 秒速总结知识点、润色口语、做脑图

音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。「作为一款工作学习 AI 助手,通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。」

通义听悟接入通义千问大模型,融合了十多项 AI 功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT 提取等,并支持标重点、记笔记,被许多用户称为「宝藏 AI 工具」。

杨帆介绍通义听悟历程

通义听悟本次升级上新了六大功能点。最重磅的是音视频问答助手「小悟」,关键信息直接「问」出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟,对最高 6 小时、6G 大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。作为一个「懂你」的 AI,小悟还会智能推荐问题。

随时唤起「小悟」课代表

针对用户需求,通义听悟还上线了一键 AI 改写、思维导图生成等新能力。例如,一键 AI 改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级 xmind 脑图,适合播客摘要。

通义听悟思维导图示例

产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。

教育福利上线,邮箱认证即可得 500 小时免费时长

学生和科研群体对 AI 新工具有普遍需求,但目前音视频 AI 转写工具普遍收费,或仅提供如每月 1 小时的少量免费时长。

通义听悟推出「高校公益计划」,推动 AI 算力普惠。所有中国大陆高校师生通过后缀 edu.cn 的教育邮箱进行认证后,均可直接获赠 500 小时转写时长,存储空间从 20G 拓展至 200G。按目前市面上语音厂商 9.9 元每小时的折扣价,这一教育福利价值数千元。

通义听悟能听、能看、能读,还能实现速览加精听,正成为学霸们的全新学习方式。杨帆介绍,调研中发现约一半用户是学生,他们活跃度相当高,后台每天收到大量私信「求时长」。

有的同学上课、开组会「无时无刻不听悟」;有的用通义听悟两倍速上网课备考;有的每天在「发现」栏目中阅读数十档播客节目,「获取最前沿新鲜的观点内容」。

成都一位管理学博士生蔡同学在社交媒体上写道,「通义听悟绝对是最强科研神器」,她向身边几乎所有亲朋好友推荐了这款产品。通义听悟发布才 9 个月,她的使用时长已近 7000 小时,平均每天转写 20 小时以上,包括分析网络视频进行学术研究,以及日常学习工作随时使用,这款软件已成为她沉淀知识和科研成果的重要平台。

作为国内首个开放公测的大模型产品,去年 6 月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频 3 次以上,平台每天处理字符数约 20 亿字。

 

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。