Sber 重磅发布俄语领域最强大的神经网络模型 GigaChat 2.0

摘要

3 月 13 日, 俄罗斯储蓄银行 (Sber) 重磅发布 GigaChat 2.0 全系升级产品。

3 月 13 日, 俄罗斯储蓄银行 (Sber) 重磅发布 GigaChat 2.0 全系升级产品。根据俄罗斯 MERA 基准测试数据,GigaChat 2 MAX 模型在人工智能模型中位列榜首, 对比国际基准测试, 该升级产品线在多项指标上全面超越 GPT4o、DeepSeek-V3、LLaMA 70B 及 Qwen2.5 等国际主流模型。Sber 介绍, 升级产品的发布将极大助力企业客户高效完成现有任务并优质推进大型项目实施。

在系列产品中,GigaChat 2 MAX 性能再获提升, 在俄语任务处理方面超越众多海外同类模型;GigaChat 2 Pro 保持上一代 MAX 版本品质, 可胜任需创意发挥与精准执行并重的场景, 且模型资源占用更低;GigaChat 2 Lite 作为轻量级基础版, 现性能已达上一代 Pro 水平, 能以更快速、更具成本效益的方式处理复杂任务。

Sber高级副总裁、首席技术官兼技术负责人安德烈·别列夫采夫 (Andrey Belevtsev)表示:"GigaChat 2.0 不仅是技术指标与功能参数的提升, 更是俄语大语言模型 (LLM) 发展的重要里程碑。我们打造出比肩全球顶尖水准的解决方案, 其俄语任务处理能力更胜多数国际竞品。对任何在俄运营企业而言, 构建强大的本土化神经网络已成为战略要务。目前已有 1.5 万家外部客户采用 GigaChat, 此次产品线的全面升级将使更多企业以更高效率应对多元化挑战。借助人工智能优化业务流程, 企业将获得保持竞争优势、提升盈利能力、增强客户忠诚度的独特机遇。"

依托 GigaChat 2.0 的先进架构, 企业能够构建起具备认知智能的自主化 AI 代理系统。此系统借助知识驱动的推理机制、多维度的问题解析能力以及端到端的执行闭环流程, 实现商业价值的大幅提升。其得以实现, 得益于模型在数学、科学和人文知识储备上的扩充, 以及在编程和编写更优质代码方面能力的提升。若要运用 Python 和 JS 开发 AI 代理, 可选用广受欢迎的 LangChain SDK,GigaChat 与之完全兼容。相关兼容性包可在 GigaChain 存储库中获取。

新一代模型能够处理四倍以上的文字信息, 保留更长时间的对话上下文, 回答复杂且冗长的问题, 并分析更多文本内容。从之前的单个查询处理约 48 页的文本内容提升至近 200 页。这使得借助 GigaChat 2.0 构建聊天机器人变得更加轻松。此外, 在遵循用户指令方面的准确度也提高了一倍, 回答问题能力增强 25%。

根据俄语独立基准测试 MERA 的评估结果,GigaChat 2 MAX 在人工智能模型中位列前茅。而在俄英双语的 MMLU 基准测试中, 该系列新品与全球顶级模型表现相当甚至更优, 其中旗舰型号成绩尤为突出。相较于 DeepSeek-V3、Qwen2.5(Qwen-2.5-75b)、GPT4o 及 LLaMA 70B 等模型,GigaChat 2 MAX 在俄语事实性问题应答与格式遵循方面表现更佳。同时, 在代码生成任务的 HumanEval 基准测试中, 该模型在数理科学领域展现更高专业度。

俄罗斯储蓄银行 (PJSC Sberbank)

是俄罗斯最大的银行, 也是全球领先的金融机构之一。俄罗斯储蓄银行约占整个俄罗斯银行业资产的三分之一, 是俄罗斯的主要贷款机构, 同时在存款市场占有最大份额。俄罗斯储蓄银行的最大股东是由财政部代表的俄罗斯政府, 拥有该银行 50% 的法定资本外加一股有表决权的股份, 余下的 50% 减 1 股表决权份额由俄罗斯和国际投资者持有。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。