Tele-FLM 发布!中国电信人工智能研究院携手智源研究院推动开源社区发展

摘要

4 月 27 日上午,2024 中关村论坛年会「人工智能主题日」主论坛——未来人工智能先锋论坛成功举办

导语:52B 高性能、开源多语言大模型

4 月 27 日上午,2024 中关村论坛年会「人工智能主题日」主论坛——未来人工智能先锋论坛成功举办。会上,中国电信人工智能研究院(TeleAI)和北京智源研究院联合发布 Tele-FLM——52B 高性能开源多语言大模型。

据悉,Tele-FLM 能力比肩甚至超过 GPT-3.5通过损失预测等技术,提高了基础模型的能力,BPB loss 指标在英文上优于 Llama2-70B 和 Llama3-8B,在中文上优于 Qwen1.5-72。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上 Tele-FLM 完成了对 GPT-3.5-Turbo 的超越。在分项得分中,Tele-FLM 在总共的 11 个分项中有十项达到或超过 GPT-3.5-Turbo 水平。

仅今年,TeleAI 便相继开源 7B、12B 参数规模大模型,吸引国内外开源社区开发者广泛讨论和使用。此次与智源联合发布的 52B 参数规模 Tele-FLM 也已全面开源,基础模型已发布在 Hugging Face 上;核心技术如超参搜索、稳定训练等全面公开在 GitHub 上,超参搜索曲线、Loss 曲线、GradNorm、过程评测等多维度训练细节也已在技术报告中详细阐述。

据悉,TeleAI 将在年内开源千亿级参数大模型,构建全尺寸开源格局,通过更丰富的应用场景、更广泛的落地应用、更繁荣的行业生态,助力中国大模型技术进步与落地应用。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。