当前位置：首页 > 数码 > 商汤科技发布书生浦语大模型中文考试超越ChatGPT

商汤科技发布书生浦语大模型中文考试超越ChatGPT

数码
2024-10-26 12:49
0

【CNMO新闻】大模型的热潮正席卷各行各业，据CNMO了解，近日，行业领先的人工智能软件公司商汤科技与上海AI实验室等发布了“书生·浦语”大模型。

商汤科技

据媒体报道，商汤科技、上海AI实验室联合香港中文大学、复旦大学和上海交通大学发布千亿级参数大语言模型“书生·浦语”（InternLM）。据悉，“书生·浦语”具有1040亿参数，基于“包含1.6万亿token的多语种高质量数据集”训练而成。

从全面评测结果来看，“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀，而且具备很强的综合能力。其在综合性考试中更是表现突出，在多项中文考试中取得超越ChatGPT的成绩，其中就包括中国高考各个科目的数据集。

CNMO获悉，早在今年3月，商汤科技便发布了多模态多任务通用大模型“书生（INTERN）2.5”。据官方介绍，“书生2.5”实现了通过文本来定义任务，并根据给定视觉图像和任务的提示性语句，给出相应的指令或作答，进而具备通用场景下的高级感知和复杂问题处理能力，比如图像描述、视觉问答、视觉推理和文字识别等。此外，其还可根据用户提出的文本创作需求，利用扩散模型生成算法，生成写实图像。

据悉，“书生2.5”在图文跨模态领域的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合。此次最新发布的千亿级参数大语言模型“书生·浦语”，想必和“书生2.5”大模型有一定联系。