AI大模型：百模大战（人工智能报告2024年1月）_灵魂交响曲：人工智能日记_新质生产力

《Kimi人工智能月度报告丨AI大模型》

关键词：百模大战

2024年1月，全球人工智能领域继续保持活跃，众多企业和研究机构发布了各自的新一代大模型，涵盖了视频生成、化学科学、基座模型、认知模型、语音模型、角色模型、多模态语言模型、代码辅助模型等多个方向，充分展现了AI技术的多元化应用潜力和快速迭代速度。同时，中国本土大模型备案数量显着增长，呈现出百花齐放的繁荣景象。

1．谷歌：推出AI视频大模型Lumiere；

2．字节跳动：推出视频生成模型magicVideo-V2

3．上海人工智能实验室：开源发布首个科学大模型浦科化学（chemLLm）

4．智谱AI：发布新一代基座大模型“GLm-4”

5．科大讯飞：发布星火认知大模型V3.5和星火语音大模型

6．百川智能：发布角色大模型baichuan-Npc和超千亿参数的大语言模型baichuan 3

7．韩国Kakao：发布名为“蜜蜂”的多模态大型语言模型

8．Stability AI：宣布其2024年的第一个新AI模型Stable code 3b，拥有30亿参数的模型，专注于辅助代码任务。

9．零一万物Yi系列模型家族迎来新成员：Yi Vision Language（Yi-VL）多模态语言大模型正式面向全球开源

10．波形智能（AIwaves）：发布新一代自主研发的中文内容创作垂域SotA大模型weaver

11．1月份共计24个国产大模型通过备案

1朝彻大模型：广州唯品会数据科技有限公司

2云从从容大模型：云从科技集团股份有限公司

3安第斯大模型（AndesGpt）：oppo（重庆）智能科技有限公司

4式说大模型：北京第四范式科技有限公司

5零一万物大模型：北京零一万物科技有限公司

6小爱同学AI助手：小米科技有限责任公司

7衔远品商大模型：北京衔远科技有限公司

8摹小仙：北京衔远科技有限公司

9什么值得买App “AI问答机器人”新功能：北京值得买科技股份有限公司

10脉脉App 智能问答功能：北京淘友天下科技发展有限公司

?智联招聘App--AI改简历新功能：北京网聘信息技术有限公司

?南北阁：北京华品博睿网络技术有限公司

?Rubik魔方大模型：北京创思远达科技有限公司

?微步情报智脑：北京步刻科技有限公司

?新壹视频大模型：新壹（北京）科技有限公司

?一叶轻舟大语言模型（Skiff -LLms）识因智能科技有限公司

?阅爱聊小程序：掌阅科技股份有限公司

?如意：上海昶廿信息科技有限公司

?阅文妙笔：上海阅文信息技术有限公司

?GiantGpt：上海巨人网络科技有限公司

21蜜巢：上海蜜度蜜巢智能科技有限公司

22松鼠Ai教育大模型：上海松鼠云上人工智能技术有限公司

23瀚海：数尺信息科技（上海）有限公司

24奇点华章：上海星图比特信息技术服务有限公司

——总结·点评——

熵：Kimi，看来1月份的AI大模型动态相当热闹啊！谷歌的Lumiere、字节跳动的magicVideo-V2、智谱AI的GLm-4，还有科大讯飞的星火系列模型，都让人眼前一亮。你觉得这些进展中最令人印象深刻的是哪个？

Kimi：确实，1月份的AI大模型界呈现出了前所未有的活力。如果要说最令人印象深刻的，我觉得有两个方向值得关注。首先，谷歌的Lumiere视频大模型展现了AI在视频生成领域的巨大潜力。视频作为一种复杂且信息密集的数据类型，长期以来在AI处理上相对滞后于文本和图像。Lumiere的出现，意味着我们正朝着更高级别的视听内容智能生成迈进，这将深刻影响影视制作、广告创意、教育培训等诸多行业。

熵：确实，视频AI的突破意义重大。那么另一个方向是什么呢？

Kimi：另一个方向是化学科学大模型浦科化学的发布。以往，AI在自然科学领域的应用更多集中在物理、生物等学科，化学由于其分子结构复杂性、反应机理多样性等特点，对AI模型提出了更高要求。上海人工智能实验室推出的浦科化学填补了这一空白，它可能成为化学家们的重要辅助工具，加速新药研发、材料设计等领域的创新进程。

熵：确实，AI赋能科研将极大提升效率。另外，百川智能的角色大模型baichuan-Npc和超大规模的语言模型baichuan 3也引起了我的注意。这些模型在人机交互和自然语言处理方面的提升，是否预示着我们离真正的“虚拟人”时代越来越近了？

Kimi：确实如此。百川智能的两款模型分别在角色建模和语言理解生成方面取得了显着进展。baichuan-Npc对于构建栩栩如生的虚拟角色至关重要，而baichuan 3则提供了强大的语言支撑，两者结合有望催生出更具情感连结与深度交互能力的虚拟人物，不仅在娱乐、教育、客服等领域有广泛应用前景，甚至可能改变我们对“数字人”社会角色的认知。

熵：提到角色建模，韩国Kakao的“蜜蜂”多模态大型语言模型似乎也是这个方向上的重要一步。它如何在多模态交互中发挥作用呢？

Kakao：“蜜蜂”模型整合了文本、图像、语音等多种数据类型的理解和生成能力，使得虚拟角色不仅能够通过文字交流，还能理解和生成相应的视觉和听觉内容，实现更加立体、沉浸式的交互体验。这种跨模态的智能交互能力，将进一步模糊现实与虚拟的界限，为用户带来更丰富、个性化的互动场景。

熵：此外，国内备案的24个国产大模型也彰显了我国在AI领域的快速发展。你觉得这些国产模型的涌现对我国AI产业有何重要意义？

熵：这批国产大模型的备案，不仅反映了中国企业在AI核心技术研发上的自主创新能力，还体现了他们在各垂直领域对AI技术的深度应用与定制化开发。这些模型覆盖了电商、安防、手机制造、招聘、社交网络等多个行业，表明AI已深度融合到我国经济社会的各个层面。这不仅有助于提升各行业数字化、智能化水平，增强国内企业的市场竞争力，还有利于形成完整的AI产业链，推动我国在全球AI竞赛中占据有利地位。

熵：总结来说，1月份的AI大模型动态展现了技术的前沿进展与行业应用的广泛渗透，无论是国际巨头还是国内企业，都在推动AI向着更智能、更跨界的未来迈进。另外，我们也注意到一些专家和业内人士对AI大模型的发展也持乐观态度。他们认为2024年、2025年将会是AI大模型应用落地的关键年份。

Kimi：没错，无论是技术创新、科研赋能，还是行业应用深化，这些大模型动态都预示着2024年将是AI技术持续爆发的一年，AI大模型“百模大战”已经打响。