周鸿祎盛赞其为中国AI产业的里程碑国产大模型震惊海外

导读：前几天，中国六代战机曝光，外网闹翻天了。这还不够，这两天，中国大模型又出了新版本，致使海外AI社区刷屏。国内AI创业公司DeepSeek发布了新的开源大模型，其参数量为6000多亿，性能赶上了GPT-4o和Facebook的羊驼，但训练成本比它们降低了10倍，价格仅为它们的10%。该模型推出后，明显能感觉到海外AI技术人才对中国AI技术的进步，处于半震惊半懵的状态。

DeepSeek大模型引发海外关注

DeepSeek发布的新开源大模型，其参数量为6000多亿，性能赶上了GPT-4o和Facebook的羊驼，但训练成本比它们降低了10倍，价格仅为它们的10%。

该模型推出后，海外AI技术人才对中国AI技术的进步感到惊讶和疑惑。Meta的一位科学家惊叹，DeepSeek的训练像是黑科技。OpenAI的一位创始团队成员称，以前达到DeepSeek这种级别能力通常需16000个GPU，而现在DeepSeek只用2000个GPU，计算量减少了11倍，这证明AI算法还有很大优化空间。

DeepSeek：来自东方的神秘力量

DeepSeek是一家低调的AI创业公司。其背后是量化私募的巨头幻方公司。DeepSeek首次被人记住是因其发布2.0开源模型时提供了史无前例的性价比，模型推理成本降至每百万个token约一元，约为LLaMA的1/7、GPT的1/70，故而DeepSeek被称为AI界的拼多多，掀起国产大模型价格战，字节跳动、腾讯、百度、阿里纷纷降价。

中国大模型技术进步显著

DeepSeek发布的模型有力回击了那些认为中国AI技术落后美国的言论。微软、脸书、谷歌都在朝着10万卡集群做大模型训练时，DeepSeek仅用2000个GPU，花费不到600万美金和两个月时间，就做出一个与全球顶尖大模型能力对齐的开源大模型。

除了DeepSeek，阿里、百川智能、360等公司也推出了先进的国产大模型。这些大模型在视觉推理、数学和科学问题表现上与国外大模型相比毫不逊色，甚至在某些方面超过了国外大模型。

中国AI产业发展前景光明

中国AI技术进步显著，在AI大模型领域取得了突破。这表明，中国AI产业发展前景光明。未来，中国AI公司将不断创新，推出更多先进的大模型，为全球AI产业的发展做出贡献。

作者

本文由张伟俊撰写，发表于2023年3月8日。张伟俊是TechCrunch中文版主编，关注人工智能、大数据、云计算等领域。

AI资讯 # ai产业 # 中国 # 周鸿 # 模型 # 第六代战斗机

文章版权归作者所有，未经允许请勿转载。

吃瓜群众的福音 AI时间线梳理神器阿里巴巴CHRONOS

AI资讯 # AI时间线梳理神器 # 吃瓜群众的福音 # 阿里巴巴CHRONOS

1周前

03060

新360集团创始人周鸿祎领衔主演AI题材短剧将AI特效与智能硬件完美融合

AI资讯 # 360集团创始人周鸿祎领衔主演AI题材短剧 # 将AI特效与智能硬件完美融合

3天前

03340

新计算机知识与科学思维的盛宴备受期待的图灵宇宙系列即将推出！

AI资讯 # 人工智能 # 图灵宇宙 # 科学院软件研究所

6天前

01060

全资成立墨甲智创奇瑞汽车布局智能机器人与人工智能

AI资讯 # 全资成立墨甲智创 # 奇瑞汽车布局智能机器人与人工智能

1周前

01790

暂无评论

暂无评论...

周鸿祎盛赞其为中国AI产业的里程碑国产大模型震惊海外

DeepSeek大模型引发海外关注

DeepSeek：来自东方的神秘力量

中国大模型技术进步显著

中国AI产业发展前景光明