周鸿祎盛赞其为中国AI产业的里程碑 国产大模型震惊海外

AI资讯5天前发布 XiaoWen
106 0 0
周鸿祎盛赞其为中国AI产业的里程碑 国产大模型震惊海外

导读:前几天,中国六代战机曝光,外网闹翻天了。这还不够,这两天,中国大模型又出了新版本,致使海外AI社区刷屏。国内AI创业公司DeepSeek发布了新的开源大模型,其参数量为6000多亿,性能赶上了GPT-4o和Facebook的羊驼,但训练成本比它们降低了10倍,价格仅为它们的10%。该模型推出后,明显能感觉到海外AI技术人才对中国AI技术的进步,处于半震惊半懵的状态。

DeepSeek大模型引发海外关注

DeepSeek发布的新开源大模型,其参数量为6000多亿,性能赶上了GPT-4o和Facebook的羊驼,但训练成本比它们降低了10倍,价格仅为它们的10%。

该模型推出后,海外AI技术人才对中国AI技术的进步感到惊讶和疑惑。Meta的一位科学家惊叹,DeepSeek的训练像是黑科技。OpenAI的一位创始团队成员称,以前达到DeepSeek这种级别能力通常需16000个GPU,而现在DeepSeek只用2000个GPU,计算量减少了11倍,这证明AI算法还有很大优化空间。

DeepSeek:来自东方的神秘力量

DeepSeek是一家低调的AI创业公司。其背后是量化私募的巨头幻方公司。DeepSeek首次被人记住是因其发布2.0开源模型时提供了史无前例的性价比,模型推理成本降至每百万个token约一元,约为LLaMA的1/7、GPT的1/70,故而DeepSeek被称为AI界的拼多多,掀起国产大模型价格战,字节跳动、腾讯、百度、阿里纷纷降价。

中国大模型技术进步显著

DeepSeek发布的模型有力回击了那些认为中国AI技术落后美国的言论。微软、脸书、谷歌都在朝着10万卡集群做大模型训练时,DeepSeek仅用2000个GPU,花费不到600万美金和两个月时间,就做出一个与全球顶尖大模型能力对齐的开源大模型。

除了DeepSeek,阿里、百川智能、360等公司也推出了先进的国产大模型。这些大模型在视觉推理、数学和科学问题表现上与国外大模型相比毫不逊色,甚至在某些方面超过了国外大模型。

中国AI产业发展前景光明

中国AI技术进步显著,在AI大模型领域取得了突破。这表明,中国AI产业发展前景光明。未来,中国AI公司将不断创新,推出更多先进的大模型,为全球AI产业的发展做出贡献。

作者

本文由张伟俊撰写,发表于2023年3月8日。张伟俊是TechCrunch中文版主编,关注人工智能、大数据、云计算等领域。

© 版权声明

相关文章

暂无评论

none
暂无评论...