导读:前几天,中国六代战机曝光,外网闹翻天了。这还不够,这两天,中国大模型又出了新版本,致使海外AI社区刷屏。国内AI创业公司DeepSeek发布了新的开源大模型,其参数量为6000多亿,性能赶上了GPT-4o和Facebook的羊驼,但训练成本比它们降低了10倍,价格仅为它们的10%。该模型推出后,明显能感觉到海外AI技术人才对中国AI技术的进步,处于半震惊半懵的状态。
DeepSeek大模型引发海外关注
DeepSeek发布的新开源大模型,其参数量为6000多亿,性能赶上了GPT-4o和Facebook的羊驼,但训练成本比它们降低了10倍,价格仅为它们的10%。
该模型推出后,海外AI技术人才对中国AI技术的进步感到惊讶和疑惑。Meta的一位科学家惊叹,DeepSeek的训练像是黑科技。OpenAI的一位创始团队成员称,以前达到DeepSeek这种级别能力通常需16000个GPU,而现在DeepSeek只用2000个GPU,计算量减少了11倍,这证明AI算法还有很大优化空间。
DeepSeek:来自东方的神秘力量
DeepSeek是一家低调的AI创业公司。其背后是量化私募的巨头幻方公司。DeepSeek首次被人记住是因其发布2.0开源模型时提供了史无前例的性价比,模型推理成本降至每百万个token约一元,约为LLaMA的1/7、GPT的1/70,故而DeepSeek被称为AI界的拼多多,掀起国产大模型价格战,字节跳动、腾讯、百度、阿里纷纷降价。
中国大模型技术进步显著
DeepSeek发布的模型有力回击了那些认为中国AI技术落后美国的言论。微软、脸书、谷歌都在朝着10万卡集群做大模型训练时,DeepSeek仅用2000个GPU,花费不到600万美金和两个月时间,就做出一个与全球顶尖大模型能力对齐的开源大模型。
除了DeepSeek,阿里、百川智能、360等公司也推出了先进的国产大模型。这些大模型在视觉推理、数学和科学问题表现上与国外大模型相比毫不逊色,甚至在某些方面超过了国外大模型。
中国AI产业发展前景光明
中国AI技术进步显著,在AI大模型领域取得了突破。这表明,中国AI产业发展前景光明。未来,中国AI公司将不断创新,推出更多先进的大模型,为全球AI产业的发展做出贡献。
作者
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...