新古董级GPU也能流畅运行DeepSeek同款GRPO,显存需求仅1GB,性能不减当年! 最近,开源微调工具Unsloth再次引起了广泛关注。这次,它带来了对DeepSeek-R1同款GRPO训练算法的进一步优化,显著提升了性能。Unsloth在短短两周内,成功将上下文的长度扩展了10倍,... AI资讯# DeepSeek# gpu# 上下文 20小时前02280
新谷歌AI掌门人Jeff Dean与Transformer作者深度对话:AI性能提升300%,未来或将迎来1000万倍工程师时代 在最近的一次深度访谈中,谷歌首席科学家JeffDean与Transformer的创始人NoamShazeer分享了关于人工智能(AI)领域的一些关键技术和未来展望。这次访谈不仅揭示了低精度计算技术如何... AI资讯# jeff# 上下文# 大模型 4天前01840
新单提示生成「主体一致」图像技术突破:无需训练即实现高质量输出,荣获ICLR 2025 Spotlight认可 在当今的AI领域,文本到图像的生成技术已经取得了显著的进步,尤其是在生成高质量图像方面。当涉及到生成一系列连贯的故事图像,特别是要求故事中的人物在不同场景中保持一致时,现有的技术仍面临挑战。南开大学和... AI资讯# 上下文# 主体一致 5天前01340
新大模型「记忆断片」成历史! 在当今人工智能领域,大模型的性能不断提升,其能够处理的上下文长度也随之增加。一旦超出上下文窗口的限制,大模型就需要重新开始对话,这就像“失忆”一样,忘记了之前交流的内容。😅从用户的角度来看,智能体应该... AI资讯# zep系统# 上下文# 云计算费用 5天前01260
新全面增强LLM推理 从基础理论到实践应用的深度探索 ,不仅解决了大语言模型在多轮会话中的诸多问题,还通过一致性奖励模型和局部思考上下文系统等创新方法,显著提升了模型的推理、计划及执行能力,这些贡献为未来大语言模型的发展提供了新的方向和思路,😊...。 AI资讯# 上下文# 云计算费用# 北航 5天前02520