AIGC动态

AIGC,AGI,人工智能

国产 DeepSeek V3 被秒成”前浪”?谷歌开放最强 Gemini 2.0 全家桶:速度快60倍,上下文还长16倍!

谷歌发布了 Gemini 2.0,这是一套功能强大的人工智能模型,包含多个版本以满足不同需求。Gemini 2.0 Flash 是主打高效性和低延迟的主力模型,具备处理多模态...

创历史!DeepSeek获16大国产AI芯片力挺,中国智算的半壁江山都出动了

DeepSeek作为国产AI大模型,在短时间内获得了广泛的产业支持。首先,16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,其中包括华为昇腾、沐曦、天数...

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

近期研究围绕类 R1-Zero 的训练展开,聚焦于模型自我反思能力及响应长度变化的机制。研究表明,“顿悟时刻”并非如以往所认为出现在强化学习(RL)训练后,而是...

小米市值突破 1 万亿,造小米 SU7 成了雷军最好的决策

小米集团的港股在2025年初迎来了显著上涨,市值突破万亿港元大关,达到1.02万亿港元,创下历史新高。这一表现不仅超越了恒生科技指数的增长幅度,也在科技巨...

微软官宣All in智能体,SWE Agent首曝光!奥特曼预警2025编程巨变

2025年,软件工程领域将迎来重大变革,AI智能体的全面应用将成为这一变化的核心推动力。微软GitHub Copilot的全新升级展示了自主SWE智能体(项目代号Padawan...

架构创新×模型创新!清微智能全面适配DeepSeek模型推理和训练

大模型时代的到来使算力成为技术发展的核心驱动力,同时也带来了大规模、高弹性、低成本的算力需求挑战。为了应对这一趋势,清微智能推出了基于可重构计算架...

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

群组相对策略优化(GRPO)作为一种在线学习算法,通过使用训练过程中由模型自身生成的数据进行迭代改进,已因其高效性和易用性成为大型语言模型强化学习中的...

美国朝中国DeepSeek打了一记重拳|钛媒体AGI

DeepSeek作为中国开源AI公司,其迅速崛起在全球范围内引发了广泛的关注与讨论。美国企业界、学术界和政府机构已展开多方面的应对行动,试图在技术、政策和投...

台积电眼里的晶体管未来

半导体技术自20世纪中叶以来深刻改变了工业和社会,其发展历程以晶体管的发明为起点。点接触晶体管的发明与双极结型晶体管的发展开启了半导体时代,锗最初因...

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...
1 446 447 448 449 450 1,143