大模型

LLM,VLM,模型

AI写代码新姿势:一个截图,代替千行代码

商汤科技在GDC全球开发者先锋大会上发布了办公小浣熊2.0和代码小浣熊2.0的升级版本,并推出开源框架LazyLLM及万象应用开发平台。办公小浣熊2.0通过融合多模态...

1/30训练步骤复刻DeepSeek-R1-Zero,沈向洋姜大昕张祥雨等开源推理模型RL训练方法

阶跃星辰与清华大学联合发布的Open Reasoner Zero(ORZ)模型在强化学习训练方法上取得突破性进展。该研究采用极简主义方法,仅使用带有GAE的原版PPO算法和基...

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文反驳涌现

荷兰开发者Raz采用轻量级强化学习算法Reinforce-Lite,以低于10美元的成本在3B参数规模的模型上复现了DeepSeek的'顿悟时刻'。该方法通过简化传统强化学习的复...

YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世

YOLOv12通过引入创新的注意力机制和结构优化,显著提升了实时目标检测的性能与效率。该模型由纽约州立大学布法罗分校和中国科学院大学的研究团队联合开发,旨...

谷歌AI掌门人Jeff Dean对话Transformer作者:AI提速300%,1000万倍工程师要来了

谷歌首席科学家Jeff Dean与Transformer作者Noam Shazeer在访谈中揭示了AI技术发展的关键趋势与未来挑战。低精度计算技术的突破使模型推理速度提升三倍,从TPU...

干完几星期家务,1X新款人形机器人亮相,和冰箱一样安静

挪威机器人公司1X近期发布了新一代家用机器人Neo Gamma,作为Neo Beta的迭代产品,其设计目标聚焦于家庭环境测试。该机器人具备煮咖啡、洗衣、吸尘等家务能力...

DeepSeek终结了上一场AI流量战,腾讯为元宝开启了另一场

腾讯近期通过旗下产品'元宝'在AI应用领域发起新一轮竞争。元宝借助'满血版DeepSeek'的营销口号,在微信、B站、知乎等平台展开大规模广告投放,甚至包揽百度'd...

EUV技术,前景光明

人工智能芯片需求的指数级增长正推动半导体制造技术面临前所未有的挑战,其中极紫外(EUV)光刻技术成为制约产能扩展的核心瓶颈。AI加速器、GPU和高性能CPU对...

独家|字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人

字节跳动AI核心部门Seed近期经历重大人事调整,原谷歌Gemini开发团队成员吴永辉博士接替朱文佳成为负责人,标志着公司AI战略从应用层开拓转向基础模型研发。...

清华团队构建大型社会模拟器 AgentSociety ,可精确模拟社会舆论传播、公众政策响应等社会现象

清华大学跨学科团队开发的'大规模社会模拟器AgentSociety'1.0版本,通过整合大模型智能体、真实环境仿真与分布式计算框架,构建了可模拟社会舆论传播、政策响...
1 357 358 359 360 361 850