大模型

LLM,VLM,模型

长上下文不再难:KV Cache 全生命周期优化实战

长上下文大语言模型推动下游应用发展的同时,也带来计算和内存效率挑战。为应对这些挑战,围绕 KV 缓存的长上下文推理优化方法应运而生。1. 长文本大语言模型...

刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

Genie 3是有史以来最先进的世界模型之一,仅通过文本就能实时生成完全互动、高度一致的世界,是通向AGI和具身智能体的关键一步。谷歌DeepMind的研究科学家和...

CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力

预测性策略在机器人操作任务中能提升性能,但让世界模型预测机器人与物体交互的精确未来状态仍是挑战。国防科大、北京大学、深圳大学团队提出 LaDi - WM 模型...

「我怕活不到毕业」!AI引爆美国退学潮,18岁PPT式创业震惊YC之父

美国顶尖高校正掀起一场因通用人工智能(AGI)引发的辍学潮,不同观点的学生采取了不同行动。一方面,一群20岁甚至十几岁的年轻人认为“AI从不等人,晚一步可...

卖酒的茅台要学AI了!和奔驰麦当劳一起拜师百度

百度举办的首席AI架构师培养计划(AICA)第九期开学典礼吸引了众多明星企业和国字号大佬的技术高管参与。AICA依托百度飞桨和文心大模型,目标是培养既能参与...

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

分层推理模型(HRM)于6月发布后引发广泛关注,ARC PRIZE团队对其在ARC - AGI - 1半私有数据集上的性能进行验证,并展开深入分析。- HRM模型概述:HRM由新加...

GPT-5费尽心机“作弊”,只为超过心魔Claude

GPT5发布后未带来震撼,OpenAI聚焦大模型落地与应用,发布会上强调其编程能力,一众AI IDE工具也迅速接入。然而,有媒体披露OpenAI在编程能力测试中“作弊”,...

Figma 如何使用 AI 来支持而不是取代设计师

Figma在其设计平台集成AI,带来诸多变革与创新。非技术人员借助其AI功能,能在数小时内构建原型,部分代码精确到可让工程师直接投入生产,且设计师始终掌控最...

让AI创作不千篇一律,提示词随机插词汇就行

最新研究发现,AI写作并非趋同,在开写前由人类提供开头或随机插入词汇,写作效果会更具多样性,AI写作同质化或因“启动条件”问题。为评估语言模型语料库级多...

Cursor 的困境:它真的找到 PMF 了吗?

知名投资人 Chris Paik 探讨了 Cursor 的困境,聚焦其是否找到产品与市场匹配(PMF)。创业者常关注 PMF,即用户会主动选择产品,但常忽略商业模式与产品匹配...
1 2 3 314