大模型

LLM,VLM,模型

硅光芯片,代工大战

AI大模型向千亿、万亿参数迭代推动算力需求指数级爆发,传统电信号传输受限于能耗与距离瓶颈,难以支撑AI训练的庞大流量。硅光子技术以光子传输数据,成为解...

1500 个 PR、0 人写代码:Codex 驱动的百万行级内部产品实践

一支团队开展了为期五个月的挑战,开发并发布一款完全无人工编写代码的内部测试产品,该产品已拥有内部日活用户与外部Alpha测试人员,在真实开发环境中运行迭...

Claude被特朗普封杀24小时登顶App Store,CEO含泪首发声!

OpenAI与五角大楼达成合作合同的行为,引发全网强烈不满。此前Anthropic因坚守不进行大规模监视、不开发自主武器的两条红线,错失2亿美金军方大单,而OpenAI...

Nano Banana 2 来了:价格便宜速度快,从炫技回到实用

2月26日晚间,谷歌在Gemini App、Google Search及开发者API等平台上线Nano Banana 2(技术代号Gemini 3.1 Flash Image)。这款全新模型融合了此前Nano Banana...

GPT之父Alec Radford新作:给大模型做「脑部手术」,危险知识重学成本暴增7000倍

出生于1993年的独立研究员Alex Radford,作为GPT、GPT-2和CLIP等核心项目的第一作者,近期与Anthropic及斯坦福研究者Neil Rathi联合发布新研究,挑战大模型安...

北大林宙辰团队:从最优传输角度训练时序预测模型 丨ICLR 2026

时间序列预测领域中,模型结构持续从循环网络演进至Transformer、频域与混合结构,但几乎所有方法在训练阶段依赖同一类损失函数,即以均方误差(MSE)为代表...

对话李笛:异构多智能体,让 AI 学会真正的「群体思考」

曾主导微软小冰项目的李笛,因内部矛盾离开小冰后创立Nextie,核心聚焦于群体智能尤其是异构多智能体的研发。他认为,相比陷入同质化内卷的单一大模型,AI行...

全行业盯了两年的编程能力榜,今天退役!OpenAI 停用 SWE-bench Verified:未来标准将看 AI 能顶替多少程序员?

OpenAI正式宣布SWE-bench Verified逐步退出舞台,建议转向SWE-bench Pro。曾作为代码评测“北极星”的Verified,如今因多重问题不再适配前沿模型评测:最严重的...

何恺明团队新作GeoPT,全新预训练范式用合成动力学让模型自学真实物理规律

物理仿真的规模化应用面临两大核心瓶颈,制约着数据驱动型神经网络仿真器的发展。一方面是标注成本极高,训练仿真器依赖传统数值求解器生成的监督数据,一个...

阶跃星辰杀入季后赛,强势跻身AI“新六小虎”第一梯队

国产大模型圈的季后赛已紧锣密鼓拉开帷幕。一方面,字节豆包、阿里千问、腾讯元宝等巨头砸超40亿元红包吸引用户,除夕夜豆包AI互动达19亿次,千问“一句话下单...
1 5 6 7 8 9 841