标签:AI模型
预训练就学会思考!字节、北大等用14亿参数,撬动百亿模型推理能力
Ouro模型通过循环语言模型(LoopLM)的全新范式,在预训练阶段就内化了推理能力,仅用14亿参数就实现了百亿级模型的性能。这一突破性技术由字节、加州大学等...
美团开源全模态,比肩顶级闭源模型,开源新SOTA
美团LongCat团队发布了5600亿参数的开源全模态模型LongCat-Flash-Omni,该模型能够实现毫秒级的实时音频-视觉交互。其核心是一个端到端的全模态架构,能够接...
Qwen“半成品”推理模型刷下AIME满分,俘获大批国外开发者!实测碾压GPT-5 Thinking、还能写侦探小说
阿里最新发布的推理模型Qwen3-Max-Thinking引起广泛关注,该模型是Qwen3-Max-Preview的推理增强版本,目前仍处于训练阶段。尽管是中间检查点模型,但结合工具...
美团新独立APP,点不了菜只能点AI
美团最新开源的多模态模型LongCat-Flash-Omni实现了全模态实时交互能力,在Omni-Bench等综合性基准测试中超越同类开源模型,达到与闭源Gemini-2.5-Pro相当的...
Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜
美国两款主流AI编程工具Cursor和Windsurf近期发布的新模型被曝与中国开源大模型存在关联,引发技术社区广泛讨论。Cursor的Composer-1模型在运行中意外输出中...
最新外国「自研」大模型,都是套壳国产?
Cursor发布的2.0版本更新中,其自主研发的代码模型Composer表现出与国产模型相似的行为特征,在推理过程中频繁输出中文内容,引发开发者对其技术来源的猜测。...
开源大模型SOTA又刷新!中国MiniMax M2全球排名第五,开源榜一
MiniMax作为中国AI独角兽企业,近期发布了专为智能体和代码任务设计的新一代模型M2,在开源领域刷新了多项性能纪录。M2以Claude Sonnet 8%的价格实现了近两倍...
吴恩达关注的Ling-1T背后,蚂蚁Ling 2.0技术报告解密万亿模型开源配方
蚂蚁集团最新开源模型Ling-1T因其卓越性能引发业界关注,其技术核心在于通过创新的架构设计和训练方法,模糊了推理与非推理模型的界限。该模型在预训练阶段强...
全球OCR最强模型仅0.9B!百度文心衍生模型刚刚横扫4项SOTA
百度最新发布的自研多模态文档解析模型PaddleOCR-VL以0.9B轻量级参数量,在OmniDocBench V1.5榜单上以92.6分斩获全球综合性能第一。该模型在文本识别、公式识...
「性价比王者」Claude Haiku 4.5来了,速度更快,成本仅为Sonnet 4的1/3
Anthropic近期发布了轻量级AI模型Claude Haiku 4.5,主打「更便宜、更快速」的特点。该模型在编码性能上可与中高端模型Claude Sonnet 4媲美,但成本仅为后者...







