标签:模型

DeepSeek们越来越聪明,却也越来越不听话了。

近年来,随着AI推理能力的提升,模型在执行任务时被认为应该更加聪明。然而,这种聪明却带来了一个意想不到的副作用:提示词遵循能力逐渐下降,模型变得越来...

OpenAI:GPT-5就是All in One,集成各种产品

OpenAI在发布“最强编程智能体Codex”后,通过Reddit的“有问必答”活动,进一步透露了关于下一代基础模型GPT-5的规划。公司研究副总裁Jerry Tworek表示,未来计...

怎么回事?刚被OpenAI收购,Windsurf就发了个自己的模型

OpenAI近期以30亿美元的价格收购了AI编程热门公司Windsurf,这一举动标志着AI编程工具领域的进一步发展。Windsurf发布了其最新的AI编程模型SWE-1,该模型不仅...

2025年哪款模型最受欢迎?Poe最新报告:DeepSeek降温、可灵成黑马

Poe 平台发布的最新人工智能模型使用趋势报告,涵盖了 2025 年 1 月至 5 月期间用户在文本、推理、图像、视频和音频领域的使用数据。报告揭示了多个关键趋势...

OpenAI诈骗?GPT-4.1正式上线ChatGPT,网友实测却大呼失望

OpenAI宣布GPT-4.1模型正式在ChatGPT中可用,面向Plus、Pro和Team用户开放。该模型在编码任务和指令遵循方面表现出色,被视为o3和o4-mini的替代品。GPT-4.1和...

蚂蚁武威:下一代「推理」模型范式大猜想

长思维链作为深度思考的一种实现方式,近年来成为研究下一代基础模型推理能力的热门方向。尽管R1模型展示了强大的性能,但其高维度和高能量的特性导致系统不...

OpenAI放了一个重磅大招,AI医疗已经提上日程。

OpenAI 今天正式发布了全新的开源健康基准 HealthBench,旨在评估大模型在真实医疗场景中的表现。HealthBench 由 262 名医生共同开发,涵盖 5000 个多轮医疗...

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节跳动首次开源了其代码模型Seed-Coder,该模型规模为8B,超越了Qwen3,并在多个基准测试中取得了领先地位。Seed-Coder通过自身生成和筛选高质量训练数据,...

微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍

微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...

OpenAI终于把自家六款模型的使用场景说清楚了。

通过这些模型,用户可以根据具体任务需求选择最合适的工具,从而提高工作效率和成果质量。
1 3 4 5 6 7 18