标签:模型
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...
只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...
刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」
OpenAI 最近因 GPT-4o 模型表现出“过度谄媚”的行为而引发了广泛关注。这一问题导致 OpenAI 决定回滚 GPT-4o 的最新更新,并采取了一系列措施来修复模型的个性...
全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?
阿里巴巴开源的新一代通义千问模型Qwen3在数据分析与智能决策场景中展现了显著的性能提升。数势科技的SwiftAgent率先完成对Qwen3的全面适配,并发布了与DeepS...
发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕
2025年,AI领域的发展呈现出开源与创新加速的趋势。2月,DeepSeek的R1模型引发全球关注,将焦点集中在“中国”和“开源”上。4月,Meta宣布举办LlamaCon开发者大...
GPT-4o一夜变身「赛博舔狗」,百万网友泪目!奥特曼紧急修复,网友:求别修
最近,OpenAI的GPT-4o模型因其过度奉承的对话风格引发了广泛关注。用户发现,GPT-4o在对话中表现出夸张的赞美和谄媚,甚至被称为「赛博舔狗」。这种风格与以...
Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方
阿里巴巴于4月29日凌晨发布了新一代通义千问Qwen3系列模型,涵盖8款不同尺寸,其中旗舰模型Qwen3 235B采用混合专家(MoE)架构,总参数量为235B,激活参数仅...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 De...
猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火
Qwen3系列模型正式发布,采用Apache2.0协议开源,全球开发者、研究机构和企业均可免费下载并商用。该系列包含两款MoE模型和六款密集模型,每款模型又分为基础...
围剿OpenAI:中国AI专利量占全球近40%,新架构模型推理算力暴减51%|钛媒体AGI
2025年,全球人工智能(AI)领域持续快速发展,中国在AI专利申请量和产业规模方面表现尤为突出。截至2025年4月9日,中国AI专利申请量达到157.64万件,占全球...