标签:模型

字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式

字节跳动首次开源了其代码模型Seed-Coder,该模型规模为8B,超越了Qwen3,并在多个基准测试中取得了领先地位。Seed-Coder通过自身生成和筛选高质量训练数据,...

微软开源新版ph4:媲美DeepSeek-R1,参数暴降48倍

微软近期在官网开源了三个新版Phi-4小参数模型,分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低,能够在消费级硬件...

OpenAI终于把自家六款模型的使用场景说清楚了。

通过这些模型,用户可以根据具体任务需求选择最合适的工具,从而提高工作效率和成果质量。

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

谷歌最新发布的Gemini 2.5 Pro Preview(I/O版)在多个领域取得了显著突破,尤其是在编程、视觉和文本处理方面表现卓越。该模型在LMeana基准测试中斩获三连冠...

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1,并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...

o3解读:OpenAI发力tool use,Manus们会被模型取代吗?

OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...

只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍

南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...

刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」

OpenAI 最近因 GPT-4o 模型表现出“过度谄媚”的行为而引发了广泛关注。这一问题导致 OpenAI 决定回滚 GPT-4o 的最新更新,并采取了一系列措施来修复模型的个性...

全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?

阿里巴巴开源的新一代通义千问模型Qwen3在数据分析与智能决策场景中展现了显著的性能提升。数势科技的SwiftAgent率先完成对Qwen3的全面适配,并发布了与DeepS...

发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕

2025年,AI领域的发展呈现出开源与创新加速的趋势。2月,DeepSeek的R1模型引发全球关注,将焦点集中在“中国”和“开源”上。4月,Meta宣布举办LlamaCon开发者大...
1 4 5 6 7 8 19