标签:开源

小米入局大模型赛道!开源MiMo-7B,性能超o1-mini

小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...

沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用

沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF,该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题,能够直接输出对版的精准PDF。BabelD...

o3解读:OpenAI发力tool use,Manus们会被模型取代吗?

OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...

全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?

阿里巴巴开源的新一代通义千问模型Qwen3在数据分析与智能决策场景中展现了显著的性能提升。数势科技的SwiftAgent率先完成对Qwen3的全面适配,并发布了与DeepS...

Qwen3真香!通义App满血接入,一手实测在此

开源大模型Qwen3的发布引发了广泛关注,成为全球最强开源模型之一。该模型在多个领域展现出卓越性能,尤其是在编程、逻辑推理和多语言处理方面。Qwen3的参数...

发布 Qwen3,阿里云拉开新一轮开源模型竞赛的序幕

2025年,AI领域的发展呈现出开源与创新加速的趋势。2月,DeepSeek的R1模型引发全球关注,将焦点集中在“中国”和“开源”上。4月,Meta宣布举办LlamaCon开发者大...

Qwen3发布!超DeepSeek R1登顶开源榜,还带来了跟R1不同配方

阿里巴巴于4月29日凌晨发布了新一代通义千问Qwen3系列模型,涵盖8款不同尺寸,其中旗舰模型Qwen3 235B采用混合专家(MoE)架构,总参数量为235B,激活参数仅...

刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了

阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 De...

猛击OpenAI o1、DeepSeek-R1!刚刚,阿里Qwen3登顶全球开源模型王座,深夜爆火

Qwen3系列模型正式发布,采用Apache2.0协议开源,全球开发者、研究机构和企业均可免费下载并商用。该系列包含两款MoE模型和六款密集模型,每款模型又分为基础...

图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」

全球AI大模型的发展正迅速进入“多模态时代”,这一趋势不仅体现在技术进展上,也反映在应用和落地的需求中。多模态技术已成为AI领域的关键能力,尤其是在智能...
1 2 3 22