标签:推理
小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...
只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...
Qwen3真香!通义App满血接入,一手实测在此
开源大模型Qwen3的发布引发了广泛关注,成为全球最强开源模型之一。该模型在多个领域展现出卓越性能,尤其是在编程、逻辑推理和多语言处理方面。Qwen3的参数...
人人都能有一个满血DeepSeek?清华90后出手,10万块畅玩FP8原版
一款由清华90后团队打造的AI利器——行云褐蚁一体机,首次实现了以14.9万元的低成本流畅运行满血版DeepSeek模型,并支持顶配的128K上下文,性能媲美百万级方案...
刚刚,Qwen3 终于发布!混合推理模式、支持MCP,成本仅DeepSeek R1三分之一,网友喊话小扎:工程师要赶紧加班了
阿里巴巴发布了新一代通义千问模型 Qwen3,该模型采用混合专家(MoE)架构,总参数量为 235B,但激活仅需 22B,显著降低了成本。Qwen3 在性能上全面超越了 De...
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
全球AI大模型的发展正迅速进入“多模态时代”,这一趋势不仅体现在技术进展上,也反映在应用和落地的需求中。多模态技术已成为AI领域的关键能力,尤其是在智能...
阿里千问 3 登顶全球最强开源模型,性能超越 DeepSeek-R1、OpenAI-o1
阿里巴巴最新发布的开源模型Qwen3(通义千问3)在性能、成本和灵活性方面取得了显著突破,成为全球最强开源模型。该模型采用混合专家(MoE)架构,总参数量为...
Qwen3深夜正式开源,小尺寸也能大力出奇迹。
阿里最新发布的Qwen3模型系列在多个方面展现了其技术实力和创新。Qwen3系列共包含8个不同尺寸的模型,从0.6B到235B,覆盖了从轻量级到旗舰级的应用场景。其中...
毛骨悚然!o3精准破译照片位置,只靠几行Python代码?人类在AI面前已裸奔
OpenAI的o3模型展示了通过照片识别地理位置的强大能力,引发了广泛的关注和讨论。Django Web框架的创始人Simon Wilson通过实验发现,o3能够通过Python代码和...