推理 | 第 5 页 | 学习AIGC

微软开源新版ph4：媲美DeepSeek-R1，参数暴降48倍

微软近期在官网开源了三个新版Phi-4小参数模型，分别是Reasoning、Min-Reasoning和Reasoning-plus。这些模型的最大亮点之一是算力消耗极低，能够在消费级硬件...

AIGC动态

10个月前

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

英伟达最新发布的Llama-Nemotron系列模型在推理性能和内存效率上超越了DeepSeek-R1，并且已经全面开源。这一系列模型包括LN-Nano 8B、LN-Super 49B和LN-Ultra...

AIGC动态

10个月前

o3一张图锁定地球表面坐标，AI看图猜地点战胜人类大师，奥特曼：这是我的「直升机」时刻

ChatGPT通过一组公开的prompt，展示了其在看图猜地点任务中的惊人能力。在一系列测试中，ChatGPT不仅能够根据图像中的细节推断出大致的地理位置，甚至在某些...

AIGC动态

10个月前

Windsurf团队关于Agent的认知，相当精彩

Agent 系统的核心概念可以简单理解为一个接受用户输入，并交替执行两种调用的系统：大语言模型（LLM）和工具。LLM 会根据用户输入、上下文信息以及对话内容，...

AI-Agent

11个月前

小米入局大模型赛道！开源MiMo-7B，性能超o1-mini

小米近日宣布进军大模型领域，并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数，但其在多个测试中表现优异，在数学AIME24/25中分别达到68.2分和55.4...

AIGC动态

11个月前

o3解读：OpenAI发力tool use，Manus们会被模型取代吗？

OpenAI近期发布了o3和o4-mini两个新模型，标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT（C...

AI-Agent

11个月前

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文，提出了一种通过低秩自适应（LoRA）技术实现的高效推理模型。该模...

AIGC动态

11个月前

Qwen3真香！通义App满血接入，一手实测在此

开源大模型Qwen3的发布引发了广泛关注，成为全球最强开源模型之一。该模型在多个领域展现出卓越性能，尤其是在编程、逻辑推理和多语言处理方面。Qwen3的参数...

AIGC动态

11个月前

人人都能有一个满血DeepSeek？清华90后出手，10万块畅玩FP8原版

一款由清华90后团队打造的AI利器——行云褐蚁一体机，首次实现了以14.9万元的低成本流畅运行满血版DeepSeek模型，并支持顶配的128K上下文，性能媲美百万级方案...

AIGC动态

11个月前

刚刚，Qwen3 终于发布！混合推理模式、支持MCP，成本仅DeepSeek R1三分之一，网友喊话小扎：工程师要赶紧加班了

阿里巴巴发布了新一代通义千问模型 Qwen3，该模型采用混合专家（MoE）架构，总参数量为 235B，但激活仅需 22B，显著降低了成本。Qwen3 在性能上全面超越了 De...

AI-Agent

11个月前

标签：推理

微软开源新版ph4：媲美DeepSeek-R1，参数暴降48倍

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

o3一张图锁定地球表面坐标，AI看图猜地点战胜人类大师，奥特曼：这是我的「直升机」时刻

Windsurf团队关于Agent的认知，相当精彩

小米入局大模型赛道！开源MiMo-7B，性能超o1-mini

o3解读：OpenAI发力tool use，Manus们会被模型取代吗？

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

Qwen3真香！通义App满血接入，一手实测在此

人人都能有一个满血DeepSeek？清华90后出手，10万块畅玩FP8原版

刚刚，Qwen3 终于发布！混合推理模式、支持MCP，成本仅DeepSeek R1三分之一，网友喊话小扎：工程师要赶紧加班了

热门网址

标签：推理

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址