标签:AI模型

自有歪果仁为DeepSeek「辩经」:揭穿围绕DeepSeek的谣言

DeepSeek R1,一款由中国公司DeepSeek开发的先进大模型,因其开源和性能与OpenAI的o1相当而引发全球关注。该模型以其相对较低的训练预算、易用性和良好的用户...

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

阿里巴巴推出的Qwen2.5-Max模型在大模型竞技场榜单上取得了显著成绩,以总分1332位列第七,并在编程和数学领域表现突出,与顶级模型并列第一。Chatbot Arena...

为什么说DeepSeek的R1-Zero比R1更值得关注?

DeepSeek发布的R1-Zero和R1两个模型在ARC-AGI-1上的得分与OpenAI的o1系统低计算量版本相当,显示出纯LLM scaling的局限性。R1-Zero特别值得关注,因为它完全...

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025年初,中国团队DeepSeek在全球AI领域引起广泛关注,他们仅用2048张H800 GPU在两个月内训练出一个与全球顶尖水平相媲美的AI模型,这一成就不仅挑战了英伟...

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...

滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion

DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...

DeepSeek的提示词技巧,就是没有技巧。

DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...

变天!——由一个惊艳例子引发对 DeepSeek 的 10 条思考

DeepSeek R1模型以其卓越的性能在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后的心理活动的问题时,展现了深入的历史背景理解、复杂的情感分...

创造历史!DeepSeek登顶AppStore,开源竞相复现、Meta 很焦虑

DeepSeek自20日发布以来,其iOS应用下载量超越了ChatGPT官方应用,登顶AppStore。这一成就得到了广泛认可,DeepSeek-R1迅速成为美国顶尖大学研究人员的首选模...

最懂医疗的国产推理大模型,果然来自百川智能

近期,全球AI大模型领域竞争加剧,百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview,具备语言、视觉和搜索推理能力,在多个领域评测中表现优异...
1 3 4 5 6 7 19