标签:大模型

“技术迭代速度是唯一护城河!”李彦宏把百度 AI 秀了个遍,还称芯片拿大部分钱的 AI 生态不健康

李彦宏在百度世界大会上系统阐述了AI产业的结构性变革与未来发展方向。当前AI产业结构正从“正金字塔”转向“倒金字塔”,即芯片层创造基础价值,模型层实现10倍...

Kimi K2 Thinking,是月之暗面的“复仇”

月之暗面发布里程碑式开源大模型Kimi K2 Thinking,在推理能力、智能体性能和量化技术上实现显著突破。该模型以1万亿参数规模采用384个专家混合架构,在HLE、...

大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南

Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LL...

全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了

百度文心5.0 Preview模型在LMArena全球文本竞技场测试中取得1432分,与OpenAI的GPT-4.5 Preview及Anthropic的两款Claude模型并列全球第二,同时位列国内第一...

英伟达、DeepSeek集体跟进!18个月前被忽视,如今统治AI推理

DistServe解耦推理理念的提出标志着AI系统正迈向模块化智能的新时代。这一由北京大学金鑫-刘譞哲团队与加州大学圣地亚哥分校Hao AI Lab联合提出的架构,在短...

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

微调超大参数模型的成本门槛已被显著降低,仅需2-4张消费级显卡即可在本地完成对DeepSeek 671B或Kimi K2 1TB等万亿级参数模型的微调。这一突破性进展源于KTra...

MiniMax和Kimi为了“注意力”,隔空交手

MiniMax和月之暗面在大模型技术路线上展现出截然不同的选择,引发了行业对注意力机制效率与性能平衡的深入探讨。MiniMax在M2模型中回归Full Attention架构,...

成功率100%!中科院发现用善意迷惑AI,能让它作恶,AI也经受不住糖衣毒药的攻击

上海工程科技大学和中国科学院计算技术研究所的研究揭示了大型语言模型(LLM)安全防御机制中存在的一种名为防御阈值衰减(DTD)的现象。研究发现,随着模型...

从 CIPS & CLM 迈进:中国大模型的智能跃迁

人工智能正以前所未有的速度重塑人类社会的运行逻辑,从语言模型掀起的认知革命到多模态、具身智能的崛起,标志着AI进入“智能共生”的新时代。在这一背景下,...
1 2 3 66