标签:大模型

千问APP公测,阿里AI To C这场仗怎么打?

阿里推出的个人AI助手“千问APP”以闪电之势开启公测,直接对标ChatGPT,甚至在某些功能上实现了超越。这款产品不仅具备强大的语义理解和专业信息处理能力,还...

真情实感体验了阿里「千问APP」后,为什么说它是「中国的ChatGPT」?

阿里推出千问APP,全面布局C端AI助手市场。这款应用被定位为'中国的ChatGPT',旨在成为用户日常生活中的多功能个人助手,覆盖办公、生活、娱乐等多个场景。作...

“技术迭代速度是唯一护城河!”李彦宏把百度 AI 秀了个遍,还称芯片拿大部分钱的 AI 生态不健康

李彦宏在百度世界大会上系统阐述了AI产业的结构性变革与未来发展方向。当前AI产业结构正从“正金字塔”转向“倒金字塔”,即芯片层创造基础价值,模型层实现10倍...

Kimi K2 Thinking,是月之暗面的“复仇”

月之暗面发布里程碑式开源大模型Kimi K2 Thinking,在推理能力、智能体性能和量化技术上实现显著突破。该模型以1万亿参数规模采用384个专家混合架构,在HLE、...

大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南

Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LL...

全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了

百度文心5.0 Preview模型在LMArena全球文本竞技场测试中取得1432分,与OpenAI的GPT-4.5 Preview及Anthropic的两款Claude模型并列全球第二,同时位列国内第一...

英伟达、DeepSeek集体跟进!18个月前被忽视,如今统治AI推理

DistServe解耦推理理念的提出标志着AI系统正迈向模块化智能的新时代。这一由北京大学金鑫-刘譞哲团队与加州大学圣地亚哥分校Hao AI Lab联合提出的架构,在短...

2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了

微调超大参数模型的成本门槛已被显著降低,仅需2-4张消费级显卡即可在本地完成对DeepSeek 671B或Kimi K2 1TB等万亿级参数模型的微调。这一突破性进展源于KTra...

MiniMax和Kimi为了“注意力”,隔空交手

MiniMax和月之暗面在大模型技术路线上展现出截然不同的选择,引发了行业对注意力机制效率与性能平衡的深入探讨。MiniMax在M2模型中回归Full Attention架构,...
1 2 3 66