标签:AI模型
长文本推理 5 倍提速!面壁MiniCPM4 端侧模型发布,0.5B模型效果秒杀同级
新一代端侧AI模型MiniCPM4.0发布,包含8B和0.5B两种参数规模,在性能、速度和部署效率上实现显著突破。8B稀疏闪电版通过5%的极致稀疏度实现长文本推理速度5倍...
一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。
在火山引擎发布会上,展示了多项前沿技术,包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型以及端到端语音模型等。其中,Seedance 1.0 p...
华为版《黑客帝国》首次亮相:训推复杂AI前先“彩排”,小时级预演万卡集群
华为首次推出了一项名为“数字化风洞”的技术,旨在通过虚拟环境平台在正式训练和推理复杂AI模型之前进行预演,从而优化资源配置并减少算力浪费。该技术由华为...
苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理
苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...
Claude 4正式发布,我在兴奋中恍惚的问:程序员路在何方?
Anthropic最新发布的大模型Claude Opus 4和Claude Sonnet 4在多个领域展现了显著的进步,尤其是在推理、编程和复杂任务解决能力方面。这两款模型在复杂推理和...
全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug
Anthropic在首届开发者大会上正式发布了Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4两个型号。Claude Opus 4是该公司迄今为止最强大的AI模型,能...
太疯狂了。Windsurf另辟蹊径发布了自己的AI模型。
Windsurf近期发布了一系列专门为软件工程设计的AI模型,包括SWE-1、SWE-1-lite和SWE-1-mini。这一举措标志着AI编程工具领域正在从依赖第三方大模型转向自研模...
字节豆包发布全新视觉深度思考模型,国内AI大模型行业从“百模大战”转向“基座五强”|钛媒体AGI
在FORCE LINK AI创新巡展·上海站上,火山引擎发布了多款AI模型,包括豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,并对豆包·音乐模型进行...
Mistral 拿出杀手锏叫阵 DeepSeek!性价比卷出天际、开源模型却断供,社区粉丝失望透顶
法国AI初创公司Mistral AI近日发布了新模型Mistral Medium 3,该模型在性能、成本和应用场景上展现出显著优势。Mistral Medium 3在编程和多模态理解等专业场...
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
全球AI大模型的发展正迅速进入“多模态时代”,这一趋势不仅体现在技术进展上,也反映在应用和落地的需求中。多模态技术已成为AI领域的关键能力,尤其是在智能...