大模型
LLM,VLM,模型
全球圈粉6000万,被国内粉丝催着上线,PixVerse「国内版」一手实测来了!
爱诗科技推出的「拍我 AI」是国内版视频生成应用「PixVerse」的最新版本,已在各大应用商店上线。这款产品凭借其强大的功能和丰富的模板,迅速吸引了大量用户...
Mamba 架构实现推理性能超 Gemma3-27B!推理模型开始迈入「无注意力」时代
PromptCoT-Mamba-7B是首个实现解码显存常量、计算复杂度线性、长上下文稳定扩展且具备强推理能力的模型,标志着推理大模型首次完全不依赖注意力机制而运作。...
谷歌Transformer过时了?清华姚班校友等三连击,爆改注意力!
谷歌研究团队提出了一种突破性的AI架构设计框架Miras,通过重新定义注意力机制和记忆管理方式,显著提升了序列模型的性能。该框架的核心创新在于将传统遗忘机...
为什么OpenAI们开始化身「购物狂」?
OpenAI正在通过一系列收购和投资,构建一个以自身为中心的「隐秘初创企业帝国」。Sam Altman作为硅谷知名的天使投资人,其个人投资版图广泛,涵盖AI、生物技...
对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”
大模型的发展正在遭遇瓶颈,互联网文本数据的消耗导致AI模型性能提升速度明显放缓。相比之下,物理世界中蕴藏着数百倍甚至千倍的多模态数据,这些数据尚未被...
手机芯片,大变局
领先智能手机厂商正面临本地生成式AI、标准功能与云端数据交互带来的计算与功耗挑战。高端智能手机的SoC普遍采用异构架构,通过不同模块协同处理多样化任务。...
一条芯片新赛道崛起
NPU作为AI浪潮中迅速崛起的专用芯片,已从智能手机扩展到笔记本电脑领域,成为驱动各类AI功能的核心硬件。这种受脑神经网络启发的处理器架构,通过硬件级并行...
AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制
ElevenLabs最新发布的AI语音合成模型Eleven v3,标志着文本转语音技术的显著进步。该模型支持70多种语言,包括中文,并能够进行多人对话,展现出丰富的情感表...
超6.4亿次下载!智源发布具身大脑等五大新技术,王仲远:具身智能的淘汰赛还没开始
第七届智源大会于6月6日在北京召开,北京智源人工智能研究院发布了“悟界”系列大模型,标志着AI技术从数字世界向物理世界的加速迈进。这一系列包括原生多模态...
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
智源大会2024以“AI春晚”规格拉开帷幕,人形机器人冠军天工与宇树G1同台展示技能迭代成果。宇树G1凭借灵活拳击动作展现运动控制突破,天工2.0版本则从长跑转向...