大模型
LLM,VLM,模型
AI时代,谷歌的逻辑是像苹果那样,进行垂直整合
本篇文章主要探讨了不同科技公司在AI领域采取的策略,特别是集成化和模块化的区别。首先,Google采取了类似于Apple的垂直集成策略,通过自研TPU芯片和专有模...
AI大模型正改变着推荐系统的未来
这篇文章详细介绍了推荐系统的工作原理及其应用领域。推荐系统被广泛应用于电子商务、视频网站、音乐流媒体、新闻资讯等多个领域,旨在提高用户体验和转化率...
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
斯坦福团队的多模态大模型Llama3-V被指与清华大学团队的面壁智能MiniCPM-Llama3-V 2.5开源模型高度相似。Llama3-V团队的两位斯坦福本科生悉达多·夏尔马和阿克...
英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」
本文介绍了一种称为“具身智能”的人工智能技术,它旨在将虚拟世界的成果转移到现实世界中。具身智能的研究包括以下几个方面:1. Minecraft游戏平台训练智能体...
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
Mamba-2架构在AI界再次引发关注,其在统一状态空间模型(SSM)和注意力机制(Attention)的基础上,成功将Transformer模型与SSM结合,形成了一种新的高效序列...
AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴
微软发布了首个大规模大气基础模型Aurora,其具有前所未有的准确率和效率,计算速度提升了约5000倍。Aurora采用灵活的3D Swin Transformer架构,经过预训练和...
昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理
昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应用并落地的开源千亿Mo...
再战Transformer!原作者带队的Mamba 2来了,新架构训练效率大幅提升
自2017年提出以来,Transformer架构在AI大模型领域占据了主导地位,尤其是在语言建模方面。然而,随着模型规模的扩大和序列长度的增加,其局限性也逐渐凸显,...
新架构Mamba更新二代!作者:别争了,数学上Transformer和SSM是一回事
研究人员推出了Mamba-2模型,该模型在状态空间模型(SSM)与Transformer架构之间建立了新的联系。通过对两种模型的数学基础进行深入分析,研究团队发现,尽管...
终于来啦!Stable Diffusion 3将在6月12日正式开源
在人工智能生成内容(AIGC)领域,Stable Diffusion模型由开源大模型平台Stability AI开发,一直备受关注。6月3日,Stability AI的联合首席执行官Christian L...




