AIGC动态

AIGC,AGI,人工智能

首个基于SSM-Transformer混合架构,开源商业大模型Jamba

AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...

从 Moonshot 崛起看中国大模型:资本其实没有大家想的那么急

月之暗面的崛起得益于资本的轰抢与市场的高度关注。其在短时间内获得多轮投资,一跃跻身于中国大模型初创企业的第一梯队。投资人对月之暗面的期许是“做出 Glo...

对话武汉大学李淼教授:以大模型视角看待一切机器人问题|GAIR live

武汉大学的李淼教授在机器人学习和控制、物体抓取和操作等领域的研究方面取得了显著成就。他曾在瑞士洛桑联邦理工学院攻读博士学位,并因其关于动态抓取算法...

谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力

本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...

钉钉AI:好险,差点就被长文本卷到

钉钉AI助理近期进行了一次重大升级,主要包括长文本处理、多模态速读和自定义工作流三大能力。其中,长文本处理能力使得钉钉AI助理能够轻松处理几十万字的文...

1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX

Databricks,一家著名的数据和AI平台,于3月28日正式开源了其大模型DBRX。DBRX是一个专家混合模型(MoE),拥有1320亿参数,能生成文本/代码、数学推理等,有...

Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4

Claude 3是一款人工智能模型,其在通用任务上的表现已经被全球公认为最强。然而,对于特定的专业领域,比如化学,其表现如何却是一个未知数。化学在药物发现...

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

  文章摘要 【关 键 词】 谷歌研究、VLOGGER模型、视频生成、音频驱动、数据集MENTOR 谷歌的研究人员近期发布了一种名为VLOGGER的多模态扩散模型,...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...

开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有

Databricks,一家大数据人工智能公司,开源了一款名为DBRX的通用大模型。这款模型拥有1320亿参数,是一种混合专家模型(MoE)。DBRX的基础和微调版本已经在Gi...
1 1,077 1,078 1,079 1,080 1,081 1,245