标签:多模态

OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真

OpenAI在一次备受瞩目的发布会上宣布了其最新的人工智能模型GPT-4o,这一事件被认为具有改变历史的意义。GPT-4o的发布标志着人机交互迈入了一个全新的时代,...

Hello GPT-4o

OpenAI最近推出了其最新的旗舰模型GPT-4o,这是一个跨音频、视觉和文本的全能模型,代表了自然人机交互的重大进步。GPT-4o能够接收和输出文本、音频和图像的...

AI顶会ICLR,今年只有一家中国大模型公司受邀演讲

摘要ICLR 2024 会议概述ICLR 2024,即2024年国际学习表示会议,正在维也纳举行。尽管重要的奖项如时间检验奖和杰出论文奖已经颁发,但会议的其他环节同样引人...

制造星野:穿越平行时空和次元壁,揭秘 MiniMax 的另类 AI 世界

这篇文章讲述了中国人工智能公司MiniMax的发展历程,特别是其创始人闫俊杰如何将公司从一家专注于计算机视觉和深度学习的企业转型为开发面向普通消费者的人工...

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

智慧眼公司,一家全球领先的人工智能企业,最近发布了其自研的通用大模型——砭石。这一技术突破标志着人工智能从感知智能、认知智能向决策智能的快速迭代演进...

小红书内测自研大模型“小地瓜”,社交和搜索是落地方向 | 智涌独家

这篇文章报道了小红书在AI领域的探索和布局情况。文章指出,小红书的大模型团队正在研发通用大模型基座“小地瓜”,旨在应用于多模态技术和AI内容创作工具。小...

开源Open-Sora大更新:可生成16秒,720P高清视频

本文介绍了国内著名大模型开源公司潞晨科技的开源文生视频模型Open-Sora的大更新。该模型现在能够生成16秒、分辨率高达720P的视频,并具备处理任何宽高比的文...

半年涨粉1000万,这个AI聊天搭子是怎么火的

近期,快手平台上出现了一个名为“AI小快”的AI互动小助手,迅速吸引了大量用户的关注和互动。AI小快以其独特的人设和多功能性在快手上积累了千万粉丝,成为了...

中国首个Sora级大模型:文本生成16秒,1080p高清视频

4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技发布了中国首个长时间、高一致性、高动态性视频大模型——Vidu。Vidu采用了U-ViT架构...

Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了【内附Vidu逐帧拆解】

在2024年4月27日的中关村论坛上,生数科技与清华大学联合发布了中国首个长时长、高一致性、高动态性的视频大模型——Vidu。Vidu能够一键生成16秒、1080P分辨率...
1 21 22 23 24 25 31