GPT-GPTs

GPT,GPTs,Prompt

这一次,ChatBot 的容器变了

蚂蚁的灵光App通过创新的交互方式重新定义了AI助手的表现力。与传统的纯文本聊天框不同,灵光采用多模态呈现方式,将复杂信息以结构化、可视化的形式展现。在...

视觉思维链全新架构,加州大学让多模态大模型有了灵性,整体性能提升5.3%

加州大学伯克利分校团队提出了一种名为视觉思维链(CoVT)的全新架构,旨在解决多模态大模型在处理视觉信息时被迫将其翻译成文本的局限性。人类通过视觉信号...

源神阿里!图像生成Ovis-Image再开源,7B小参数媲美GPT-4o和20B开源模型

在人工智能领域,图像生成技术正经历着快速迭代。阿里推出的Ovis-Image模型以7B参数实现了媲美20B+开源模型和GPT-4o的文本渲染能力,证明了通过优化的架构设...

马斯克开「AI救国猛药」:3年解决美38万亿国债危机!

马斯克在近期访谈中提出一项极具争议性的主张:AI与机器人技术将在三年内解决美国38万亿美元的债务危机。这一论断基于一个颠覆性逻辑——当AI驱动的生产力增速...

商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”

商汤医疗作为商汤集团“1+X”战略生态的核心延伸,半年内迅速跻身准独角兽行列,累计融资规模已达10亿元。其核心目标是以医疗大模型驱动的“未来医院”设计者与赋...

V3.2逼近Gemini 3,DeepSeek硬气喊话:接下来我要堆算力了

OpenAI前首席科学家Ilya Sutskever近期提出,过去五年依赖算力堆叠模型的'规模时代'正面临瓶颈,单纯扩大模型规模难以实现质变。然而DeepSeek通过V3.2系列模...

DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了

DeepSeek近日发布了V3.2正式版模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中...

实测可灵O1,AI视频界的Banana也来了。

可灵O1的推出标志着AI视频领域进入多模态大一统时代。这款全新视频大模型整合了参考生视频、文生视频、首尾帧生视频等六大核心功能,首次实现通过自然语言指...

DeepSeek-V3.2正式版发布,将开源模型的能力推向极致

DeepSeek团队正式开源了DeepSeekV3.2的两个版本:标准版和Speciale版。标准版专注于日常任务与通用智能体场景,在推理能力与输出效率之间取得了平衡,其性能...

ChatGPT三周岁了,什么最让你意外?

ChatGPT自2022年11月30日发布以来,以史上最快速度突破1亿月活跃用户,至今周活用户达8亿,标志着人工智能进入超级发展周期。三年间,技术突破、资本投入和普...
1 2 3 290