图像生成

图像,绘画

蚂蚁AQ登顶Apple医疗榜:千亿参数+苹果生态,AI私人医生真要来了?

蚂蚁集团旗下的AI健康应用AQ在iOS版上线后迅速攀升至苹果应用商店医疗榜榜首,显示出用户对具备专业医疗能力的AI助手的强烈需求。AQ的成功不仅在于其与苹果生...

利好独立开发,MiniMax Agent 现在连后端网站都能做了

ChatGPT 正式推出 Agent 模式,标志着 OpenAI 开始布局通用 Agent 领域。这一模式能够帮助用户完成复杂的电脑任务,重要性不亚于 GPT-5 的发布。然而,OpenAI...

机器人的「GPT时刻」来了?丰田研究院悄悄做了一场最严谨的VLA验证实验

机械臂技术正从单一抓取任务向复杂自主操作迈进,其核心挑战在于感知、理解与动作控制的高效协同。近年来,视觉-语言-动作(VLA)模型的发展使机器人能够整合...

仅需0.7秒单图像实时3D重建,开源扩散模型

单图像3D重建是计算机视觉领域的一项基础且极具挑战的难题,旨在从单一视角的二维图像中恢复出三维物体的形状和结构。学术界和工业界主要探索了两种技术路线...

对话五条人AI MV主创:究竟是人带着AI飞,还是AI带着人类飞

五条人乐队与前沿AIGC技术的碰撞催生出《地球恋曲》MV,这部几乎完全由AI制作的作品呈现出怪诞迷幻的视觉风格。身着银色宇航服的乐队成员背着红色喇叭攀登山...

世界首个「实时、无限」扩散视频生成模型,Karpathy投资站台

Decart公司发布了全球首个实时、无时长限制且支持任意视频流的扩散视频模型MirageLSD,标志着AI视频生成领域的革命性突破。该模型能够在40毫秒的延迟内将任何...

MiniMax 技术闭门会分享:长上下文是 Agent 的 Game Changer

MiniMax在7月10日举办的M1技术研讨会汇集了全球顶尖的研究者和业界嘉宾,深入探讨了模型架构创新、RL训练、长上下文应用等前沿话题。RL能否赋予模型新能力?...

斯坦福开源复杂推理AI Agent,融合超10种工具

传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。为了解决这一难题,斯坦福大学开源了OctoToo...

最强人才接连被挖,创业大佬离开 OpenAI 后说了实话:7 周硬扛出 Codex,无统一路线、全靠小团队猛冲

OpenAI研究员Jason Wei和Hyung Won Chung即将加入Meta新成立的超级智能实验室。Jason Wei曾在OpenAI参与o3模型和深度研究模型的开发,并专注于强化学习领域。...

Vibe Coding? Vibe over Coding! | 在Cursor中文社区的分享

在Cursor中文社区杭州线下活动中,硅星人主编王兆洋分享了将AI编程工具Cursor应用于高质量内容创作的实践经验。不同于常见的'小红书爆款批量制作'模式,该分...
1 2 3 4 137