AIGC动态
AIGC,AGI,人工智能
超越谷歌Banana,字节联合香港中文大学等高校开源最强图像编辑生成系统DreamOmni2
香港中文大学、香港科技大学、香港大学与字节跳动联合研发的DreamOmni2系统,标志着AI图像编辑与生成领域的重要突破。该系统通过创新的三阶段数据生成流程和...
LeCun怒揭机器人最大骗局,坦白Llama与我无瓜!
Meta首席AI科学家Yann LeCun在MIT演讲中尖锐指出,当前人形机器人行业距离实现真正智能仍有巨大差距。他揭示了行业核心困境:尽管工厂场景下的特定任务可通过...
给 Agent 接搜索功能,有哪些「坑」需要特别注意?
AI搜索已成为智能产品的标配能力,但如何为AI系统高效接入搜索功能仍面临诸多挑战。传统的人类搜索与AI搜索在交互逻辑、内容呈现和接口配置等方面存在显著差...
连马桶都会看图说话了,巨头敢卖,你敢坐么?
卫浴巨头科勒和初创公司Throne正在将人工智能技术引入马桶,通过摄像头和传感器分析排泄物,提供健康监测服务。科勒推出的Dekoda马桶相机售价599美元,能够拍...
AI Coding 赛道,快手搅局
快手正式进军AI编程赛道,发布KAT-Coder系列模型及配套开发工具。该系列包含闭源旗舰模型KAT-Coder和开源模型KAT-Dev,其中32B参数的KAT-Dev已在本月初亮相。...
盲人复明!马斯克Neuralink联创实现人工视觉里程碑
70岁的She拉·欧文在失明15年后,通过一项名为PRIMA的人工视觉技术重获光明。这项突破性研究由Science Corporation团队主导,其创始人Max Hodak曾是马斯克Neur...
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集
苹果公司在开放研究领域取得突破性进展,发布了Pico-Banana-400K数据集,这是视觉编辑领域首个基于真实图像的大规模开放数据集。该数据集包含40万张图像,通...
清华联手快手可灵,撞车谢赛宁团队RAE,用SVG再证明VAE已过时
AI图像生成技术正在经历一场范式转变,传统的VAE(变分自编码器)技术逐渐被更先进的方案取代。长期以来,扩散模型依赖VAE压缩图像以降低算力成本,但VAE构建...
Flowith新品首发:别等官网了,周二晚来硅星人会客厅当全球首批用户!
Agent技术领域正经历前所未有的快速进化,从几个月前仅能调用简单工具,到如今需要可靠执行多步复杂指令才能被视为“合格”。行业期待已从基础功能转向追求真正...
对谈零次方闵宇恒,我们应该怎么看科班生去创业?|00后创业者系列
闵宇恒,一位25岁的清华硕士在读生,本科毕业于重庆大学明月科创实验班,已带领近百人的具身智能团队完成亿元级融资,展现了00后创业者的独特路径。他的经历...





