图像生成
图像,绘画
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
本文报道了基于Diffusion Transformer(DiT)的新模型Flag-DiT,该模型由上海AI Lab、港中文和英伟达的研究者联合推出,旨在通过流(Flow-based)的大型扩散T...
中山大学与联想团队发布 ConsistentID,单张照片即可成为百变超人
图像生成技术的最新进展,特别是基于扩散的文本到图像模型,已经极大地推动了个性化和定制化肖像生成的发展。这些技术在电子商务广告、个性化礼物定制和虚拟...
国产大模型:今天起,我们100万tokens只需1元!
智谱AI,一家国内的大模型开发商,近期在顶级会议ICLR上作为特邀演讲嘉宾后,紧接着宣布了其大模型开放平台的价格调整:1元人民币可兑换1000000 tokens,这一...
OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!
OpenAI即将在下周一(13日)上午10点(太平洋时间)进行线上直播,届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻...
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见
OpenAI宣布将在直播中展示ChatGPT和GPT-4的更新内容,同时外媒报道OpenAI正在开发具备音频和视觉理解能力的AI语音助手,部分功能已向客户展示。OpenAI可能在...
投资大佬炮轰谷歌一半员工是摆设!AI 工程师:我们被招来后净做没用的东西了
本文讨论了硅谷大型科技公司在AI领域的竞争现状,以及这种竞争对员工工作负担和公司文化的影响。文章引用了多位业内人士的观点,包括Andreessen Horowitz的Da...
十年磨一「图」,谷歌震撼发布纳米级人脑图谱!AI加持人类大脑研究
谷歌研究的连接组学团队在成立十年之际,发布了一张1.4PB的人脑连接组图,这张图以纳米级分辨率展示了人类大脑皮层的结构。图中包含了57,000个细胞和1.5亿个...
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
在维也纳举办的ICLR 2024大会上,AI领域的顶尖企业和专家齐聚一堂,共同探讨和分享最新的研究成果。会议吸引了众多知名AI企业,包括OpenAI、Meta、谷歌和智谱...
ControlNet作者新作爆火:P照片换背景不求人,AI打光完美融入
IC-Light是由ControlNet作者开发的一款图像照明操纵工具,它允许用户通过简单的操作来改变图片中的光照效果。用户只需上传一张图片,系统便能自动识别并分离...
AI接近成为神?谷歌AlphaFold 3直接预测生命过程
Google DeepMind与Isomorphic Labs联合推出了新一代AI模型AlphaFold 3,这是一项革命性的技术进步,它不仅能够预测蛋白质的结构,还能准确预测DNA、RNA、配体...




