图像生成

图像,绘画

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交通大学与上海AI实验室合作提出了一种新的框架——Long-CLIP,旨在解决CLIP模型在处理长文本时的不足。CLIP模型通过对齐视觉和文本模态,具备强大的zero-s...

今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼

2024年第一季度人工智能领域重大事件摘要以下是2024年第一季度人工智能领域发生的一系列重大事件的摘要总结:GPT Store上线:1月11日,OpenAI推出了基于GPT-4...

从游戏GPU巨头到AI芯片霸主,英伟达的成功秘诀是什么?|钛度图闻

在2024年3月举行的GTC大会上,英伟达发布了基于全新Blackwell架构的GPU芯片B200,这一新一代芯片在性能推理方面相比上一代H100提升了惊人的30倍。英伟达创始...

ChatGPT和Sora其实限制了我们对大模型的想象?

近期,一份关于OpenAI部署Sora所需硬件资源的美国市场研究报告引起了广泛关注。报告指出,在峰值时期,Sora需要高达72万张英伟达H100显卡来支持,对应成本高...

大模型预测,下一个token何必是文字?

近年来,人工智能技术的发展迅猛,特别是大模型在生成技能上的进步,已经达到了令人难以置信的水平。现在,大模型不仅能生成文字、图像和视频,还能基于历史...

阿里妈妈怎么做 AI 电商?

2024年,AI电商应用落地迅速,其中阿里妈妈作为阿里商家端服务的出口,其动向备受业内关注。阿里妈妈正式发布【1+1+3】创新业务模型,基于内部自研的AI技术,...

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

  文章摘要 【关 键 词】 谷歌研究、VLOGGER模型、视频生成、音频驱动、数据集MENTOR 谷歌的研究人员近期发布了一种名为VLOGGER的多模态扩散模型,...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型在图像生成方面的优秀表现引领了生成式模型的新纪元。然而,扩散模型在理论上存在一些问题,如采样时间端点处的奇点问题,以及由此导致的平均灰度等...

微软亚研院新作:让大模型一口气调用数百万个API!

微软近期发布了一种新型AI生态系统——TaskMatrix.AI,该系统通过将基础大模型与数以百万计的应用程序编程接口(APIs)连接起来,以完成数字和物理领域的多样化...

看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了

创新奇智,中国领先的「AI+制造」解决方案提供商,近日发布了奇智孔明工业大模型2.0版本(AInno-75B),并首次展示了几款大模型原生应用,包括ChatVision、Ch...
1 92 93 94 95 96 122