图像生成
图像,绘画
真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界
这篇报道主要介绍了OpenAI发布的首个文本生成视频模型Sora在视频生成领域的突破。Sora生成的高清、流畅视频引发了社区的热议,被认为在生成时长、连贯性等方...
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
OpenAI的Sora视频生成模型在多个方面达到了当前最优水平(SOTA),包括视频的保真度、长度、稳定性、一致性、分辨率和文字理解。Sora采用了一种将不同格式的...
谷歌Gemini 1.5深夜爆炸上线,史诗级多模态硬刚GPT-5!最强MoE首破100万极限上下文纪录
谷歌DeepMind近日发布了新一代多模态大模型——Gemini 1.5系列。Gemini 1.5 Pro是谷歌最强的MoE大模型,最高可支持10,000K token超长上下文。Gemini 1.5 Pro在...
OpenAI发布文生视频模型Sora:60秒一镜到底、吊打现在所有视频生成模型
在短短十几小时内,OpenAI和谷歌接连发布了引人注目的成果,引发了国内外技术圈的广泛关注。特别是OpenAI发布的首款文生视频模型——Sora,标志着AI视频制作领...
OpenAI发布视频生成模型Sora,能生成60秒高清视频
OpenAI 最近推出了一款名为 Sora 的创新视频生成模型,这款模型标志性地能够将简短的文本描述转化为最长达一分钟的精细、高清视频片段。这一技术进展在文本到...
OpenAI今天发布了Sora(文生视频)
在官方网站 https://openai.com/sora 上介绍了一个名为Sora的AI模型,能够根据文本指令创建丰富想象力的场景。Sora可以生成长达一分钟的视频,具有多个角色、...
AI面部增强器-Remini
本文介绍了图像处理工具Remini,它专注于人像的修复和增强。用户可以通过注册登录网站,上传要处理的图片。Remini会展示AI增强过的图片,通过拖动中间的竖线...
GPT-5首次曝光后,Altman:现在最重要的事就是GPT-5
OpenAI首席执行官Sam Altman在达沃斯论坛上表示,他的首要任务是推出下一代大模型,即GPT-5。GPT-5将是一个多模态模型,支持语音、图像、代码和视频,并在个...
Boximator:字节跳动提出可控视频合成技术
字节跳动推出了一项名为Boximator的新技术,这是一种可控制视频中主体运动轨迹的技术。Boximator结合了框体和动画的概念,支持通过框选方式让图像中指定的对...
Bard進化成Gemini:令人印象深刻的未来 AI 曙光
中直接使用Gemini的高级编辑和生成工具。谷歌的人工智能产品Bard现已更名为Gemini,并推出了Gemini Advanced和手机应用两项新功能。Gemini Advanced让用户可...