视频生成
视频,video
2024 WAIC 热议大模型助力产业新趋势,可信应用成焦点
随着2024年过半,大模型技术的竞争已经从初期的百家争鸣转向了更注重实际产业应用的落地阶段。全球AI领域的领军企业纷纷将大模型技术应用于各行各业,预示着...
千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC
在世界人工智能大会上,快手公司展示了其最新的人工智能视频生成技术——可灵,并发布了该技术的一系列更新。可灵是全球首个用户可用的真实影像级视频生成大模...
达摩院发布一站式AI视频创作平台”寻光”,打造全新AI工作流
今年,AI视频生成技术迎来了爆发式增长,以Sora为代表的算法模型和产品应用不断涌现,短时间内出现了几十种视频生成工具。AI视频创作方式逐渐流行,但也带来...
更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅
2024年,AIGC领域特别是文生视频赛道呈现出显著的发展趋势,其中智象未来(HiDream.ai)作为国内专注于构建视觉多模态基础模型及应用的生成式AI初创公司,以...
张雪峰,杀死理想,盆满钵满
每年毕业季,数百万高考考生和家长面临志愿填报的焦虑和迷茫。随着高考成绩的公布,市场上各种付费志愿填报机构开始活跃起来。张雪峰及其公司“峰学蔚来”在这...
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题
视频创作在AIGC时代迎来了全新的变革。通过AI技术,视频创作变得更加简单和高效。例如,用户可以轻松地将目标对象从视频中分离出来,并嵌入不同的背景视频中...
8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功
法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...
现场Live震撼!OmAgent框架强势开源!行业应用已全面开花
联汇科技作为大模型行业的领军企业,其发展历程与自动驾驶技术的演变颇为相似,均经历了从概念到现实的转变,并在技术产品创新和用户体验上不断取得突破。公...
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
商汤科技在世界人工智能大会上发布了国内首个流式原生多模态交互模型——日日新5.5系列中的5o。这一模型整合了文本、声音、图像和视频等多种模态,能够实现实时...
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
新智元报道了AI视频生成技术在二次元领域的新突破,特别是一款名为YoYo的创作网站,为动漫爱好者提供了一个简单易用的平台。用户通过文字提示或上传图片,即...