图像生成
图像,绘画
LIama 4发布重夺开源第一!DeepSeek同等代码能力但参数减一半,一张H100就能跑,还有两万亿参数超大杯
在训练细节方面,Meta采用了全新的训练技术MetaP,通过设置关键模型超参数,实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...
10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型
多模态大语言模型在实际应用中展现出卓越性能,但其计算开销和显存占用问题仍然是关键瓶颈。KV cache机制通过显存换取计算效率,但随着输入数据规模的增大,...
一张照片秒生好莱坞级运镜!子弹时间/推拉环绕,AI视频注入电影级灵魂
Higgsfield AI最新推出的Motion Controls AI视频生成技术,标志着AI在电影级动作捕捉和视频生成领域取得了显著进展。该技术能够通过一张静态图像生成具有真实...
GPT-4.5创造力比GPT-4o弱!浙大上海AI Lab发布新基准,寻找多模态创造力天花板
近来,GPT-4.5在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力,引发了关于多模态大模型(MLLMs)创造力天花板的讨论。现有的评测基准难...
中文海报设计,赛道一夜颠覆
豆包AI的文生图功能近期进行了显著升级,主要体现在四个方面:标题大字准确度提升至94%,小字生成能力也有所增强;语义理解和影视质感得到优化,镜头更具叙事...
最强中文AI绘图模型即梦3.0上线,设计师们又一次emo了。
即梦3.0绘图模型的发布在AI绘图领域引起了巨大反响,尤其是在中文生成方面取得了显著突破。即梦3.0不仅在大字的准确性、设计感和丰富度上达到了新的高度,还...
Midjourney重磅更新,又一个“言出法随”的AI生图神器
Midjourney刚刚发布了其最新版本V7,面对新势力如GPT-4o的多模态生图功能和Gemini改图工具的崛起,这次升级带来了整体图像质量的提升及对用户输入提示更准确...
OpenAI吉卜力滤镜狂欢背后:AI正在超越版权法?
随着OpenAI的GPT-4o图像生成器上线,用户开始通过这款工具将各种人物和虚构世界重新想象成吉卜力电影风格。埃隆·马斯克、《指环王》中的人物、蒙娜丽莎甚至白...
AI复活逝者,风口上的情感牢笼
在清明时节,利用AI技术“复活”逝者的业务迎来高潮。消费者可以通过支付一定的费用让算法根据提供的数据生成逝者的数字化形象,并实现从简单的图像动态化到复...
用GPT-4o制作表情包上架微信喂饭级教程,不会PS也能轻松上手。
最近,GPT-4o的发布带来了许多有趣的玩法,尤其是在生成表情包方面。尽管服务器不稳定影响了多玩法汇总的详细教程发布,但此次重点分享了使用GPT-4o生成趣味...