大模型
LLM,VLM,模型
轻松让张国荣、赫本唱歌,阿里推出创新视频模型EMO
本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频,如让张国荣唱歌或让赫本唱《Perfect》...
Sora「翻车」:猴子长出鹦鹉尾巴,物体学会「穿墙术」
在彭博社对OpenAI的Sora进行的测试中,Sora在将文本提示转换为视频方面表现出了一些技术局限性。尽管Sora能够生成视频,但在处理复杂的场景时,如物体的物理...
HiDream CTO 姚霆:Sora 出圈,中国 AI 创业公司的机会在哪里?
在这篇文章中,HiDream.ai 智象未来的 CTO 姚霆博士对 Sora 的技术进行了深入解读,并探讨了 AI 生成视频技术在影视级应用方面的实践。智象未来开发的「智象...
2023年,被用户放弃了的 Top AI 产品有哪些?
文章总结:这篇文章主要分析了2023年上半年AI产品榜单的变化,以及市场上AI产品的供给和用户需求的变化。文章分为六个部分:1. 20款产品掉队,ToB类榜单变动...
百度智能云:营收 84 亿,其中大模型带来 6.6 亿元增量收入
2024年2月28日,百度发布了《2023年第四季度及全年财报》,显示2023年总营收达1345.98亿元,归属百度的净利润(non-GAAP)287亿元,同比增速达39%;2023年第...
百度这一年:Buff 拉满,AI 起飞
多年来,百度一直在等待一个机会——一个用AI改变世界的机会。自2010年王海峰加入百度,AI技术如虎添翼,至2017年百度决心转型,全面拥抱AI,再到2019年紧跟BER...
Fine-tuning在垂直领域的最佳实践指南
摘要总结:本文介绍了深度学习和机器学习中的一个重要概念——Fine-tuning(模型微调)。Fine-tuning通常在预训练模型的基础上进行,通过在特定任务的数据集上...
Dreamina,字节的Sora时刻要来了!
文章主要介绍了字节跳动近期在AI领域的几项重要进展和产品动态。首先,作者提到了字节跳动在去年11月和今年1月分别发布了视频生成研究成果PixelDance和视频生...
Hugging Face发布AI代码生成工具StarCoder 2,支持600多种编程语言
摘要:开发者们正迅速采用AI驱动的代码生成器,如GitHub Copilot和Amazon CodeWhisperer,以及Meta的Code Llama。然而,这些工具存在局限性,如成本和许可证...
Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?
摘要:谷歌的Gemini Pro 1.5发布后,因无法生成“白人形象”而引发争议,被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明,承诺进行结构性改变。此...