图像生成
图像,绘画
我拿AI给神曲《八方来财》做了个MV,真的好魔性!
中国电信推出的AI创作平台TeleStudio,展示了用人工智能生成高质量视频的突破性能力。该平台基于自研的星辰大模型,支持2K分辨率、20秒时长的视频生成,并处...
Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Code 让新模型跑在N卡上
DeepSeek团队最新发布的DeepSeek-OCR模型在OCR领域实现了多项技术突破。该6.6GB大小的专用模型首次量化了'视觉-文本token压缩比',验证了10倍近无损压缩和20...
DeepSeek 团队真是鬼才啊。
DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...
DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
DeepSeek团队推出的DeepSeek-OCR模型通过视觉token压缩技术实现了文本处理效率的突破性提升。该模型将1000字文本压缩为100个视觉token,在保持97%精度的同时...
锁死一致性!Vidu Q2「参考生」可算来了,新功能强到离谱,APP全面进化
Vidu Q2「参考生」功能正式上线,标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上,实现了生成速度提升3倍和价格优化,同时首次推出「视频延...
字节用LLaVA + SAM-2抢先实现了SAM-3,用概念分割,无需位置标注
加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合,创造出名为Sa2VA的新型多模态系统。这一突破性成果...
DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?
DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限,其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。
DeepSeek团队最新发布的DeepSeek-OCR模型突破了传统OCR的局限,将文字识别与结构化信息生成结合,实现了从图片到可编辑Markdown文档的端到端转换。该模型不仅...
MagicOS已成世界「第三极」,荣耀拿下AI大战叙事权
全球智能手机市场正迎来一场由AI驱动的革命性变革。Counterpoint报告预测,2025年全球生成式AI手机出货量将突破4亿部,占市场份额的三分之一。这一趋势标志着...
字节这款 AI 应用,在海外悄悄「爆了」
字节跳动旗下的AI应用「豆包」在国内市场表现稳定,但其海外版本「Cici」近期在国际市场上取得了显著增长。Cici在印度尼西亚、马来西亚、菲律宾、墨西哥和英...






