图像生成
图像,绘画
DeepSeek 团队真是鬼才啊。
DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...
DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
DeepSeek团队推出的DeepSeek-OCR模型通过视觉token压缩技术实现了文本处理效率的突破性提升。该模型将1000字文本压缩为100个视觉token,在保持97%精度的同时...
锁死一致性!Vidu Q2「参考生」可算来了,新功能强到离谱,APP全面进化
Vidu Q2「参考生」功能正式上线,标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上,实现了生成速度提升3倍和价格优化,同时首次推出「视频延...
字节用LLaVA + SAM-2抢先实现了SAM-3,用概念分割,无需位置标注
加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合,创造出名为Sa2VA的新型多模态系统。这一突破性成果...
DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?
DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限,其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。
DeepSeek团队最新发布的DeepSeek-OCR模型突破了传统OCR的局限,将文字识别与结构化信息生成结合,实现了从图片到可编辑Markdown文档的端到端转换。该模型不仅...
MagicOS已成世界「第三极」,荣耀拿下AI大战叙事权
全球智能手机市场正迎来一场由AI驱动的革命性变革。Counterpoint报告预测,2025年全球生成式AI手机出货量将突破4亿部,占市场份额的三分之一。这一趋势标志着...
字节这款 AI 应用,在海外悄悄「爆了」
字节跳动旗下的AI应用「豆包」在国内市场表现稳定,但其海外版本「Cici」近期在国际市场上取得了显著增长。Cici在印度尼西亚、马来西亚、菲律宾、墨西哥和英...
中国AI的另一面,创业公司正在集体“出局”
全球AI发展呈现出大厂与创业公司截然不同的发展路径。数据显示,在海外市场,AI产品Top50中仅有5个来自大厂,而国内Top20应用中大厂占比高达70%,字节、百度...
万字硬核解读SAM 3:不止分割一切,它开始理解世界了
Meta最新的SAM 3模型在计算机视觉领域实现了重大突破,将分割模型从简单的视觉交互工具升级为能理解语义概念的视觉-语言多模态模型。该模型通过可提示概念分...




