大模型

LLM,VLM,模型

ChatGPT缔造者联手DeepMind大神,用AI攻坚高温超导,半个硅谷抢着投

OpenAI前研究副总裁Liam Fedus与DeepMind材料科学专家Ekin Cubuk联合创立的Periodic Labs以3亿美元种子轮融资震惊硅谷,标志着AI科研领域的重要转向。这家初...

喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好

德克萨斯 A&M 大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队通过实验证实,大语言模型(LLM)长期接触低质量网络内容会导致认知能力显著下降,这种现象...

Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Code 让新模型跑在N卡上

DeepSeek团队最新发布的DeepSeek-OCR模型在OCR领域实现了多项技术突破。该6.6GB大小的专用模型首次量化了'视觉-文本token压缩比',验证了10倍近无损压缩和20...

DeepSeek 团队真是鬼才啊。

DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...

阿里夸克「C计划」曝光,AI赛道火药味渐浓?

10月20日,阿里旗下AI旗舰应用夸克因推进代号为“C计划”的新业务引发业界广泛关注。该项目由夸克核心团队主导,并集结了通义实验室多位高级别专家,目前已取得...

Anthropic这两天真没闲着:上线网页版Claude Code,还让Claude搞科研

Anthropic同步发布了Claude iOS应用预览版,便于移动端编码,同时推出专为生命科学设计的Claude版本,搭载性能更强的Claude Sonnet 4.5模型。该版本在实验协...

DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了

DeepSeek团队推出的DeepSeek-OCR模型通过视觉token压缩技术实现了文本处理效率的突破性提升。该模型将1000字文本压缩为100个视觉token,在保持97%精度的同时...

锁死一致性!Vidu Q2「参考生」可算来了,新功能强到离谱,APP全面进化

Vidu Q2「参考生」功能正式上线,标志着AI视频生成技术迈入新阶段。该功能在保持高一致性的基础上,实现了生成速度提升3倍和价格优化,同时首次推出「视频延...

字节用LLaVA + SAM-2抢先实现了SAM-3,用概念分割,无需位置标注

加州大学默塞德分校、字节跳动Seed团队、武汉大学和北京大学的研究人员成功将LLaVA和SAM-2两个AI模型整合,创造出名为Sa2VA的新型多模态系统。这一突破性成果...

DeepSeek新模型用OCR解决超长文本:这世界还能被更高效压缩?

DeepSeek近期发布的《DeepSeek-OCR》技术方案突破了传统OCR工具的局限,其核心价值在于通过视觉压缩解决大模型长上下文处理的瓶颈问题。当前主流大模型受限于...
1 30 31 32 33 34 745