大模型
LLM,VLM,模型
长文本生成迎来新突破:拓元智慧推出 DrDiff ,实现效率与质量双提升
DrDiff框架通过动态资源调度机制,解决了长文本生成中效率与质量难以兼得的根本性挑战。该框架由拓元智慧团队联合中山大学、阿里巴巴及Snap Inc的研究团队开...
IROS 关键圆桌:到底应该模型驱动,还是数据驱动?
在全球智能机器人与系统大会(IROS)期间,美团机器人研究院举办的学术年会聚焦具身智能商业化与机器人技术发展。多位行业专家围绕核心议题展开讨论,探讨了...
我拿AI给神曲《八方来财》做了个MV,真的好魔性!
中国电信推出的AI创作平台TeleStudio,展示了用人工智能生成高质量视频的突破性能力。该平台基于自研的星辰大模型,支持2K分辨率、20秒时长的视频生成,并处...
ChatGPT缔造者联手DeepMind大神,用AI攻坚高温超导,半个硅谷抢着投
OpenAI前研究副总裁Liam Fedus与DeepMind材料科学专家Ekin Cubuk联合创立的Periodic Labs以3亿美元种子轮融资震惊硅谷,标志着AI科研领域的重要转向。这家初...
喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好
德克萨斯 A&M 大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队通过实验证实,大语言模型(LLM)长期接触低质量网络内容会导致认知能力显著下降,这种现象...
Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Code 让新模型跑在N卡上
DeepSeek团队最新发布的DeepSeek-OCR模型在OCR领域实现了多项技术突破。该6.6GB大小的专用模型首次量化了'视觉-文本token压缩比',验证了10倍近无损压缩和20...
DeepSeek 团队真是鬼才啊。
DeepSeek团队开源了3B参数的DeepSeek-OCR模型及相关论文,提出通过视觉模态压缩文本信息以解决大语言模型的长上下文挑战。传统Transformer架构在处理超长文本...
阿里夸克「C计划」曝光,AI赛道火药味渐浓?
10月20日,阿里旗下AI旗舰应用夸克因推进代号为“C计划”的新业务引发业界广泛关注。该项目由夸克核心团队主导,并集结了通义实验室多位高级别专家,目前已取得...
Anthropic这两天真没闲着:上线网页版Claude Code,还让Claude搞科研
Anthropic同步发布了Claude iOS应用预览版,便于移动端编码,同时推出专为生命科学设计的Claude版本,搭载性能更强的Claude Sonnet 4.5模型。该版本在实验协...
DeepSeek的新模型很疯狂:整个AI圈都在研究视觉路线,Karpathy不装了
DeepSeek团队推出的DeepSeek-OCR模型通过视觉token压缩技术实现了文本处理效率的突破性提升。该模型将1000字文本压缩为100个视觉token,在保持97%精度的同时...




