标签:大模型

四道题评测 Qwen3.7-Max:从空间推理到 3D 建模,它离 Agent 更近了吗?

阿里云通义千问团队在三个月内连续发布三款旗舰大模型,最新推出的Qwen3.7-Max在多项权威评测中表现卓越,位列全球第五、国产第一。该模型在推理和编程智能体...

小米狂撒Token!最高降幅99%,全面对标DeepSeek

近期,国产大模型API市场掀起激烈的价格战,竞争已正式杀入成本线。DeepSeek宣布V4-Pro API永久降价,随后小米MiMo迅速跟进,最高降幅达99%,其Pro版核心价格...

超越 TurboQuant! OSCAR:面向真实 Serving 的 2bit KV Cache量化

长上下文模型在在线推理服务中面临KV Cache带来的显存容量和带宽压力。OSCAR方案旨在通过面向长上下文服务的近2-bit KV Cache量化技术,解决低比特压缩后模型...

半数华人、3位亿万富翁:这张十年前的量化实习生合照,藏着 AI 时代的新贵版图

近年来,具有量化交易背景的人才正迅速崛起,成为人工智能领域的中坚力量。从华尔街到硅谷,众多高估值AI独角兽企业的创始人或核心高管,多拥有量化高频交易...

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

过去的神经网络缩放定律通常仅关注模型参数量、数据量和训练计算量与损失函数下降之间的关系,但真实的训练过程受到训练步数、批大小、学习率等众多变量的复...

买Token防骗指南

AI大模型使用体验差异显著的背后,隐藏着Token服务商为降低成本而采取的行业乱象。部分服务商将高精度模型降级部署却隐瞒精度信息,导致模型表现变差,且低价...

硅谷大事件丨AI代码公司再吸10亿美金,程序员「铁饭碗」难保;Claude被指测试「作弊」;Meta组建新部门,向大客户派驻AI工程师

AI领域的资本热度与商业化落地进程显著加速。Cognition AI凭借AI编码工具获得超10亿美元融资,估值飙升至260亿美元,标志着AI代理编码的商业化正以远超预期的...

飞书终于支持Markdown了,这个最弱的格式却赢下了整个AI时代。

近期飞书云文档新增了直接导出Markdown格式的功能,并支持文档内图片的公网链接读取,显著提升了人工智能用户的使用体验。这一更新不仅解决了第三方工具导出...

AI 手机还没度上「蜜月」,模型厂商和手机厂商就已经开始「闹离婚」

豆包手机一代的问世标志着AI手机从单纯的应用叠加转向系统级GUI Agent解决方案,引发了整个AI手机生态的重新排位。模型厂商亲自下场制造硬件已成为全球产业共...

大模型也需要睡觉!让AI打个盹,醒来更聪明

卡内基梅隆大学和马里兰大学的研究团队提出了一种旨在提升大语言模型处理长上下文和复杂逻辑能力的新机制。研究表明,大语言模型在面对长上下文和深度推理任...
1 6 7 8 9 10 94