标签:大模型

OpenAI放弃的事,为什么阿里可能做得成

跨主体的外部协作模式在实践中遭遇明显阻力。因缺乏对支付结算、物流履约及售后维护等底层环节的实际控制力,第三方接入方案极易受制于系统对接成本与利益分...

OpenAI发布MRC超算协议,重塑10万GPU集群通信,AMD等合作推进

随着大语言模型训练规模突破万卡级别,超大规模计算集群对底层数据传输的稳定性提出了极高要求。传统单路径网络极易因局部拥堵或单点线路老化引发全局延迟,...

OpenAI给「75罗汉」狂撒66亿美金,或再造「PayPal黑帮」

离职科研人员已明确分化出三条发展路径。部分团队完整移植底层研发架构,试图构建更符合理想的替代模型;部分依托实时数据流与开源策略,正面重构信息检索与...

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

当前语言模型的发展重心正加速向测试期计算倾斜,但主流扩展策略多基于自回归架构设计,难以直接兼容采用并行去噪生成机制的离散扩散语言模型。为突破这一局...

浙大推出让AI会「导演」的角色扮演框架!四通道消息沉浸式交互|ACL 2026

大语言模型在角色扮演任务中的应用虽日趋普及,但现有系统普遍面临沉浸感不足与互动结构僵化等瓶颈。环境信号常被忽视为单纯背景板,多角色切换与叙事推进缺...

Kimi、智谱背后的“隐形冠军”藏不住了!AI Infra抢跑者开始重写资本坐标

随着人工智能大模型全面进入工程化与规模化应用阶段,底层基础设施的运行效率与系统承载能力已逐步超越单一算法性能,成为决定产业演进的核心变量。面对异构...

OpenAI官方CLI上线,跟复杂的SDK说拜拜

OpenAI Codex 团队正式发布开源命令行交互工具 openai-cli,核心逻辑是优化开发者使用云端 AI 模型体验。过去调用模型能力往往依赖可视化界面或编写大量脚,...

Anthropic最新论文撬开大模型黑箱:隐藏动机发现率提升 4 倍以上

大语言模型内部决策过程长期受限于不透明的黑箱状态,依赖输出内容与显式思维链的安全监控方法存在固有盲区,模型时常隐藏真实意图或识破测试环境却保持沉默...

所有实验室都怕字节,所有人都在夸DeepSeek!美国研究员36小时中国AI行

产业集群的高密度布局呈现出协同共生的网络特质,各机构在常态化交互中维持着基本的行业尊重。实验室普遍将具备技术优势的同行视为参照系,更倾向于打造互补...

Java 世界的 MCP:将架构策略应用于 LLM 集成

模型上下文协议为大语言模型的企业级集成构建了标准化协议层,有效解决了传统提示词硬编码和脆弱调用带来的扩展与治理难题。该协议通过定义明确的角色分工,...
1 2 3 4 5 6 87