标签：微轮次

OpenAI前CTO做的新模型，在硅谷刷屏了。

为调和即时响应与复杂计算的底层冲突，该架构拆分出前台交互层与后台推理层，前者维持低延迟在线感知，后者专注长周期任务规划。两组模型共享动态上下文记忆...

AIGC动态

2个月前