斩获15个顶级零日漏洞：0G Lab联合新国立，北大和北邮团队构建的共识协议debug智能体框架

AIGC动态2小时前发布 almosthuman2014

64 0 0

斩获15个顶级零日漏洞：0G Lab联合新国立，北大和北邮团队构建的共识协议debug智能体框架

文章摘要

分布式系统共识协议的深层逻辑漏洞检测难度极高，传统测试与单体大语言模型难以胜任。为此，研究团队提出了首个将领域知识与大模型多智能体协同深度融合的自动化测试框架Agora。该框架旨在解决分布式协议状态复杂、多节点交织导致的深层漏洞检测难题。

Agora摒弃了单体模型测试的局限，引入假说驱动测试范式，将工作流解耦为协调者、策略家和代码官三个专业化智能体。通过极简的通信机制与自动化测试闭环架构，系统能够将抽象攻击场景转化为可运行的单元测试，并在报错时进行定向自我修正。这种多智能体协同设计不仅降低了上下文传输开销，还实现了跨编程语言的环境自适应，将系统专家的逻辑推演直觉转化为智能体间的博弈与协同。

在针对多个工业级与学术界核心共识协议库的评估中，Agora展现出显著优势。研究团队利用该框架成功发现了15个先前未知的协议级深层逻辑漏洞，而多个配备先进工具链的原生基线大模型在相同任务中均未发现任何漏洞。此外，Agora产出的漏洞报告中真实逻辑漏洞占比高达73.9%，平均发现一个顶级逻辑漏洞仅需消耗约40美元的计算成本，具备极高的性价比与较低的误报率，证明了其在算力受限情况下的有效性。

Agora的架构设计具有高度的可推广性与通用性，其底层工作流控制与上层领域知识库实现了深度解耦。该框架不仅适用于共识协议的安全审计，还能以插拔方式快速应用于数据库并发控制、操作系统内核以及智能合约审计等底层基础设施领域。这为工业级底层系统的自动化安全测试提供了一种低成本与高效率的落地方案，推动了智能体化质量管控在软件工程中的实际应用，标志着底层基础设施自动化安全测试的进一步发展。