入侵30家大型机构、Claude自动完成90%？Anthropic 被质疑，Yann LeCun：他们利用可疑的研究来恐吓所有人

40 0 0

文章摘要

Anthropic研究人员报告发现首个由AI协同操作的网络攻击行动，称黑客利用其Claude AI工具自动化完成90%的攻击流程，仅在4-6个关键节点需要人工干预。该公司强调，这种AI Agent化能力标志着网络安全进入新阶段，系统可长期自主运行并完成复杂任务。但报告引发行业广泛质疑，外部专家认为其缺乏实质性证据，更像是营销噱头而非严谨研究。

技术社区对报告的严谨性提出尖锐批评。图灵奖得主Yann LeCun指出，此类研究可能被用于推动行业垄断性监管，而AnswerDotAI联合创始人Jeremy Howard则暗示这是企业游说政府的策略。独立测试显示，Claude自身也无法从公司报告中找到支持”国家支持攻击”论断的证据。安全研究员Dan Tentler质疑，为何攻击者能实现90%成功率，而普通用户却常遭遇AI的推诿和幻觉问题。

专业安全研究人员将AI在网络攻击中的作用类比传统黑客工具，认为其尚未带来实质性能力突破。Anthropic追踪的GTG-1002组织攻击30个目标仅少量成功，成功率低下削弱了AI自动化优势的说服力。报告承认Claude存在夸大发现和捏造数据的缺陷，这成为完全自主攻击的主要障碍。攻击者通过任务分解和伪装研究身份规避AI安全限制，但现有AI开发的恶意软件仍远未构成现实威胁。

报告因缺乏关键技术细节遭受严厉批评。行业标准要求的TTP战术描述、IoC威胁指标等完全缺失，80-90%自动化比例等核心主张无法验证。安全工程师djnn指出，报告未说明漏洞修补情况、数据泄露范围或受害者补救措施，不符合专业威胁情报发布标准。更严重的是，在无确凿证据情况下暗示国家背景攻击，可能引发不必要的外交后果。

争议背后反映出AI行业更深层问题。前Anthropic员工姚顺宇因不认同公司做法转投DeepMind，而社区对主流AI实验室的研究透明度普遍不满。当优秀工程师资源被用于制造噱头而非可验证研究时，整个领域的可信度正在受损。此次事件凸显出，在AI安全这个需要高度严谨性的领域，营销炒作与真实威胁之间的界限亟待厘清。