今天,Mozilla放出一篇爆火的深度复盘博文——
Claude Mythos Preview凭借下,是Firefox团队,于短短一个月内,修复了423个安全漏洞!
让人惊讶得瞪大眼睛、说不出话来的是,4月单独一个月的漏洞修复数量,比之前15个月加起来的总数还要多。

到2025年的时候,Firefox平均每个月修复安全漏洞的数量是21.5个。在同一时期的4月,被解决的漏洞数量仅仅只有31个。
情况是这样的,有这么一种降维打击,它使得技术圈完全没法安稳停下了,评论区这儿呢世界杯直播观看,早就被AI领域大佬发出的“哇塞”给刷屏了。

大佬亲自下场复盘:真正的「顶级猎手」
这些bug,在突然之间,变得极其十分相当特别非常好,这是Mozilla工程师所书写下来的原话。
就在短短几个月之前,由AI所生成的安全漏洞报告,那可真是开源社区的「惊悚梦魇」啊,看上去仿佛像是确有其事实情如此,然而实际上全部都是毫无价值的胡拼凑之物,毫无意义可言。
维护者花大量时间去验证一个「发现」,结果发现全是幻觉!

但这所有的一切,于仅仅短短几个月的时间之内,出现了翻天覆地般超乎想象的变化。主要缘由存在着两个:
其一,模型自身变得更为强大了;其二,操控模型的工程手段获得了本质性的跨越。

说白了,模型在飞速变强,工程师在飞速学会怎么用它。
Firefox这一个月423这个夸张的数字,是两条曲线相乘积的结果。
271个漏洞,180个高危,有的藏了20年
今年2月起,Firefox团队,同Anthropic,展开了合作。
一开始所采用的是Claude Opus 4.6哦,于Firefox 148里对22个安全漏洞进行了修复哈。

Firefox 150版本发布之际,恰逢Mythos Preview出现了,没人能想到,它一下子就挖掘出了271个安全漏洞。
更狠的是细节,这271个漏洞中:
180个被评为「高危」(sec-high)
80个被评为「中危」(sec-moderate)
11个被评为「低危」(sec-low)
这一种被称作sec-high级别的漏洞,只要是用户以符合正常状态的方式去开展浏览网页这个行为举动,那么就存在着相应可能性会被触发。
在过去十几年当中,这种漏洞常常是被外部白帽子凭借高额悬赏给挖掘出来,一次支付的赏金少则几千美元多则上万美元。
现今,Mythos以横扫之势涵盖了271个,接着,在149.0.2中,它有了进一步动作,随后,于150.0.1里,也有相关进展,最后,在150.0.2中,又陆续修复了更多内容。
4月,存在总计的423个安全漏洞,其中,有271个是被Mythos直接发现的 ,另外,还有41个是来自外部安全研究员所发现的。

另外,还有111个那部分,是由内部团队借助Mythos以外的别的模型,以及通过模糊测试等这类方式才被找出来的。
更重磅的是,Mozilla还公开了12个漏洞的详细报告。
在代码之中,存在着一个藏了十五年的HTML 元素的漏洞,另有一个与XSLT相关的bug足足存在了长达二十年之久。

「沙箱逃逸」都能挖,赏金2万刀那种
最能惊动安全领域圈子的事情,是Mythos发现了多个「沙箱逃逸」方面的漏洞,也就是sandbox escapes。
针对每个网页,浏览器会将其放置于一个被称作「沙箱」的区域内进行运行,即便该网页遭到攻击者的控制,它也没有办法从这个被隔离的区域逃脱出去。
而沙箱逃逸,那就是,得找到这样一种办法,要借此从这个隔离区去「越狱」开云真人app在线登录,最终能够获得更高的权限。
这类漏洞有多难找?连Fuzzing都很难覆盖。
Mozilla的那个「Bug Bounty计划」,针对沙箱逃逸漏洞所给出的最高赏金数额是2万美元嗯,属于整个赏金体系里的天花板呢。

哪怕给出了最高限度的赏金,他,Firefox安全工程师Brian Grinstead,也直言说道:「其,Mythos,所发现的沙箱逃逸漏洞的数量,已然超出了人类安全研究员数量的.total」。
而Mythos找「沙箱逃逸」的方式也很硬核:
这东西会自行撰写一段带有恶意性质的补丁,将其注入到沙箱进程当中,而后运用这段代码,去对浏览器最为安全的部分发起攻击。
整个过程需要创造性思维,以及对多进程架构的深度理解。
Agentic Harness,换模型只需一行代码
但,模型强只是一半。
起先,他们试着采用GPT - 4或者Claude Sonnet 3.5去开展「静态代码分析」,然而误报率实在过高,完全没办法实现规模化。

Agentic Harness现身,化作了转折点,该套系统的核心逻辑为——。
发现漏洞:给模型一段代码,让它找Bug
针对动态验证,要编写测试用例,通过这些测试用例去对假设进行动态验证。其验证的标准是,只有能够复现的情况才算数,而那些不能复现的情况会自动被排除。
去重和分诊:自动和已知漏洞比对,避免重复
跟踪和修复:进入正式的安全Bug生命周期
一开始,团队在终端里手动盯着模型跑,调Prompt。
等到跑通了之后,便着手开始并行化,于多台临时虚拟机之上同时进行运行,每一台VM负责扫描一个特定的文件,或者负责扫描一个特定的函数。
应当值得提及的是,一旦那个称作Pipeline的搭建好了,去更换模型这仅仅只是一行代码所涉及的事儿。

由Opus 4.6开启切换,直抵Mythos Preview,近乎达成无缝衔接的状态。
而且,每一次模型进行升级的时候,整条Pipeline所呈现出的效果,都会同步地进行放大,表现为发现能力变得更强,验证达到更加精准的程度,报告的质量变得更高。
就如同某些安全专家所讲的那样,“真正的杠杆或许并非仅仅在于模型自身,然而却在于Harness的工程能力”,这是一种观点。
100多人连夜加班,不是自动修bug
Mythos Preview找到漏洞只是第一步。
在博文中,Brian Grinstead表述得极为直接,那就是,每一个Bug的情况都是这样,有一个工程师去编写补丁,同时,还有另一个工程师进行Code Review。
AI写的补丁只能当参考,不能直接部署。
有超过100名工程师,参与了代码贡献,目的是为了消化这史无前例的漏洞洪流。
负责编制补丁的人员,履行代码审查职责的人员,搭建传递管道的人员世界杯直播平台,进行类别划分工作的人员,开展测试与修复工作的人员,承担发布流程管理工作的人员,全体都投入行动。
这是Firefox历史里规模最大的安全修复行为举动,也产生出在历史上来看最为安全稳固的Firefox版本局面效果。
正面对决:Anthropic VS OpenAI
Firefox的423个漏洞只是冰山一角。
有一场关于AI安全能力的竞赛,其中Anthropic正沿着一条路线,以全速冲刺,OpenAI则沿着另一条截然不同的路线,也在全力飞速奔跑——。
而两家的布局,已经清晰到令人窒息。
先看Anthropic这边。
4月初的时候,Claude Mythos Preview发布了,与此同时,还推出了一个「Project Glasswing」(也就是玻璃翼计划)。

Anthropic发布了其自有着以来最为强大的模型,而后,亲自将其封闭起来。
他们宣称,Mythos在每一个主流操作系统中,发现了数千个高危漏洞,在每一个主流浏览器中,也发现了数千个高危漏洞,甚至其中还包括一个潜伏了27年的漏洞OpenBSD。
来看OpenAI这一边,他们的路线是相反的,是尽可能广泛地去开放。
在Anthropic推出Mythos才仅仅过去了一周的时间之后,OpenAI便迅速地加以追赶效仿,发布了那一款被称作GPT - 5.4 - Cyber的事物。与此同时,TAC计划随之同步开展起了拓展行动,一下子牵连达到数千名个人防御者以及数百个安全团队。
在今日,GPT - 5.5 - Cyber已然对处于TAC最高层级的用户予以开放,它能够被用于对漏洞展开猎杀,能够用来针对恶意软件进行分析,还能够用于开展逆向工程攻击。

在官博所作的介绍当中,GPT - 5.5 - Cyber于网络任务里,取得了81.9%的成绩。
OpenAI所具备的逻辑清晰呈现为,实施身份验证这一行为,接着开展分级授权这一举措,随后达成让数量尽可能多的防御者,获取到强度尽可能强的武器这样一种结果。


现今,Anthropic以及OpenAI都在竭尽全力地构建屏障。然而,AI安全能力所具备的扩散速率,或许会比它们建造这类屏障的速率还要更加快些。
参考资料:
https://x.com/alexalbert__/status/2052468573516513762?s=20
https://x.com/TechCrunch/status/2052420271970390042
https://x.com/AnthropicAI/status/2052466175540629965?s=20
标签: Firefox ClaudeMythosPreview 安全漏洞 AI Mozilla
还木有评论哦,快来抢沙发吧~