5月19日晚,接近零点时分的时刻,Andrej Karpathy以亲自宣布的方式昭告众人,其踏入了Anthropic的领域,此般加入系确有此举。
这个名字的分量不需要多解释。
曾经身为OpenAI联合创始人,还曾担任过特斯拉前AI总监,同时还是「Vibe Coding」这个名称所指事物的开创者,并且是在全球范围内具备极大影响力的AI教育者。
提到在AI领域之中他的地位,大概等同于篮球界里的那个詹姆斯,无论去到哪一场队伍,俱都是令人瞩目的头条了 ,真是让人难以忽视他那种引人注目的特质。
他在 X 上只发了三句话。

https://x.com/karpathy/status/2056753169888334312
有句话提到,LLM前沿在未来几年,会是那种「尤其是具有塑造性」的情况。还有第三句表明,他始终保持着对教育怀抱的热爱。而中间的那句话最为关键,这五个词就是,「回转到研发」。
在这两年的时间范围之中,出现了第三位核心人士,这位核心人士,是从OpenAI阵营那边,转而投奔Anthropic的。
这是一个人,此人即将步入 40 岁,已然功成名就,实现了财务自由,然而却主动作出选择,心甘情愿去充当他人下属的下属。
因何而走,为何是Anthropic,Anthropic缘何非要招录他?
每一个问题背后都有一层值得拆开看的东西。
01
他去做什么
本周,Karpathy已經開始從事一份工作,這份工作使他邁入了Anthropic預訓練團隊之中。
这个团队,领导的人是Nick Joseph ,它负责的是,Claude的所有大规模训练运行。
Anthropic的发言人,向TechCrunch进行了确认,就此表明,Karpathy会组建出来一个全新的子团队,此子团队会专门专注于利用Claude自身,去加速预训练研究。
有人叫 Nick Joseph,这人还在X 上面补充所谓背景内容说成,「将会组建这样一个团队,该团队是专门专门去专注搞用 Claude 来加速预训练研究自身的事儿。」。

https://x.com/nickevanjoseph/status/2056760504949842219
据TechCrunch所作评价表明,Karpathy属于那少部分研究者,他们能够在LLM理论与大规模训练实践二者之间搭建起沟通的桥梁。
存在这样一件事呀,对于这件事,Axios 将其定性为,所谓的,Anthropic 处于人才方面争夺情形下、所呈现出的重大胜利呢。
与此同时,宣布加入Anthropic的还有网络安全方面的专家Chris Rohlf,在此之前,xAI创始成员Ross Nordeen也已经在本月早些时分加入。当下,人才流动所呈现出的方向性愈发显著了。

https://x.com/chrisrohlf/status/2056744653165092983
能作为市场情绪旁证的是Polymarket的数据,对此,交易者给Anthropic在6月底拥有某种AI模型的概率定价为65%,同时,给OpenAI拥有该AI模型的概率定价为4%。

https://polymarket.com/event/which-company-has-best-ai-model-end-of-june
Karpathy 的加入进一步强化了这个判断。
02
定义者 Karpathy
需要理解Karpathy这个人的稀缺性,要理解这次加入的重量。
他的稀缺不在于技术能力,*研究者有一批。
他的稀缺,在于他能用一个词改变整个行业理解某件事的方式。
1986 年生于斯洛伐克,15 岁移民加拿大多伦多。
曾于多伦多大学攻读本科之际,选修了 Geoffrey Hinton 的课程,且参与了他所组织的读书会。
Hinton,是深度学习复兴运动所蕴含精神的代表者,是荣获2018年图灵奖的得主,还是应是到2024年将会荣获诺贝尔物理学奖的得主。
Karpathy 是最早被这把火点燃的年轻人之一。
然后呢,于 Stanford 门下,跟随另一位具有传奇色彩之人李飞飞,在博士求学阶段,创立了 CS231n 这门课程。
2015年时,这门课有150名学生,到了2017年,学生人数涨到了750人,所有视频讲义都被公开到了网上 ,它成了全球无数工程师自学深度学习的起始站点 ,堪称计算机视觉领域最为厉害的一门课程 ,没有其他能与之相提并论的。
2015 年,他成为 OpenAI 的创始研究科学家。
2017年,被马斯克招来,于特斯拉出任AI高级总监这一职位,促使自动驾驶朝着纯视觉方案的方向去发展。
在这次挖角中,马斯克承受了巨大的压力。
https://www.cnbc.com/2026/05/19/anthropic-hires-openai-cofounder-andrej-karpathy-former-tesla-ai-lead.html
同年,Karpathy在Medium上发表了一篇文章,当中提出了「Software 2.0」概念。还主张神经网络权重属新的代码,数据集是新的源代码。另表示梯度下降是新的编译器。
这个框架重塑了整个行业对「什么是编程」的认知。
2022年,他脱离特斯拉,之后于YouTube上创立了「Neural Networks: Zero to Hero」系列课程因之频道订阅量突破百万的标点符号。
在同一时期出现的开源项目,其中有如micrograd、nanoGPT、还有nanochat,尽管它们的代码数量非常之少,然而却能精准无误地击中那些核心概念,因此被人们称作是「可运行的教科书」。
他创造性地造出了「Vibe Coding」这个词,时间定在了 2025 年 2 月,随后这一词汇被柯林斯词典选为年度词汇。
https://x.com/karpathy/status/1886192184808149383
6月,在一个名为YC AI Startup School的演讲当中,有人提出了「Software 3.0」以及「Agent的十年」这两个框架,就此,那个演讲,也就成为了当年讨论的最为广泛频繁的AI演讲里面的其中之一了。
2024年,TIME把他列入了「影响力100人」其中关于AI领域的那一项。
从 Hinton,而后到李飞飞世界杯直播观看,接着再到奥特曼,最后直至马斯克,他于每个节点之上皆是站在最为前沿之处的。
然而,他所遗留下来的,那最为经久耐存的事物,并非是随便哪一个产品,就连并非随便哪一篇论文,也都不是,而是那些概念框架。
Software二点零、Vibe Coding 、LLM OS,这些词汇替换人们推敲AI的思量路径标点句号。
03
为什么甘愿做「-2」
Karpathy有着一条清晰线索的职业生涯,他所追逐的从来都不是头衔。
他曾是Hinton的学生,他曾是李飞飞的学生,他曾是奥特曼的同事,他曾是马斯克的直接下属。
每一段经历里世界杯直播平台,他的组织架构位置都是高层。
此时,他融入了Anthropic,其直属上司乃是Nick Joseph;这Nick Joseph是预训练方面的负责人。
Nick Joseph 汇报给 Dario Amodei。
Karpathy 在组织架构中排到了第三层。
Nick Joseph,身为Anthropic创始十一人里的其中一员,在此之前,任职于Vicarious以及OpenAI。
在OpenAI那段时间里,他于安全团队从事代码模型工作,发现在GPT - 3经过微调后具备编写代码的能力,由此意识到AI存在自我改进的可能,于是跟随安全团队的领导一同离去,进而创建了Anthropic。
他所在的团队,训练出了Claude全系列的那些模型,其中涵盖了Mythos ,标点是。
Karpathy 乐意于在下在 Nick Joseph 之下从事研究,缘由极为简单,此位置距离他想要去做的事情最为接近呐。
对他每一回职业变动进行回溯,驱动力都是同一个,那便是「此刻 * 的实验身畔何处」。
2017年前往Tesla,原因在于自动驾驶是Software 2.0的实验场地,是这样的情况。
2022 年离开,因为架构已定,剩下的是工程优化。
2023年,回到了OpenAI,因为GPT,随着GPT - 4发布所带来的爆发期,是最为刺激的前沿。
于 2024 年之时,创办了 Eureka Labs,其目的在于想法设法去验证 AI 原来就有的教育方面的假设。
到2026年,会加入Anthropic,缘由是一场“以AI研究AI”的预训练变革,正在这个地方发生哟。
每一回离开,都并非因为存有不满,而是此刻所处的位置,已不再是那相关 * 的实验的所在之处了。
为什么不回 OpenAI?人才流向给出了答案。
2024年5月加入Anthropic的Jan Leike,曾是OpenAI的前对齐负责人。
OpenAI的联合创始人John Schulman,在同年8月的时候进行了跟进。
现在轮到了 Karpathy。
两年三人,全部单向流动,没有任何可比的反向案例。
如今,OpenAI 在战略方面的重心,已然从单纯专注研究之事转而朝着向着平台化以及收购的方向迈进矣。它收购了 Chat.com 这家公司,还将 io Products 纳入囊中开云真人app官网登录app,又获得了 Windsurf,也买下了 TBPN,仔细瞧来,其相继收购的两次间隔越来越短,所涉及的金额也是越来越庞大了呢。
这是一家正在变成「AI 时代消费巨头」的公司。
对于一个有着「回归研发」想法的研究者来讲,Anthropic那条「以研究质量取胜」的路线具备更大的吸引力。
04
Anthropic 为什么如此想要他
Anthropic 的招聘动机可以分成几层。
最表层是技术需求。
就算Anthropic有着极大的算力预算,可它到头来仍然比不过有微软来给出支持的OpenAI,以及拥有TPU的谷歌。
纯堆算力的竞赛,Anthropic 赢不了。
它必须找到一种用更少算力训出更好模型的方法。
“以 Claude 来加速预训练研究”此走向为这般,可 Karpathy 同时拥有预训练理论深度,拥有大规模工程项目经验,拥有对 AI 辅助研究的直觉,同时具备这三者条件的人非常少,有标点符号。
再往下是人才信号。
两年期间,三位OpenAI核心人物,呈现出单向流入Anthropic之势,“一线研究者用脚投票”这样的叙事,已然成型了。
每一次,Karpathy那般层级的进入,俱在使下一回有才能之人加入的心理限度降低了。才能之人会吸引有才能之人,类似于转轮自行旋转着。
还有 IPO 前的品牌镀金。
Anthropic正就价值高达9000亿美元进行估值的情况下,商谈着300亿美元的 融资事宜,并且其IPO准备工作也正在稳步推进着。
Karpathy是AI领域中,公众辨识度居高位列前几位的技术人物,拥有百万YouTube订阅量,是年度词汇的造词者,其CLAUDE.md仓库还获得了22万GitHub星标。
Anthropic 的员工名单里出现了他的名字,这情况给了投行这样一句话,这话能够被写进招股书里。
最为有意思的一层,或许是,Anthropic没有明确当作招聘动机、然而注定会收获回报的事物,是Karpathy界定范式的能力。
他在Anthropic里做的每项技术探索皆会由他公开谈论,是推文,是博客,还包括YouTube视频。
他以他独有的方式给正在发生着的事进行命名,此时,Anthropic自然而然地成为了那个范式的起源地。
招聘了一位从事预训练研究的人员,同时还额外得到了在行业当中极具影响力的进行技术陈述的人。
05
飞轮的临界点
把这件人事变动放到更大的背景下看,它标记的是一个技术拐点。
在2026年4月的时候,Anthropic公布出版了Mythos Preview,Mythos Preview它是到现在为止最具强大能力的AI模型。
Mythos实力巨强,唯有透过Project Glasswing获邀参与内测,才可以 ,才能够,才有可能。
Mythos,在未经过专门针对网络安全进行训练的情形下,自行发觉并运用了FreeBSD里一个存在长达17年之久的远程代码执行漏洞,还找出了OpenBSD中历经27年的漏洞以及FFmpeg中存在16年的缺陷。
被英国AI安全研究所进行的独立评估予以确认,它是这么一个模型,这个模型能够自始至终,完成一场企业网络攻击模拟,这场模拟包含32步。
Anthropic亲口承认,那些能力并非是经过特意训练而产出的,乃是由于通用的推理以及软件工程能力得到提升之后所出现的“下游涌现”。
预训练做得越好,涌现出的能力越超出预期。
Mythos 是当前最强大的模型,也是当前最强大的工具。
Karpathy前往Anthropic,要开展的事情,在于采用那把能力最为强大的锤子,去着手改善锤子自身的制造途径。
凭借 Mythos 或者 Claude,去探寻更为优质的训练架构,以及数据配比,还有实验方向,务必得让模型改进的速度跳出人工研究者的线性节奏,进而转动起那「AI 改进 AI」的进化飞轮。
这也是 Anthropic 最期望的结局。
当这个飞轮切实开始转动起来,那「AI 自我改进预训练」并不是仅仅只是一个研究方向了,而是变成了通往 AGI 甚至 ASI 的加速通道。
当下,所有涉及算力军备竞赛的竞争维度,所有关乎数据壁垒的竞争维度,所有有关人才争夺的竞争维度,这些全部都有着被这一个变量加以改写的可能性。
三年内,OpenAI 失去三位核心人物给同一个竞争对手。
这个事实的影响可能比任何融资数字都大。
算力,能够凭借金钱去购置,数据,能够依靠时间来积累,然而,能够促使AI进化飞轮得以转动起来的这般的人,在全世界范围内,用一只手就能够数得过来。
Karpathy作出抉择,于此刻抛弃自由身份,转身回归一线。他觉得窗口临近跟前。
该内容由名为投资界合作伙伴的微信公众号新智元授权发布于此平台只不过在此平台仅提供信息存储服务而已,要是存在任何疑问的话请联系邮箱为editor@zero2ipo.com.cn称作投资界以进行处理。
标签: AI Karpathy Anthropic OpenAI 预训练
还木有评论哦,快来抢沙发吧~