菜单
首页财产阐发评论投资正文 专治AI扯谎,25岁天才奼女公司估值过百亿 Axiom的将来,更像是一场抱负主义的压力测试。 从“绝对于准确”的技能抱负,到“相对于经济”的贸易世界,Axiom的挑战,才方才最先。 2026-04-13 08:36 ·字母榜张琳 AI投资人解读· Axiom建立不足两年,员工20多人,获2亿美元A轮融资,投后估值16亿美元。其用数学验证AI,解决年夜模子幻觉问题,团队成员配景奢华。 · 行业竞争加重,如Meta等公司纷纷进入该赛道贸易模式待摸索,于金融场景中现实价值存疑高估值带来压力,需证实技能具有范围化贸易化可能。 总结:Axiom依附立异技能及奢华团队具有投资潜力,但面对竞争、贸易模式及高估值等挑战,后续成长需存眷其技能贸易化进展和市场竞争应答计谋。内容由AI天生,仅供参考
25岁的洪乐潼,近来于硅谷火了。
这个来自广东的女孩,17岁考入MIT,三年修完数学及物理双学位,厥后又进入斯坦福深造。
根据硅谷最认识的那套叙事,她是“天才奼女创业者”的模板人物。
但洪乐潼真正让人记住的,不是经历,而是她做的事太反知识。
当整个AI行业都于追赶更年夜的模子、更强的天生能力、更像人的表达时,她恰恰回身去做了一件最不性感、也最难贸易化的事:用数学验证AI。
她开办的公司叫Axiom,建立不足两年,员工只有20多人,近来拿下2亿美元A轮融资,投后估值高达16亿美元,折合人平易近币超110亿元。
Axiom不做谈天呆板人,不做文生图,也不跟风年夜语言模子的热潮。它做的是“情势化验证”。
说白了,就是想用数学及逻辑,把AI每一一步推理都酿成可以查抄、可以证实、可以追责的工具。
这听起来很冷门,但它对准的,倒是年夜模子最贫苦的软肋——幻觉。
此刻的AI*的问题不是不敷强,而是不敷靠得住。它可以把谜底说患上很像对于的,甚至真的做对于题,但你无法确认它究竟是真的推出来了,还有是只是“猜对于了”。而Axiom要做的,就是把这类恍惚状况,酿成一种可验证简直定性历程。
这也是为何,当洪乐潼拿着这个设法去融资时,迎面撞上的不是掌声,而是一个极为实际的问题:“数学怎么赚钱?”
01
迎难而上的天才奼女
洪乐潼的办公室于硅谷帕洛阿尔托年夜学年夜道,间隔斯坦福年夜学步行只要半个小时。斯坦福是她博士生活生计的出发点,但学位还有没有念完,她就退学创业了。
事实上,早于博士于读时期,洪乐潼就已经经注册了公司。公司取名Axiom,名字源自数学术语“千米”,“我想从正义出发,打造一个可以或许自我改良的超等智能推理器。”
一个24岁的博士生,没钱没人没产物,仅凭一个设法,她就拿下了960万美元的种子轮投资。
凭甚么?
要知道现有的年夜模子素质上是几率黑盒,经由过程海量数据进修模式,然后基在统计纪律给出谜底。推理历程没法被量化,以是会乱说、会堕落。
洪乐潼要做的就是用数学正义及情势化验证,让AI每一一步推理均可证实,可以直接面向金融、兵工、芯片及主动驾驶等对于靠得住性要求极高的市场。
她做的事显然击中了AI *痛点,解决幻觉与靠得住性的问题。
更况且,初期投资投人,她本人也是彻彻底底的跨学科天才学霸。
洪乐潼从小就揭示出了惊人的数学先天。2001年,她出生在广州市河汉区,曾经就读在华南师年夜附中。高一时,她就于天下数学奥林匹克选拔赛中晋级,并于华罗庚杯、天下高中数学联赛中屡获佳绩。
恰是于奥数集训中,她对于研究型数学孕育发生了兴致。
2018年,17岁的她被MIT登科,3年就修完了数学及物理双学位,不仅发表了9篇学术论文,还有得到全美男性数学家最高声誉Alice T. Schafer数学奖等诸多声誉。
今后,她得到牛津年夜学罗德奖学金,她没有继承深耕数学,回头去学了神经科学,由于想“构建超过科学范畴的认知系统”。
基在这一方针,她同时于伦敦年夜学学院盖茨比计较神经科学中央开展深度进修研究,该中央由“深度进修之父”杰弗里·辛顿结合创建。也恰是于此时期,她正式踏足AI范畴,接触到很多最前沿的课题。随后她又进入斯坦福年夜学,攻读数学与法令双学科博士。
2024年,ChatGPT o3被暴光于数学测试中存于“做弊”嫌疑,全世界舆论哗然。
作为斯坦福数学博士的洪乐潼也于社交媒体上发表了见解:“OpenAI年夜模子于数学测试中体现优异,年夜几率是由于练习数据中提早泄题了。于一些测试中,年夜模子回覆的正确率虽然高达96%,但一旦展示推理历程,患上分率就降至5%。”
面临行业痛点,一种名为Lean的语言突入她的视野,也让她嗅到了创业时机。
与天然语言差别,Lean语言是一个很是神奇的、可以自验证的数学编程语言。洪乐潼打了个比喻:“假如用英语写出数学证实,我没措施知道一个5000行的证实是否准确,需要找高程度的专家验证。但Lean是自验证的,只要跑通了就是对于的。”
Lean的逻辑是把天然语言或者非情势化验证,转成呆板可查抄的情势化验证。
那啥是情势化验证呢?
平凡的AI,你只能用它的谜底来判定它是否是理解这个问题,但你不知道它中间有无瞎蒙。
情势化验证是要求你把每一一步都写成呆板能查抄的逻辑链条。只要中间有一步跳了、糊了、偷懒了,它就不给过。
之以是情势化验证能治年夜模子会幻觉,是由于情势化验证无论你谜底怎样,只要你的结论是畴前提里一步步正当推出来的,那谜底就是对于的,从而防止了模子孕育发生幻觉。
以是Axiom做的,就是让年夜模子卖力料想及搜刮,让Lean卖力验算及判定。假如Lean查抄发明历程不合错误,那就退归去继承改。
但这显然是一条窄路。这条路冷门到甚么水平?于整个AI邦畿里,情势化验证险些是边沿中的边沿,全世界的贸易化玩家一只手就数患上过来。
显然她其实不是由于情势化验证是下一个风口才选的,而是由于她对于“坚苦”的界说及他人纷歧样。
奥赛就像连续开释多巴胺的快感,而研究型数学像于撞墙,布满疾苦与煎熬。我实在尤其喜欢这类挑战感。”她曾经如许注释本身痴迷数学的缘故原由。
恰是这类刻于骨子里的挑战欲,让她不肯再逗留于学术研究的恬静区,巴望于更广漠的疆场上去霸占AI范畴的硬骨头。
2024年暮秋,斯坦福四周的一家咖啡馆里,洪乐潼与其时Meta AI研究总监Shubho Sengupta聊了整整几个小时,焦点议题只有一个:AI能不克不及真正学会数学推理?
两人一拍即合,一个退学,一个告退,两人一路创业。
02
一支“草根”工程师军团
Axiom只有20多名员工,洪乐潼用了一个词来形容团队的气质:草根工程师精力。
但事实上,这支团队的成员身份一点也不草根,甚至配景可谓奢华。
Axiom*位成员,恰是及她于咖啡馆聊了好几个小时的Meta前员工Shubho Sengupta,如今他的身份是公司的CTO。
焦点科学家François Charton,则是将Transformer架构引入数学推理范畴的前驱人物。他干的活,就是把数学算式当做一种“语言”输入进Transformer,尝尝看Transformer能不克不及像翻译句子同样去翻译数学。
其他成员约对折来自Meta AI,另外一半则是世界级数学家与情势化验证前驱。
而最使外界震动的一名成员,是57岁的数学泰斗小野健(Ken Ono)。
他是模情势范畴的*学者,美国数学学会前副会长,拿过古根海姆奖、斯隆奖等声誉。引导过的学生中有十位摩根奖患上主。他还有曾经为美国奥运游泳队提供数据阐发,为影戏《知无涯者》担当参谋。
这位弗吉尼亚年夜学终身传授与洪乐潼结缘在麻省理工。彼时年夜一新生洪乐潼介入了他的数论项目。师生瓜葛延续至今,脚色却已经差别,2025年末,小野健辞去教职,全职插手Axiom,成为第15号员工。
曾经拒绝过Google及Meta约请的小野健,为何愿意为一个24岁的学生“打工”?
“假如我的料想能被呆板于3天内推广到10个维度,我愿意当一个‘标注工’。”小野健曾经公然暗示,他选择帮本身的学生打工,不仅由于洪乐潼开出“不设讲授、不设行政、100%科研”的合约,更要害的是,AI对于他的“降维冲击”,让他感应高兴。
一群*学者及前Meta成员,这个团队哪里草根了?
洪乐潼的注释是,草根,代表着始终“空杯”的心态及坚韧的品质。于创业这条路上,纵然是资深“牛人”,也要重新学起,不停自我改造。
她本身最喜欢的不是当“精英”,而是做“草根”,做个nobody(小人物),如许进修的坡度最陡、速率最快。
她本身也是“草根精力”的践行者,于被问到怎样领导团队时,洪乐潼说:“我实在不太喜欢用领导这个词。我但愿本身是一个Individual contributor(自力孝敬者),每一个人都是,这是一群志同志合的人于一路干事。”
“咱们创建Axiom,就是要无穷压缩把好奇心转化为真谛的时间”,于本钱驱动的硅谷,洪乐潼的这类纯粹性,对于在*研究者而言,也许比一份高薪offer更有吸引力。
这支不到20人的团队,于建立后不到一年就交出了一份使人不测的答卷。
2025年12月3日,Axiom公布其焦点体系AxiomProver于无人干涉干与的环境下,霸占了困扰数学界数十年的两道埃尔德什难题。
统一天,洪乐潼收到了入选“福布斯30岁如下30人”榜单的动静。
同月,AxiomProver又于普特南数学竞赛中斩获满分,12道题全对于。普特南是北美最负盛名的年夜学生数学竞赛,成就的中位数经常为零,已往近百年仅有5小我私家类选手拿到过满分。
Axiom进一步印证了用情势化验证构建靠得住、可核验、无幻觉的AI,已经是行业明确的主要标的目的,而 AxiomProver 则于这条路径上交出了可复现、高难度的实证。
03
赛道升温,但挑战方才最先
从行业成长来看,洪乐潼的选择正好踩于了技能迁移转变点上。
2024年年末,Meta FAIR及斯坦福年夜学等多所机构结合发布了一篇态度论文《Formal Mathematical Reasoning: A New Frontier in AI》。
论文给出了如许一个判定,已往的AI数学就是喂许多数学题,再让模子输出谜底。这就致使数据会污染、历程会胡编,AI没措施自判定对于错,而且还有很难复现历程。
这显然是路走错了。就拿乘法口诀表来讲,内里写的是2*3患上6,那末你本身也能理解3*2就也患上6。这个历程就叫复现。
论文主意的是下一步要把证实助手、情势体系、主动验证真正接进模子里来,让AI真正懂数学。
但这也象征着这条窄路正于变患上拥堵。
已往十年,AI赛道的主流叙事是“更年夜参数、更大都据、更快天生”,所有至公司都于这条路上疾走。洪乐潼选择的情势化验证是此中冷门到险些没有竞争的赛道。
本年年头,Meta也发布了半情势化推理技能,让年夜语言模子可以或许于不履行代码的环境下验证代码补钉,正确率高达93%。竞品公司Harmonic于本年1月得到了英伟达投资,估值达14.5亿美元,产物已经扩大到代码编写及芯片设计范畴。Theorem、Axiomatic AI、Cajal等一批草创公司,也于近两年纷纷进入这个赛道。
对于Axiom而言,挑战远不止行业竞争。
*的挑战于在贸易模式。洪乐潼最初的假想是将产物办事在对于冲基金及量化生意业务公司,快速解决与资产订价、股市猜测相干的繁杂数学问题。
但这个蓝图至今仍逗留于构思阶段。对于高频生意业务而言,比“准确”更主要的是“充足快”,毫秒级的延迟可能比一次稀有过错带来更年夜丧失。
Axiom的*准确性,于寻求速率的金融场景中,实在际价值今朝仍需要打一个问号。另外一个挑战,则于在除了了对于价格不敏感的航空航天、国防兵工等少数范畴,其他绝年夜大都企业愿意为“*准确”付出高溢价吗?
洪乐潼本身也认可这一点:“数学怎么赚钱?咱们从一最先就面对这个挑战。”但她认为,“此刻,贸易旌旗灯号已经经清楚许多,数学能创造价值,是由于它能自我验证、自我查抄。”
另外一方面,高估值自己也是一把双刃剑。16亿美元的A轮估值象征着,投资人指望的是超高速的增加及明确的退前途径。
Axiom必需于将来一到两年内证实其技能具有范围化贸易化的可能,不然下一轮融资将面对巨年夜压力。与此同时,它需要于巨头及强劲敌手的夹击中,用更少的资源跑出更快的速率。
Axiom的将来,更像是一场抱负主义的压力测试。 从“*准确”的技能抱负,到“相对于经济”的贸易世界,Axiom的挑战,才方才最先。
【本文由投资界互助伙伴字母榜授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。
-太阳集团tyc86