太阳集团tyc86-不缺钱的梁文锋,为什么要融资?

2026-04-20 20:48:08

首页财产阐发评论ai正文 不缺钱的梁文锋,为何要融资? DeepSeek最先追求至少3亿美元外部融资,此前其排斥本钱,现因职员流掉、产物节拍问题和竞争逻辑变化,这次融资意于解决多方面困境。 2026-04-18 11:42 ·微信公家号:版面以外画画 AI投资人解读· DeepSeek 曾经拒绝外部融资,依附自研平台与资源上风做出高机能模子。现追求至少 3 亿美元融资,估值不低在 100 亿美元,或者为解决人材流掉、产物节拍问题和介入竞争。 · 焦点成员因高薪与更好成长时机去职,影响研发产物 V4 因技能、荣誉和芯片适配问题延期行业竞争维度改变,其缺少运用层产物。 总结:DeepSeek 虽有技能上风,但面对人材、产物和竞争挑战。这次融资若乐成,有望解决部门问题,晋升竞争力,但其可否借此冲破仍有待不雅察。内容由AI天生,仅供参考

DeepSeek 最先接触外部本钱了。

The Information 引述四位知恋人士报导,DeepSeek 正于追求至少 3 亿美元的初次外部融资,估值不低在 100 亿美元。

假如把时间拨回两年前,这险些是一个不可立的命题。于那段时间里,这家公司是整个中国 AI 行业里最反知识的存于。

当所有人都于融资、扩张、讲生态、抢进口的时辰,DeepSeek反而于做一种决心的紧缩,不合错误外发声,不频仍发产物,不介入年夜厂叙事,甚至对于本钱连结间隔。

许多投资人测验考试靠近过,获得的反馈险些一致:没有融资规划。

于一个高度本钱驱动的行业里,这类姿态显患上反工业逻辑。但也正由于云云,DeepSeek 一度被视为一个异类样本,一个试图于 AI 时代验证"少资源路径"的团队。

以是此次融资旌旗灯号里,真正主要的不是金额,也不是估值,是它打破了一种连续两年的计谋条件:DeepSeek 再也不试图把本身断绝于系统以外。

1、DeepSeek的防火墙

梁文锋对于外部本钱的排斥有很深的泉源。

2022 年先后,量化行业被政策连续打压,幻方治理范围从*期间的千亿缩减了泰半。手里攥着年夜量充裕的 GPU 集群及现金,梁文锋一度想经由过程投资入股或者云厂商互助的方式把算力用出去。

他专门招了两小我私家做战投,看了一圈科技项目,低空经济、智能硬件、SaaS,终极一个也没投。

其时DeepSeek内部的判定是,外面能做的事,本身也做患了。

2023 年 7 月,DeepSeek 正式建立。梁文锋从*天就给这家公司划了一条线,不接管外部融资,不稀释股权,不被任何人的贸易化时间表绑架。

他想造的工具,更像一个纯粹的研究机构,追 AGI、做开源、让技能自己措辞。

底气是实打实的。

早于 2019 年,他就花 2 亿元自研了深度进修练习平台萤火一号。两年后又砸 10 亿元建萤火二号,多量采入英伟达 A100,把幻方做成为了海内寥寥可数的万卡集群公司。

疫情时期芯片供给最紧张的那阵子,幻方已经经提早囤好了货。2025 年,幻方整年收益率 56.6%,营收超 50 亿人平易近币。

梁文锋的荷包子,比绝年夜大都 AI 创业公司的投资人都丰厚。

有钱、有卡、有人。VC 的钱反而是承担,带着对于赌、带着估值压力、带着何时变现的追问。他说患上很直接:VC 都是帮 LP 管钱,都患上赚钱,以是就谈不到一块去。

这条路于 2025 年 1 月达到了*。R1 发布,练习成本约 560 万美元,机能迫近 OpenAI 的*体系。

"用十分之一的钱做出同级模子",这个故事让行业意想到一件事,*模子能力,并不是只能经由过程极度的资源重叠得到。

那一刻,DeepSeek 的意义被迅速放年夜。它提供的不只是一个模子,是一种可能性,于资源不占优的环境下,仍旧可以进入焦点竞争区。

防火墙不仅立住了,还有成为了故事的一部门。

但故事的问题于在,它需要不停被续写。

2、裂痕呈现了

裂痕不是忽然呈现的,它从 R1 发布以后就最先生长,只是其时的旌旗灯号是分离的。

*松动的是人。

*模子团队有一个共性,焦点成员的市场价值极高,一旦项目进入空档期,这些人就会成为整个市场的方针。

最早被留意到的是罗福莉,V3 架构的要害开发者,2025 年末转投小米接办 MiMo 年夜模子团队。差未几统一期间,*代年夜语言模子焦点作者王炳宣去了腾讯,多模态标的目的的焦点研究员阮翀插手元戎启行做首席科学家,OCR 系列焦点作者魏浩然也于本年春节先后脱离。

然后是郭达雅。1994 年生,中山年夜学博士,于 DeepSeek 只待了两年,却全程介入了 V三、R一、Coder、Math、Prover 等险些所有标记性模子的研发。他提出的 GRPO 算法是 R1 的焦点技能底座,论文总被引跨越 37000 次,于同龄的中国 AI 研究者里险些找不到敌手。

就于前两天,郭达雅插手字节跳动,标的目的是智能体。(延长浏览:张一鸣,信达雅)

五个焦点研发主干,于不到一年的时间里接踵出走。这些流动的意义凌驾了人走了自己,于模子研发里,经验高度路径依靠,焦点成员的脱离会直接影响下一轮迭代的效率及节拍。

他们为何走?

猎头圈传播的数字是,年夜厂给 DeepSeek 焦点技能职员的开价,遍及是原薪资的两到三倍。字节 Seed 团队从 2025 年 9 月起推出专项期权津贴,按职级每个月发放 9 万到 13.5 万元不等的期权,价格低在内部回购价,相称在直接打折。

梁文锋的治理哲学于中国科技行业里险些是个异类:不加班、不打卡、不设 KPI。员工下战书六七点走人,早上不消签到。

他认为一小我私家天天高质量事情的时间很难跨越六到八小时。这类文化于 DeepSeek 还有是小团队的时辰运转患上很好,智慧的人给够自由度,他们本身会往最难的标的目的冲。

但当外面有人拿八位数总包来敲门的时辰,自由就不敷用了。

更致命的是期权。DeepSeek 从未融资,没有市场化的估值锚点。你给焦点成员一个股权承诺,他拿得手里无法换算成真金白银。年夜厂的期权有行权价、有内部回购机制、有 IPO 预期。外界只知道 DeepSeek 很值钱,但到底值几多,没有人能说清,员工更不知道。

郭达雅的脱离可能比薪资的账面差距更值患上揣摩。他去字节做的是智能体,DeepSeek 至今没有任何一个 Agent 产物,R1 发布时甚至不撑持 function call(函数挪用)。

想做 Agent,但地点的公司不做这个标的目的,这类错位,给再多钱也填不上。

与人一路松动的,还有有产物节拍。

下一代旗舰 V4 原本定于春节先后发布,推到 2 月,再推到 3 月,今朝的口径是 4 月下旬。从公然信息来看,延期暗地里至少有三层缘故原由交叉于一路。

最直接的一层是技能线路自己发生了质变。

V4 要做的已经经再也不是一个刷 benchmark 的基础模子,万亿参数 MoE 架构、原生多模态、百万 token 上下文、全新的 Engram 前提影象机制,这是体系级工程,练习验证的繁杂度陡然上了一个台阶。

更深一层的压力来自身份包袱。

DeepSeek 立品靠的是十分之一成本做到*这个故事。V4 假如只是机能微增却推高了推理成本,支撑估值及荣誉的故事就会呈现裂缝。某种水平上,一个不敷冷艳的 V4,反而不如不发。

还有有一层很少被充实会商。国产芯片的深度适配。多方信源于 4 月初披露,V4 将周全运行于华为昇腾 950PR 芯片上,有望成为*彻底跑于国产算力上的旗舰年夜模子。战略价值极高,但这自己就是一个自力的巨型工程,直接吃失了年夜量研发带宽。

到 2026 年 4 月,DeepSeek 已经有 15 个月没有年夜版本更新。而这时期,OpenAI 迭代四五轮,Anthropic 连推 Claude 4.5/4.6/4.7,海内偕行如智谱、月之暗面、字节也于运用层狂飙突进。

所有人都于加快,只有DeepSeek 静暗暗。

及许多团队差别,DeepSeek 于 R1 以后没有迅速扩张,没有年夜范围贸易化推进,没有密集的版本更新。

其时不少人把这类节拍理解为定力。但从今天回看,它更靠近一种自动选择,尽可能延伸"试验室状况"的时间。

连结克制素质上是于节制节拍,但当外部情况总体加快时,节拍就再也不彻底由本身决议了。

3、竞争换了一套逻辑

假如把 DeepSeek 当前的处境零丁看,很轻易归由于公司内部问题。但更要害的变量来自外部,已往15个月,整个行业的竞争维度发生了巨年夜的迁徙。

更早的时辰,年夜模子竞争的焦点于架构、练习要领及工程优化上。2026 年以后,新的工具最先盘踞主导,算力池的范围、人材的密度、运用层的反馈速率。三者配合决议了迭代能跑多快。

海外头部公司的收入布局已经经申明了标的目的。

Anthropic 年化收入从 90 亿美元翻到 300 亿美元,用了四个月,增量险些全数来自 Claude Code 这一款编程智能体。Cursor 一个代码编纂器,估值 600 亿美元。GitHub Copilot 笼罩了 2000 万开发者。

钱于流向能直接产出代码、产出东西、产出运用的产物。

海内偕行也于快速补位,字节、阿里、腾讯各自铺了 Coding 及 Agent 产物线,智谱及月之暗面的 API 于年头的小龙虾热潮中被打爆,偏偏由于它们于 Coding 标的目的上的押注。

很显然,单点的模子能力仍旧主要,但再也不是*的决议因素。资源、构造、体系能力,最先成为要害变量。中国几家头部公司已往一年的动作路径差别,标的目的一致,把模子能力嵌入到更年夜的体系里。

DeepSeek 有全世界开源社区最高的人气,GitHub 上 17 万颗星,2.6 万个企业账户,每个月 57 亿次 API 挪用。但它没有本身的 IDE,没有 Coding 东西,没有 Agent 产物,没有终端用户直接为之付费的垂直运用。

梁文锋一直对峙模子是一切的根底。

他近来签名的论文标的目的,前提影象机制、超毗连优化 Transformer,申明DeepSeek的留意力仍旧于解决底层问题。这类执着于 R1 时代被验证过,用起码的钱及人,把基础能力做到*,剩下的交给开源生态。

但当竞争从基础模子能力扩大到能力 + 产物 + 生态同时比拼的时辰,只有策动机没有整车,再强也跑不起来。

3 月 29 日晚间,DeepSeek 遭受了上线以来连续时间最长的一次办事中止,跨越 7 小时,波和数亿用户。官方没有注释缘故原由。中止时期竞品流量较着跳升,部门企业客户最先思量多平台冗余计谋。

一次宕机不会杀死一家公司,但它把一个事实推到了台面上。当用户从百万级涨到亿级,基础举措措施的投入就不是效率优化能兜住的了。

幻方的利润撑患上住,但撑患上不自在。

4、3 亿美元买甚么?

3 亿美元对于 100 亿美元的估值来讲,稀释比例不到 3%。对于比 Anthropic 及OpenAI 如许的巨头来讲,这个数字甚至显患上极其克制。

梁文锋真正想买的工具,可能不于资产欠债表上。

起首,期权终究有了锚点。 100 亿美元的订价一旦确认,焦点团队手里的股权就成为了真金白银。对于一个正于被年夜厂逐个挖角的团队来讲,这个旌旗灯号比任何加薪方案都管用,现阶段止住人材流掉至关主要。

其次,这是 V4 的保险金。

华为昇腾的全量适配自己就于烧资源,与此同时媒体报导称DeepSeek 也于用英伟达最新一代 Blackwell 芯片练习下一代模子,而这款芯片受出口管束影响,获取节拍存于变数。两条硬件线路并行,资金耗损成倍放年夜。

最微妙的一层是,这是一张进入下半场的入场券。

AI 竞争已经进入模子、产物、生态、本钱四轮驱动的阶段。你可以拥有全世界*的策动机,但若没有本钱违书及产物生态,你终极只是财产链里的一位高级供给商,看他人拿你的模子赚钱。

从 V4 的研发标的目的来看,梁文锋年夜概已经经意想到了这一点。多方信源显示,V4 的计划明确包罗了 AI 搜刮、持久影象及代码能力的年夜幅跃升,这些都是 Agent 时代的底层能力。

DeepSeek 于补课。融资,是为了让这门课来患上和上完。

【版面以外】的话:

外界很轻易把此次转向理解为让步。但换一个角度看,它更靠近一种从试验状况向工业状况的进化。

AI 行业的成本曲线已经陡然上扬,人材通胀凌驾了所有人的预期。依赖小我私家气势派头及单一利润源去扛一家超等独角兽,变患上愈来愈不实际。

梁文锋已往的选择有它的逻辑,节制范围、防止过早贸易化、连结研发的纯度。如许的选择,于特定阶段*发作力,但行业节拍终极会对于所有人孕育发生约束。

3 亿美元,是梁文锋*次公然认可这件事。

【本文由投资界互助伙伴微信公家号:版面以外授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。

-太阳集团tyc86

下载360浏览器