书架 |登录

第519章 和DS的合作 一

作者:见习人类观察员字数:2.7千字更新时间:2026-06-20 12:01:31
第519章 和DS的合作 一

第二周的一个上午,四月上旬,天气非常不错。徐辰前往了位于中关村的深度求索北京分公司。

深度求索北京分公司就在融科资讯中心,距离北大东门也就一公里不到。本身放在这边,就是为了吸引北大、清华、中科院这一圈密度高到离谱的高校人才。结果徐辰之前一直没意识到它居然这么近,近到石南把车钥匙都掏出来了,徐辰看了眼导航,沉默两秒后提议:要不骑共享单车吧。

于是,两人一人一辆共享单车,沿着北大东门外的路一路骑到了融科资讯中心。

……

把单车停在大厦楼下的专属非机动车划线区,徐辰抬头看了一眼这栋充满现代科技感的建筑。

就在这栋大楼里,藏着如今全球AI领域最炙手可热的超级独角兽。

回望过去的一年多的时间,整个全球AI市场经历了一场史无前例的大洗牌。

而这场十二级大地震的始作俑者,正是徐辰当年顺手用来“刷经验“的那套SLRM(逻辑增强模块)框架。

SLRM横空出世之前,整个AI产业的底层逻辑其实很简单粗暴——

拼算力,拼参数,拼谁家显卡堆得更多。

十万张H100起步,二十万张算入门。低于这个规模,你都不好意思说自己在搞前沿AI研究。

那时候的AI创业公司里,最重要的岗位不是首席科学家,而是首席融资官。因为模型还没训练完,账上的钱可能先烧没了。

美国那边的资本市场则直接烧成了狂欢。2026年前后,OpenAI、Anthropic等公司的估值一度接近万亿美元,折合人民币将近七万亿。华尔街最流行的一句话是:

“AI公司不是按照收入估值,而是按照未来人类文明的所有现金流估值。“

翻译成人话就是——反正先吹,吹爆了再说。

只要公司PPT里写上“AGI“,配一张炫酷的神经网络结构图,估值就能自动往上蹿三层楼。

然后SLRM来了。

SLRM引入了极强的符号逻辑推理能力,使模型不再单纯依赖概率预测来“蒙答案“。许多原本必须在云端超大模型上完成的任务,被小模型加逻辑增强模块就能完成得七七八八。

算力需求,出现了断崖式的下滑。

本地化部署随即兴起。企业不再非得把所有数据上传到云端,个人用户也能在自己的终端设备上运行足够强大的智能助手。

原本那些靠垄断算力起家、靠“云端霸权“撑估值的科技巨头们,这下直接傻了眼。

市场格局瞬间从“几家寡头垄断“变成了“百花齐放,群魔乱舞“。

一句话总结:以前只有巨头玩得起AI,现在稍微有点工程能力的中型企业,也能在垂直场景里搞出像模像样的产品。

这对技术生态当然是好事。

但对那些靠算力护城河支撑着天价估值的美国AI巨头来说,就不那么友好了。

OpenAI和Anthropic在可用性上已经未必胜过全面拥抱新架构的国内企业,如今却仍靠着美股市场强大的金融想象力,死守着3000亿美元(约2万亿人民币)上下的估值。看起来账面数字依然吓人,可懂行的人都清楚,和2026年八九千亿美元的巅峰相比,这已经是腰斩再腰斩。

技术可以输,叙事不能输。

只要还能讲“美国引领AGI未来“的故事,股价就还能硬撑一段。这大概就是美国金融市场最动人的地方——即便皇帝已经没有新衣,只要华尔街的分析师还在卖力鼓掌,这场狂欢就不会轻易落幕。

当然,眼下的格局也并非铁板一块。

华为的LPU(逻辑处理单元)产能依然有限,而SLRM的推理能力对LPU的依赖远比传统GPU深得多。算力的硬件瓶颈,无形中给了美国AI公司一定的喘息机会。总体而言,如今华国在算法层面已经实现了对美国的全面超越,算力上略有差距但整体可控、且未来可期,数据层面美国公司依然凭借历史积累保有一定优势。华国AI曾经落后半年到一年的差距,如今已基本追平,并且一旦LPU产能跟上,大概率将彻底完成反超。

而在这场大洗牌中,最早抓住SLRM红利、被徐辰亲手“点拨“过D-LTMN记忆机制的DeepSeek(深度求索),则借着这股东风一路狂飙,如今已彻底确立了全球AI技术Top1的统治地位。

市值1万亿人民币。

因为走的是开源普惠路线,账面数字看起来不如美国那几家唬人。

但在真正懂行的人眼里,DS才是当之无愧的无冕之王。

……

一楼大厅里,已经有深度求索的员工等着接人。徐辰刚到,对方便快步迎了上来,态度十分恭敬地把他领进电梯,直接按下了最高层。

电梯门刚打开,梁文锋正好从办公室里出来。

“徐教授。”梁文锋先一步伸出手,笑得很自然,“终于把你等来了。”

“梁总,打扰了。”徐辰和他握了握手。

两人都不是那种喜欢把寒暄拉得很长的人,简单叙了两句近况,梁文锋便顺手带着徐辰在公司里走了一圈,简单地参观了下。

逛完一圈,两人很快回到梁文锋的办公室,门一关,外面的喧嚣就被彻底隔开了。

这次见面,前面的铺垫其实已经够了,真正要谈的只是最关键的细节。

梁文锋给徐辰倒了杯茶,自己在对面坐下,直接切入正题:“你先给我讲讲这套框架现在到哪一步了。”

徐辰也不绕弯,从包里取出笔记本,打开后,把“诸葛”架构的整体思路、SLRM在灵感模块上的设计,以及目前那版Demo的测试结果,简单而清晰地过了一遍。

从为什么要把Transformer的概率式联想压下去,到为什么要用SLRM去接管高精度推演,再到模型在IMO压轴题上的表现,徐辰都讲得明明白白。讲到最后,他索性把笔记本转过去,让梁文锋看后台记录的几组效果数据。

梁文锋看得很认真。

他没有急着开口,先是把几页日志来回扫了两遍,手指在桌面上轻轻点着,像是在脑子里默算什么。几秒后,他才抬起头,目光里多了几分真正的兴味。

“很漂亮。”他先给了一个极高的评价,语气里没有半点敷衍,“不是那种‘堆出来的漂亮’,是底层逻辑真的站得住。”

徐辰笑了笑,没接这个夸奖,只是安静等着他的下文。

梁文锋把笔记本推回给徐辰,身体微微后靠,话锋也跟着一转:“但我得先说句实话,这东西的商业前景,确实不太好。”

徐辰闻言,心里一点也不意外。

这种话术,他之前已经在其他公司那边听过几轮了。梁文锋这话,倒不完全是压价,这确实是事实。来之前他自己在心里也盘算过,这项目要是真铺开,算上高昂的机会成本,前几年非但见不到回头钱,大概率还会是个吞金的无底洞。

因为上百名顶尖工程师,按三百万年薪算都得一年3个亿;再加上稀缺的LPU算力卡,以及为了这个项目必须腾挪掉的其他商业模型的资源,整个成本轻轻松松就会滚到十个亿。

而这些钱砸下去,换来的却很可能只是一个“学术圈叫好、商业上不赚钱”的产品。毕竟,这世上需要用到这台机器的顶尖数学研究者,满打满算也就那么一小撮人。

所以这事,看起来徐辰技术很牛,但其实在残酷的商业逻辑面前,手握资源的DS才是掌握主动权的那一方。

……

设置
作品详情 加书架
章节进度
评论 (0条)
评论加载中...
0/1000
作品封面 正序
目录加载中...
加书架
上一章 目录 下一章