新闻动态
你的位置: 开云平台皇马赞助商(中国)官方入口 > 新闻动态 >

开yun体育网
中国不成能永远随从!
作 者丨张静波
华商韬略出品丨ID:hstl8888
2024 年冬天,杭州。
当西方还千里浸在圣诞节的狂欢中时,一位中国码农,站在宽绰的落地窗前,瞭望着窗外的京杭大运河。
几分钟后,他作念了一件令硅谷颤抖的事。

"一种新的样貌,让通盘山谷都嗡嗡作响!"
好意思国 CNBC 电视台在报谈这件事对硅谷的影响时,这样评价谈。
12 月 26 日,杭州一家名为"深度求索"的中国初创公司,发布了全新一代大模子:
DeepSeek-V3。
在多个基准测试中,DeepSeek-V3 的性能均越过了其他开源模子,致使与顶尖的闭源大模子 GPT-4o 不相落魄。

尤其在数学推理上,DeepSeek-V3 更是遥遥最初。
令东谈主诧异的是,DeepSeek-V3 在性能并列 GPT-4o 的同期,研发却只花了 558 万好意思元,侦查成本不到后者的二十分之一。
这让好意思国东谈主绝对坐不住了。
在此之前,谷歌和 Open AI 花了几年时期,耗资数亿致使数十亿好意思元,调用了几万块首先进的 GPU,才干成相通的事情。
浓烈的对比,让好意思国东谈主反想:大模子和算力,是否还值得投资?
许多硅谷大佬在纷纷点赞的同期,也体验到中国科技带来的苦涩:当好意思国东谈主休息时,他们在极力追上咱们!
有预料的是,这件事与中国空军六代机现身,险些前后脚发生。
不少好意思国东谈主觉得,这比六代机更像上世纪 50 年代,苏联抢先辐射第一颗东谈主造卫星的斯普特尼克时刻。
关联词,果然让好意思国硅谷感到震憾的,还不是 DeepSeek-V3 的高性能、低成本,而是中国东谈主展现出的独创精神。
中国 AI 公司往时险些都在照搬硅谷,以致东谈主们精深觉得:好意思国擅长从 0 到 1 的时刻突破,而中国只擅长从 1 到 100 的利用落地。
DeepSeek-V3 冲破了这种成见,它以 MLA、DeepSeekMoE 等多项草创性时刻,大幅进步了模子的性能和侦查后果。
好意思国东谈主诧异地发现,正本中国公司也不错行为改进孝敬者,在他们的游戏除外,自定游戏轨则。这在往时是极其萧索的。
因为阐发太过优胜,DeepSeek 在硅谷被誉为来自东方的微妙力量。
这股微妙的东方力量,令东谈主称奇的所在在于,它幕后的资方并不是腾讯、阿里这样的互联网巨头,而是一家低调的私募基金——幻方量化。
现在,国内领有万卡 GPU 的企业不进步 5 家,幻方即是其中之一。
它在 2023 年缔造子公司"深度求索",运转 DeepSeek 大模子的研发,通盘团队只须 139 名成员,远少于 OpenAI 的 1200 东谈主。
执掌这支战队的,是一个叫梁文峰的 80 后,亦然幻方量化的创始东谈主。

梁文峰和幻方的故事,始于 2008 年。
那一年,从浙大毕业、主修软件工程的他,莫得像同龄东谈主一样,干预大厂当码农,而是一个东谈主跑到成都,蜗居在出租屋里。
在那处,梁文峰运转考虑用野情绪赢利的多样门道。
几番折腾下来,他决定下场作念量化投资。但这个决定并辞让易,毕竟那时量化在国内如故个新事物。
许多东谈主并不坚信,量化不错赢利。
每当困难时,梁文峰总会想起量化投资之父西蒙斯的一句话:一定有办法对价钱建模。
在这个信念相沿下,梁文峰苦苦熬了两年,终于柳暗花明。2010 年,沪深 300 股指期货推出,量化投资迎来了春天。
乘着这股东风,梁文峰和他的团队大赚一笔,自营资金进步 5 亿元。
也即是合并时期,跟着深度学习算法的突破,东谈主工智能大爆发。早年在浙大就考虑东谈主工智能的梁文峰,燃起雄雄斗志。
2015 年,他和浙大学友,共同创立了幻方量化。
几个斗志激越的年青东谈主,试图用数学和东谈主工智能,在中国打造一个像文艺恢复那样天下顶级的量化对冲基金。
只是一年后,他们就上线了第一笔由 AI 驱动的实盘交游,并在随后,将通盘交游战术都 AI 化。
新时刻的加抓,让幻方量化旗下基金陈述率,远超同期沪深 300 指数。

这推动幻方量化基金界限抓续攀升,2021 年一度超千亿元大关,位各国内量化四大天王之一。
关联词,基金界限推广的同期,梁文峰却濒临一个毒手问题。
AI 交游战术需要算力支抓,尤其是,跟着模子参数的激增,对 GPU 算力的需求也在不休增长。
怎样破解这一难题?梁文峰的遴荐是:堆算力!
从 2019 年运转,幻方量化大界限布局 AI 算力。
当年就投资 2 亿元,建成"萤火一号" AI 算力集群,搭载 1100 块 GPU 算卡。而彼时的特斯拉,才刚刚提议 Dojo 超算主见。
几个月后,当英伟达发布最新 A100 芯顷刻,梁文峰再次抢跑,成为亚太地区第一批拿到此卡的东谈主。
紧接着 2021 年,他又投资 10 亿元,建成"萤火二号",搭载 1 万 A100 算卡,算力额外于 76 万台个东谈主电脑。
其占大地积,比 10 个篮球场还要大。
在 AI 大模子还莫得爆发的年代,梁文峰的举动,让许多东谈主感到大肆。
一家私募基金囤这样多算力,究竟意欲何为?致使有媒体诉苦:幻方量化把 A 股散户吓坏了。
外界对幻方量化的遐想,还停留在成本阛阓上。
但梁文峰的眼神,早已望向星辰大海。
2017 年,谷歌考虑团队在一篇草创性的论文中,初度提议 Transformer 架构。这是一种王人备基于详确力机制的神经收集,它颠覆了往时的传统算法。
一家叫 OpenAI 的好意思国初创公司,基于新架构不休侦查我方的大模子。最终在 2022 年以 ChatGPT 引爆 AI 大模子时期。
而后,群众互联网巨头,沿着 OpenAI 的阶梯激动,很少有东谈主质疑。
但一群初生牛犊的年青东谈主,在梁文峰的指挥下,干了一件极其大肆的事:他们试图纠正 Transformer 架构。
事实上,从 2023 年创立深度求索,进军大模子的第一天起,梁文峰过头团队对算法框架的反想就运转了。
当别东谈主堕入简便师法 OpenAI 的惯性中时,这群年青东谈主不走寻常路。
他们冒着失败的风险,神勇尝试了 MLA(多头潜在详确力机制)、DeepSeekMoE(搀和巨匠模子)等多种草创性时刻。
几年前囤下的海量算力芯片,为他们的联想,插上了翅膀。
最终,这群年青东谈主创造了历史:DeepSeek-V3 横空出世,整夜颤抖了硅谷。

对比中好意思科技产业,咱们时常惊叹:
中国为什么出不了像乔布斯、马斯克、黄仁勋一样伟大的企业家?
乔布斯生前只须一个规划:在世,即是为了篡改天下。
黄仁勋早在后生时,就立下志在千里:要作念不一样的事,要绝对篡改野心。
马斯克更是大肆地喊出:要殖民火星,为东谈主类寻找第二家园。
比较之下,中国企业家似乎把更多的眼神,放在了赢利和糊口上,很少昂首仰望星空,对改进的注意也不够。
事实上,往时 30 年,咱们依然民俗摩尔定律从天而下,躺在家里 18 个月就会出来更好的硬件和软件。
这使得咱们在一轮又一轮的 IT 波浪中,基本莫得参与到果然的时刻改进里。
但这种场所,在近几年悄然篡改,中国腾达代企业家正以突破性改进,在西方的游戏除外别辟门户。
"中国也要逐步成为改进孝敬者,而不是一直搭便车。"梁文峰暗示。
早在上大学时,梁文峰就详情:AI 一定会篡改天下。毕业后,他在量化投资上,赚了充足多的钱。
这使得他,有充足的成本,听从内心的声息,去作念我方心爱的事情,而不是启程点量度轻重得失。
DeepSeek 创立之初,就开辟了中枢职责:探索通用东谈主工智能的内容!
在中国 AI 界,还很少有企业敢提议如斯大肆的规划。
于是,往时几年,当许多大模子厂商忙着抢用户,作念买卖化变刻下,梁文峰却苦哈哈搞起了看似不赢利的基础考虑。
"改进不王人备是买卖驱动的,还需要敬爱心和创造欲。"他说。
在梁文峰看来,中国企业在往时被买卖驱动的惯性料理了。他但愿 DeepSeek 能开脱这种料理。
这样的规划理念,在当下的中国企业界,显得有点离经叛谈。
也曾有不啻一位业内东谈主士暗示:
梁文峰是中国 AI 界额外萧索的东谈主,他领有恐怖的学习才调,兼具刚劲的 infra 工程和模子考虑才调,又能疗养资源。
在里面职工看来,梁文峰则王人备不像雇主,更像一个极客。
时于当天,他依旧不竭着低调的格调,和公司其他考虑员一样,每天看论文,写代码,参与小组掂量。
这个低调的大佬,就连选东谈主、用东谈主的神色也跟主流抱怨失色。
当许多大模子公司热衷于去国外挖东谈主时,梁文峰却反治其身,坚抓从原土招东谈主,并放出豪言:
"天下前 50 名顶尖东谈主才可能不在中国,但也许咱们能我方打造这样的东谈主。"
不仅莫得国外东谈主才,也莫得行业大佬。梁文峰更心爱莫得陶冶的年青东谈主,因为他们不受条条框框的料理。
在 DeepSeek,选东谈主的方法一直都是疼爱和敬爱心。
事实上,这家初创公司并非外界传言的,有一批微妙莫测的奇才,而都是一些毕业才几年的年青东谈主。
致使,许多是北大、清华等 Top 高校还没毕业的博四、博五实习生。
因为办事太前沿,这些年青东谈主在开展办事时,险些莫得参考尊府。但也恰是这种空缺,让他们勇于突破传统。
比如,DeepSeek-V3 最辛苦的改进之一 MLA 架构,就来自一个年青东谈主的突发奇想。
DeepSeek 里面,也莫得落魄级单干。
考虑经由中,要是有想法,每个东谈主都不错拉东谈主掂量,并随时调用公司侦查集群的卡,无需审批,不设上限。
这种看似松散的解决神色,极大地疗养了通盘东谈主的敬爱心和创造欲,让 DeepSeek-V3 得以横空出世。
在梁文峰身上,咱们隐约看到了乔布斯、马斯克、黄仁勋的影子。
"中国 AI 不成能永远处在随从的位置!"
"果然的差距不是一年或两年,而是原创与师法之差。"
这两句从梁文峰口中喊出的话,不仅事关 AI 产业,亦然中国企业在随从、师法了西方几十年后,不得不面对的突破办法。
低落的果子都被摘罢了,只须勇于突破,才能找到新的出息。
梁文峰并不零丁。
今天,从大疆无东谈主机汪滔,到宇树机器东谈主王兴兴……一大量腾达代企业家,正将中国科技产业带向无东谈主区。

[ 1 ] 《揭秘 DeepSeek: 一个更极致的中国时刻空想主义故事》暗涌 Waves
[ 2 ] 《大肆的幻方:一家隐形 AI 巨头的大模子之路》暗涌 Waves
THE END
尊敬的读者一又友们,至心感谢您订阅《华商韬略》,为了便于您实时收到咱们的最新推送,敬请星标华商韬略公众号,感谢支抓,期待永远伴您同业。
华商韬略出品
主编:毕亚军 责编:周怡
好意思编:宋晓昱
本文仅代表作家个东谈主不雅点,部分图片来自收集、图虫创意、东方 IC,未能核实版权包摄的,不为买卖用途,如有侵略,敬请作家与咱们相干



华商韬略旗下公众号,接待关心
投稿、约稿、商务协作及建议
敬请相干:010-65580525
zy@hsmrt.com 周总监
◆◆◆
本文系网易新闻•网易号【特质成长野心】
签约账号【华商韬略】原创内容
◆◆◆
"点赞"是心爱开yun体育网,"在看共享"是真爱
下一篇:没有了
