硅谷来信|Meta华人迷信家:DeepSeek是开源模子的
栏目:行业动态 发布时间:2025-02-01 09:01
搜狐科技特约作者|Meta 迷信家许家骏博士编纂|杨锦假如说近多少年的 AI 开展犹如片子般跌荡崎岖,那么 DeepSeek 这个名字无疑是近来最冷艳的“新片”。就在昨天,我在加州DMV(车辆治理局)排队时,前后排的年夜妈都在热闹探讨 DeepSeek 最新推出的开源模子 R1。要晓得,原来科技话题很少在年夜妈的应酬里呈现,没想到霎时 DeepSeek 盘踞了配角地位。一其中国团队激发的“AI 黑天鹅”DeepSeek 的新模子 R1 在短短两个月之内,用不到 600 万美元的估算,借助并不算顶级的 H800 芯片,就实现了能够与 OpenAI 等国际当先年夜模子“分庭抗礼”的机能。业界广泛以为,这是连英伟达(NVIDIA)跟 OpenAI 都不曾预感的“黑天鹅变乱”。这种“以小广博”所开释的震动不只仅是技巧层面,也给资源市场带来余震。 开展全文 1 月 27 日,英伟达股票阅历了自建立以来最惨烈的一次下挫,单日跌幅到达 17%,收盘价跌至 118.58 美元,蒸发约 6000 亿美元市值——创下美国上市公司单日市值丧失最高记录。 更令人惊奇的是,这股惊恐还伸张至全部芯片工业:Broadcom 下跌 17%,ASML 下跌 6%。华尔街剖析师指出,DeepSeek-R1 激发了市场对 AI 芯片需要可连续性的担心。 已经全部人都向往 GPU 需要会连续“爆炸”式增加,但假如像 DeepSeek 如许低本钱、高效力的年夜模子越来越多,企业在 2026 年后对 GPU 的洽购战略就会呈现“效力优先”的改变。 从顶尖学术机构到寰球利用市场双线“登顶” DeepSeek-R1 的申明不只在产业界跟资源市场搅动风波,也在学术界敏捷扩大。正如 a16z(Andreessen Horowitz)合资人、Mistral 董事会成员 Anjney Midha 所说:“从斯坦福到麻省理工,DeepSeek-R1 多少乎一夜之间就成了美国顶尖年夜学研讨职员的首选模子。” 这象征着,在前沿学术研讨场景,DeepSeek-R1 曾经获得了极高的承认度。 另一方面,在花费真个热度也一直攀升。DeepSeek 的官方 App 如火箭般超出了 ChatGPT 的官方利用,强势登顶 App Store;在谷歌上的搜寻指数也片面赶超 ChatGPT。某种意思上,这预示着 DeepSeek 在通用用户市场的影响力可能会连续乃至进一步扩展。 假如还要为这种爆火寻觅佐证,那么来自投资年夜佬 Marc Andreessen(a16z 开创人)的评估可谓“核弹级背书”——“DeepSeek R1 是 AI 的斯普特尼克时辰。这是我见过最冷艳、最令人印象深入的冲破之一——并且是开源的,是对全天下的一种深入奉送。” 斯普特尼克时辰(Sputnik moment)源自1957年苏联发射第一颗天然卫星"斯普特尼克1号",意味着一个划时期的技巧冲破,激发了寰球科技比赛的新格式,当初常用来比方某个范畴呈现的推翻性技巧停顿。 “性价比之王”:开源、年夜模子与练习范式的变更 DeepSeek-R1 的胜利并非伶仃。回想其 V2、V3 版本的迭代汗青,在多项评测中,DeepSeek V3 均到达了开源范畴的 SOTA(开始进)水准,乃至一度超出 Llama 3.1 405B,在一些才能上可与 GPT-4o等顶级年夜模子正面硬碰硬。 而这背地的中心冲破,在于两点: 1. 混杂专家架构(MoE) 的深度利用; 2. 以强化进修(RL)为主导 的练习范式。 如许的技巧门路不只极年夜下降了对海量标注数据的依附,同时还保障了模子的机能。成果是,DeepSeek-R1 的练习总本钱把持在约 550 万美元——只有 Anthropic、OpenAI 那些“权门”动辄 10 亿美元练习本钱的一个零头,可谓“年夜模子性价比之王”。 也难怪业内都在赞叹 DeepSeek 对 AI 平易近主化的奉献。最新数据表现,R1 在 HuggingFace 上以 14.9 万次下载量夺得开源模子下载冠军,其搜寻跟问答功效被浩繁用户评估“曾经超出了 OpenAI 跟 Perplexity”。 而真正让宽大开辟者喝彩的是——R1 的本钱只有竞品的 3%-5%。对那些苦于 AI 安排本钱、想要疾速打造高品质 APP 的始创企业,DeepSeek 同等于递上了通往将来的钥匙。 中国机遇:梁文锋的“野心”与开源哲学 微软 CEO 纳德拉在达沃斯论坛上的一句话颇有象征:“必需当真看待中国 AI 的开展。” 固然,DeepSeek 的此次暴发再次印证——即便已经的年夜模子话语权重要会合在美国,现在中国企业也可能在翻新层面拔得头筹。 面临外界对 DeepSeek 的追捧与种种“封神”舆论,DeepSeek CEO 梁文锋在采访中表示得相称沉着。他坦言,团队最初并没盘算“锐意搅动”市场,只是依照本人对本钱跟订价的懂得去办事,成果却不测激发了一场年夜模子的价钱战。 对“中国更多善于做利用而非翻新”的质疑,梁文锋以为,这与中国临时出席底层技巧翻新有关。“从前三十多年 IT 海潮里,咱们基础是追随,不真正参加翻新。” 但 DeepSeek 想表演的脚色,是一个可能“跳进翻新者的游戏”的玩家。 在“开源能否会丧失护城河”的成绩上,他的观念颇具前瞻性:在推翻性技巧眼前,闭源并不克不及构成临时壁垒,真正的护城河在团队跟文明的连续翻新才能。“开源是咱们的文明抉择,为了让更多人低门槛用上年夜模子。” 在梁文锋看来,被他人追随、被社区共创,反而是一种声誉。 年夜模子“不护城河”背地的中国机会 开源社区与很多技巧博主纷纭指出,DeepSeek R1 证实了年夜模子可能真的不“护城河”。它用起码的资金,实现了之前须要天价 GPU 资本跟大批资源才干到达的后果。 这象征着,任何企业或开辟者都能更轻松地打造高品质的 AI 利用,而中国团队又善于在利用层面停止暴发式翻新。能够预感,DeepSeek 给中国企业供给了新的出海窗口:用较低本钱疾速构建并迭代产物,领先盘踞寰球市场。 一位硅谷投资人近来在交际收集上发文称:“一周前,没人看好那些只是简略封装 GPT 的利用公司。明天 DeepSeek 宣布了 R1,来日可能又会呈现一个新的当先模子。可要让多少百万人习气性地应用某一款产物,这才是竞争壁垒。ChatGPT 之以是起步快,不是由于模子机能碾压,而是由于它用起来够简略。” 这番话点出一个要害:模子迭代的速率越来越快,尤其在国度层面,年夜模子更像是举国策略的一局部。谁也保禁绝下一次“黑马”会不会在两周后就呈现。用户习气、应用门槛这些因素,才是把民众紧紧绑住的强盛护城河。 从在 DMV排队时的年夜妈们口耳相传,到资源市场的惊天动乱,再到学术界的争相追捧跟利用市场的热闹欢送,DeepSeek-R1 的横空降生无疑攻破了咱们对 AI 工业格式的固有设想。它背地的故事既是中国公司突起的一个缩影,也是寰球 AI 海潮再度洗牌的写照。 面向将来,DeepSeek 带来的不只是对技巧道路的启发,也是一种全新的思考方法——在开源与配合的海潮中,任何一家公司都弗成能永久独有鳌头。当年夜模子本钱极年夜下降,中国公司在利用层面多年的积聚与暴发力有了更辽阔的舞台。 或者,这才是 DeepSeek-R1 真正带来的深远意思:让天下看到,中国也能够引领科技翻新潮水,这一机会不只属于中国,更属于全部乐意英勇拥抱新技巧的群体。 正如 Marc Andreessen 所言:“DeepSeek R1 是 AI 的斯普特尼克时辰。” 这个时辰既是警钟,也是礼品。 (本文仅代表作者团体观念,不代表所属机构破场。)前往搜狐,检查更多
服务热线
400-123-4567