硅谷来信｜Meta华人迷信家：DeepSeek是开源模子的_必发365官方网站

咨询热线
400-123-4567

硅谷来信｜Meta华人迷信家：DeepSeek是开源模子的

栏目：行业动态发布时间：2025-02-01 09:01

搜狐科技特约作者｜Meta 迷信家许家骏博士编纂｜杨锦假如说近多少年的 AI 开展犹如片子般跌荡崎岖，那么 DeepSeek 这个名字无疑是近来最冷艳的“新片”。就在昨天，我在加州DMV（车辆治理局）排队时，前后排的年夜妈都在热闹探讨 DeepSeek 最新推出的开源模子 R1。要晓得，原来科技话题很少在年夜妈的应酬里呈现，没想到霎时 DeepSeek 盘踞了配角地位。一其中国团队激发的“AI 黑天鹅”DeepSeek 的新模子 R1 在短短两个月之内，用不到 600 万美元的估算，借助并不算顶级的 H800 芯片，就实现了能够与 OpenAI 等国际当先年夜模子“分庭抗礼”的机能。业界广泛以为，这是连英伟达（NVIDIA）跟 OpenAI 都不曾预感的“黑天鹅变乱”。这种“以小广博”所开释的震动不只仅是技巧层面，也给资源市场带来余震。开展全文 1 月 27 日，英伟达股票阅历了自建立以来最惨烈的一次下挫，单日跌幅到达 17%，收盘价跌至 118.58 美元，蒸发约 6000 亿美元市值——创下美国上市公司单日市值丧失最高记录。更令人惊奇的是，这股惊恐还伸张至全部芯片工业：Broadcom 下跌 17%，ASML 下跌 6%。华尔街剖析师指出，DeepSeek-R1 激发了市场对 AI 芯片需要可连续性的担心。已经全部人都向往 GPU 需要会连续“爆炸”式增加，但假如像 DeepSeek 如许低本钱、高效力的年夜模子越来越多，企业在 2026 年后对 GPU 的洽购战略就会呈现“效力优先”的改变。从顶尖学术机构到寰球利用市场双线“登顶” DeepSeek-R1 的申明不只在产业界跟资源市场搅动风波，也在学术界敏捷扩大。正如 a16z（Andreessen Horowitz）合资人、Mistral 董事会成员 Anjney Midha 所说：“从斯坦福到麻省理工，DeepSeek-R1 多少乎一夜之间就成了美国顶尖年夜学研讨职员的首选模子。” 这象征着，在前沿学术研讨场景，DeepSeek-R1 曾经获得了极高的承认度。另一方面，在花费真个热度也一直攀升。DeepSeek 的官方 App 如火箭般超出了 ChatGPT 的官方利用，强势登顶 App Store；在谷歌上的搜寻指数也片面赶超 ChatGPT。某种意思上，这预示着 DeepSeek 在通用用户市场的影响力可能会连续乃至进一步扩展。假如还要为这种爆火寻觅佐证，那么来自投资年夜佬 Marc Andreessen（a16z 开创人）的评估可谓“核弹级背书”——“DeepSeek R1 是 AI 的斯普特尼克时辰。这是我见过最冷艳、最令人印象深入的冲破之一——并且是开源的，是对全天下的一种深入奉送。” 斯普特尼克时辰（Sputnik moment）源自1957年苏联发射第一颗天然卫星"斯普特尼克1号"，意味着一个划时期的技巧冲破，激发了寰球科技比赛的新格式，当初常用来比方某个范畴呈现的推翻性技巧停顿。 “性价比之王”：开源、年夜模子与练习范式的变更 DeepSeek-R1 的胜利并非伶仃。回想其 V2、V3 版本的迭代汗青，在多项评测中，DeepSeek V3 均到达了开源范畴的 SOTA（开始进）水准，乃至一度超出 Llama 3.1 405B，在一些才能上可与 GPT-4o等顶级年夜模子正面硬碰硬。而这背地的中心冲破，在于两点： 1. 混杂专家架构（MoE）的深度利用； 2. 以强化进修（RL）为主导的练习范式。如许的技巧门路不只极年夜下降了对海量标注数据的依附，同时还保障了模子的机能。成果是，DeepSeek-R1 的练习总本钱把持在约 550 万美元——只有 Anthropic、OpenAI 那些“权门”动辄 10 亿美元练习本钱的一个零头，可谓“年夜模子性价比之王”。也难怪业内都在赞叹 DeepSeek 对 AI 平易近主化的奉献。最新数据表现，R1 在 HuggingFace 上以 14.9 万次下载量夺得开源模子下载冠军，其搜寻跟问答功效被浩繁用户评估“曾经超出了 OpenAI 跟 Perplexity”。而真正让宽大开辟者喝彩的是——R1 的本钱只有竞品的 3%-5%。对那些苦于 AI 安排本钱、想要疾速打造高品质 APP 的始创企业，DeepSeek 同等于递上了通往将来的钥匙。中国机遇：梁文锋的“野心”与开源哲学微软 CEO 纳德拉在达沃斯论坛上的一句话颇有象征：“必需当真看待中国 AI 的开展。” 固然，DeepSeek 的此次暴发再次印证——即便已经的年夜模子话语权重要会合在美国，现在中国企业也可能在翻新层面拔得头筹。面临外界对 DeepSeek 的追捧与种种“封神”舆论，DeepSeek CEO 梁文锋在采访中表示得相称沉着。他坦言，团队最初并没盘算“锐意搅动”市场，只是依照本人对本钱跟订价的懂得去办事，成果却不测激发了一场年夜模子的价钱战。对“中国更多善于做利用而非翻新”的质疑，梁文锋以为，这与中国临时出席底层技巧翻新有关。“从前三十多年 IT 海潮里，咱们基础是追随，不真正参加翻新。” 但 DeepSeek 想表演的脚色，是一个可能“跳进翻新者的游戏”的玩家。在“开源能否会丧失护城河”的成绩上，他的观念颇具前瞻性：在推翻性技巧眼前，闭源并不克不及构成临时壁垒，真正的护城河在团队跟文明的连续翻新才能。“开源是咱们的文明抉择，为了让更多人低门槛用上年夜模子。” 在梁文锋看来，被他人追随、被社区共创，反而是一种声誉。年夜模子“不护城河”背地的中国机会开源社区与很多技巧博主纷纭指出，DeepSeek R1 证实了年夜模子可能真的不“护城河”。它用起码的资金，实现了之前须要天价 GPU 资本跟大批资源才干到达的后果。这象征着，任何企业或开辟者都能更轻松地打造高品质的 AI 利用，而中国团队又善于在利用层面停止暴发式翻新。能够预感，DeepSeek 给中国企业供给了新的出海窗口：用较低本钱疾速构建并迭代产物，领先盘踞寰球市场。一位硅谷投资人近来在交际收集上发文称：“一周前，没人看好那些只是简略封装 GPT 的利用公司。明天 DeepSeek 宣布了 R1，来日可能又会呈现一个新的当先模子。可要让多少百万人习气性地应用某一款产物，这才是竞争壁垒。ChatGPT 之以是起步快，不是由于模子机能碾压，而是由于它用起来够简略。” 这番话点出一个要害：模子迭代的速率越来越快，尤其在国度层面，年夜模子更像是举国策略的一局部。谁也保禁绝下一次“黑马”会不会在两周后就呈现。用户习气、应用门槛这些因素，才是把民众紧紧绑住的强盛护城河。从在 DMV排队时的年夜妈们口耳相传，到资源市场的惊天动乱，再到学术界的争相追捧跟利用市场的热闹欢送，DeepSeek-R1 的横空降生无疑攻破了咱们对 AI 工业格式的固有设想。它背地的故事既是中国公司突起的一个缩影，也是寰球 AI 海潮再度洗牌的写照。面向将来，DeepSeek 带来的不只是对技巧道路的启发，也是一种全新的思考方法——在开源与配合的海潮中，任何一家公司都弗成能永久独有鳌头。当年夜模子本钱极年夜下降，中国公司在利用层面多年的积聚与暴发力有了更辽阔的舞台。或者，这才是 DeepSeek-R1 真正带来的深远意思：让天下看到，中国也能够引领科技翻新潮水，这一机会不只属于中国，更属于全部乐意英勇拥抱新技巧的群体。正如 Marc Andreessen 所言：“DeepSeek R1 是 AI 的斯普特尼克时辰。” 这个时辰既是警钟，也是礼品。（本文仅代表作者团体观念，不代表所属机构破场。）前往搜狐，检查更多

上一篇：春晚呆板人露馅！曝退场画面走路发抖，一人对

下一篇：没有了