梁文锋,搅动一池春水
鲶鱼,奥特曼,硅谷
梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。
随后特朗普在会议上提到DeepSeek的出现为美国的企业敲响了警钟,“我们需要集中精力在竞争中获胜”。相隔一天,据外媒报道,多名美国官员称DeepSeek是“偷窃”,正对其展开国家安全调查。
OpenAI也适时发表声明称一直知道其他公司试图蒸馏美国领先公司的模型,如今“采取反制措施保护我们的知识产权”,并表示将和美国政府紧密合作保护最先进模型免受窃取。
或许梁文锋自己都想不到,意外火出海的DeepSeek,刺痛着更多人的神经。
而一年前,DeepSeek V2模型发布时,便开始被冠上AI界拼多多的称号。
反卷大厂的梁文锋,早已在AI领域复制过黄峥式“后来居上”的故事,并在国内掀起打到骨折的大模型价格战。
当时,在接受36氪采访中,梁文锋表示,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”
如果说梁文锋的鲶鱼效应,在于证明了用低成本也能高效率训练出AI大模型,无意卷到了BAT。去年一年,黄仁勋则在制造另一种鲶鱼效应,即以每6个月为周期,更新更高性能的芯片,使得害怕抢不到最新GPU而掉队的巨头们,疯抢英伟达GPU,微软、谷歌、Meta、马斯克,都被拽进了这场GPU大作战游戏里。
一年后,DeepSeek成为硅谷眼中“神秘的东方力量”,被Scale AI创始人亚历山大·王评价道,“过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会‘改变一切’。”
起因是DeepSeek在年前发布了新的开源模型DeepSeek R1,不仅性能追上了OpenAI o1完整版,而且用550万美元的训练开销做到硅谷投入上亿美元的效果。
在这场热潮前,大模型的主流叙事是英伟达高端CPU“一芯难求”,而如今,黄仁勋的销冠神话,迎来了梁文锋的正面冲击。
梁文锋所带领的DeepSeek,让美国华尔街开始重新审视,在这场大模型生存战里,英伟达芯片和高端算力的需求是否存在泡沫。这样的担忧,使得英伟达在1月27日一夜蒸发近6000亿美元市值。
而这一切,在梁文锋看来,只是“按照自己的步调来做事”,然后核算成本定价。
......
您现在查看是摘要页,全文长 10112 字符。