2025年02月05日菁英論壇

【菁英論壇】專家揭祕DeepSeek 科技戰還是宣傳戰？

【新唐人北京時間2025年02月05日訊】出大事兒了！過去一年備受華爾街投資者寵愛的英偉達，最近突然一天之內暴跌一成六，市值損失了超過6000億美元。原因是因為中國一個名不見經傳的小公司，推出了一款叫深度求索DeepSeek的AI模型工具，自吹這個功能非常厲害，而且花的成本又非常低。

大家知道，英偉達之所以受到追捧，是因為它開發的高端AI芯片。投資者現在突然發現，不用你英偉達這種先進的AI芯片，有人同樣已經做出了先進的AI模型，所以英偉達的股票就被拋售了。但真實情況真的是如此嗎？DeepSeek到底在中國大陸、那個深不見底的黑洞當中，探索出了什麼樣的絕招呢？還是中共搞的宣傳戰？

專家：DeepSeek遭業界爭議並不厲害

獨立電視製片人李軍在新唐人《菁英論壇》節目中表示，DeepSeek造成了很大的風波，它大概是在2024年聖誕節前後拋出來的。當時網上到處都在傳，說中國在AI技術上又一次彎道超車了，一下子遙遙領先了。

DeepSeek是杭州深度求索人工智能基礎技術研究有限公司的產品。深度求索公司於2023年7月，由中國量化資管巨頭幻方量化創立。創始人和首席執行官，是現年40歲的梁文鋒。

李軍說，這個公司花了500萬美元，就訓練出了可以堪比Chat GPT、OpenAI一樣的人工智能。而且消息發布的當天，就上了中共央視新聞。黨媒要宣傳它，肯定要通過中宣部同意的，而且幾乎所有的媒體都在報，說DeepSeek開發的模型，在多項測試中表現都優於OpenAI，而且訓練成本只有美國的十分之一、百分之一。它的收費以後可能也就是OpenAI的1%。說DeepSeek的最新突破，已經動搖了美國科技行業的無敵地位。

但不久，國內外的學者就在思考一個問題了。這家據說只有4個人交社保的公司，憑什麼能做到這一點？有一家美國AI企業的CEO說，他知道DeepSeek至少用了5萬塊英偉達H100芯片，而且是用4納米的工藝製造的最先進的芯片。CEO質疑，美國對中國全面芯片制裁，這5萬塊4納米的芯片是哪來的？

當然這裡面可能最關心此事的應該是微軟了，因為它是OpenAI的主要投資人，還有一些高科技公司，大家發現的問題越來越多。金融時報報導說，微軟安全研究人員發現，DeepSeek有關聯的個人，使用OpenAI應用程式設計發展介面API，竊取了大量資料。

李軍說，據媒體報導，川普總統的人工智能主管薩克斯表示，有大量證據表明，DeepSeek依靠蒸餾OpenAI 模型的資料來開發自家技術。路透社消息稱，Deepseek信息準確性只有17%，遠低於西方流行的人工智能軟件水準。總之，Deep seek既不是原創，也不先進，但是贏在宣傳的能力上。

台灣人工智能實驗室創辦人杜奕瑾在《菁英論壇》表示，我想DeepSeek其實有兩階段的論文。第一階段是DeepSeek V3，它是自己訓練的基礎模型。這個基礎模型裡面有提到它用混合專家的模型，以及有一個叫多層注意力機制的這種方式，讓基礎模型的訓練可以降到比較低階的GPU，278.8萬個小時就可以訓練出來。

如果說這是真實的話，的確它這個基礎模型的訓練相對來講是低的。但是它為什麼使用知識蒸餾，去提取OpenAI的資料呢？就是說，當我們在做基礎模型訓練的時候，原本的資料整理是非常重要的。但你不是自己整理的，而很多是用知識蒸餾的方式。知識蒸餾的方式，就好比說有一個不是那麼厲害的模型，要回答類似問題的時候，你會拿一個非常昂貴的基礎模型，去教導一個小的模型，獲得更好的性能。

所以，從OpenAI所得到的信息，看起來就是OpenAI它過去是有提供知識蒸餾的方法，這個知識蒸餾的方法是收費的。但原本是讓別人去知識蒸餾，變成它的比如說o1-mini的小模型。但是，看起來deepseep把這個知識蒸餾的內容拿出來之後，訓練成為它自己的模型，而且甚至在開源的原始碼裡面也有這一段原始碼出來。所以，這就是比較有爭議的地方。

也就是說，現在在講訓練大模型，最複雜的也最昂貴的就是在於基礎模型。但是這個資料的準備到模型的訓練，你都是直接利用大模型訓練結果，再去做自己的模型的訓練，那其實並不代表你的東西是省成本的，而是你把別人的模型的結果，再來做一個知識蒸餾之後，自己再做訓練，這當然是會節省。

另外一個，就是DeepSeek發佈的模型推理能力。過去大型語言模型是很快去回答，比較沒有推理的能力。當我們問大型語言模型一個問題，GPT4跟 o1的差別是，o1會經過一個推理的過程之後再告訴你答案，而並不是象GPT4直接回答你。用經過推理的結果再去回答的這個成果，是會比沒有推理過的來的好，相對來講它所需要的時間和成本也會比較高。

所以，DeepSeek這次有一個叫R1的模型發佈的部分，我看從DeepSeek的發佈到OpenAI的回應，DeepSeek學習到了o1怎麼去做模型的推理能力，所以它是可以用相對比較小的資源，做到模型的訓練。

杜奕瑾說，我們剛才講到這個混合專家模型或是模型蒸餾，是過去我們人工智能業界廣泛都有在使用的。現在很多人認為， DeepSeek做的事情，就是mini現在這個OpenAI在做o1的這種方法，只是過去OpenAI沒有把這個論文發表出來。

所以這也就是為什麼可以看到，市場上有這樣的極端，就是很多人說這個成果是很好的，可以逼近到OpenAI大模型的成果。但你是用了很小的算力，其實你看DeepSeek它的知識提取裡面，用到openAI的知識去做模型的蒸餾，你就可以知道它的這個成果，是基於很多的、已經既有的成果再去堆疊起來的。那你這樣做，說你花了很少的資源，其實讓有些真正在做模型訓練的就會覺得說，這個好像沒有什麼厲害的。

杜奕瑾表示，關於僅投資500萬美元，剛剛我們講到，有幾個很重要的投資。第一個就是能力成本的投資，這個是算力的投資；還有資料收集和整理的投資。以這三個角度來講，我相信DeepSeek講只花500萬美元，是沒有把能力資源算進去。又因為它是直接把OpenAI的內容，知識蒸餾提取出來，所以相對來講，資料整理的投資也是比較少的。

我看的話，因為DeepSeekV3並沒有提到原本的開源，原本它的資料整理的內容，也讓我覺得，它在講說用了幾百萬美元，它是真的把大量的3個兆的資料，去做基礎模型訓練，還是說它是拿別人知識提取的內容，再去做促進訓練的成本，它並沒有把它公開，並沒有把它講得非常的清楚。

所以，這就會讓真正在做模型基礎訓練的會覺得，這個500萬美元相對來講，你如果不把我們講的成本算進去，其實也沒什麼厲害。因為在這個市場上，已經有非常多的在做這種知識蒸餾的小模型。

DeepSeek靠中共宣傳力量推上去

杜奕瑾在《菁英論壇》表示，這一次DeepSeek的發布，跟過去傳統上我們在做這種資料的技術演進的發布，有很大的不一樣。比如說你可以比較，現在有非常多的AI小新創，不管是OpenAI或者是新創，在做這種新的模型發布或者是演進。其實人工智能相關模型的進步，是不斷地堆疊累積上去的。

杜奕瑾說，Deep Seek這個發布，我們團隊也有注意到，中共官媒有大力宣傳。我們觀察微博相關的協同團體，也是同時在發動，再到短影音的部分，可以看到在臉書、YouTube上面開始有很多大量的這種帳號，有點像殭屍帳號。它實際上沒有什麼朋友關注，但它就是不斷地發大量的信息，類似Deep Seek橫空出世、英偉達以後沒有前景了等等。而短影音從聲音到影像，都是用AI合成的。

也就是說，它是有一波從官媒帶領到網路平臺的炒作。它選的時間點也蠻有趣的，在農曆新年的小年夜，在美國市場開盤前的盤前交易去炒作。說英偉達的股票跌了百分之十幾，透過這個宣傳造成股票前的市場跌了，之後再去放大英偉達的股票跌百分之十幾，那是盤前交易的下跌。但因為這個消息被宣傳得太大了。所以，也就造成後面交易市場股票的下跌。

杜奕瑾說，所以，它並不是象一般傳統科技公司，我們過去在發表新的技術之後，大家就來試用，但Deep Seek是完全不同規格的待遇跟操作。那就可以知道，這個Deep Seek信息，其實在後面是有國家級推手給推上去的。

中國不缺技術和人才缺乏系統和環境

資深媒體人郭君在《菁英論壇》表示，過去20年，中國的科技創新確實發展很快，美國已經感到前所未有的危機。美國菁英和中國菁英們探討的問題，現在都涉及到這種技術上的激烈競爭。但在我看來，所有的這些競爭，都不是一個技術、兩個技術的問題，而是一套體制，一個完整的生態環境、生態系統。我認為中國能夠在這些競爭中勝出，因為一兩個技術突破不是決定性的因素。

郭君說，中國和蘇聯60年代的時候，都在半導體的科技上有突破，當時都很先進，但到了80年代全面落後了。原因不在於技術和人才，而在於缺乏這個系統和環境。

過去這些年，中國有一些技術、新公司，這些都是過去20年，美國和中國全面合作的結果。很多中國的技術或者是中國的高科技公司，都是發端於美國的，而且是憑藉美國的這個生態系統長出來的。

通俗地說，是矽穀加華爾街模式。矽穀提供技術創新、華爾街提供資金。但實際上，華爾街不僅僅提供資金，而且提供市場營銷、工程管理、財務管理，還有吸引更多投資者的策略等等一系列的服務，他不是一個射後不理的機制。

一個創新公司，背後有一堆專家幫助它的管理層，這才是華爾街公司的作用。這些在中國，並不是非常發達，因為這需要一大批職業經理人，而且是遊離在系統之外的職業經理人，他能夠獨立。中國的這批人，現在大量都在離開中國。

郭君說，現在，中美之間正在發生的是全面脫鉤，資金脫鉤、技術脫鉤只是一個層面，而整個培育新科技的生態脫鉤，可能才是最重要的。缺了這個生態系統，中國可能會有超越性的新技術，然後出現一些新公司，但它很難繼續生長。過去那個環境，長出了阿裡巴巴、騰訊、華為公司的生態環境，現在已經全部都改變了。

郭君表示，我們只要看一個問題，美國大學畢業生，最希望去高科技公司，甚至是新創的公司工作。但中國大學畢業的年輕人，現在最希望去當公務員、去當官。這是兩種體制，最後會有不同的結果，以前美國和蘇聯的競爭，已經給出了這個答案。

新唐人、大紀元推出的新檔電視節目《菁英論壇》，是立足於華人世界的高端電視論壇，該節目將彙集全球各界精英，聚焦熱點議題，剖析天下大勢，為觀眾提供有關社會時事和歷史真相的深度觀察。

本期《菁英論壇》全部內容，敬請線上收看。

《菁英論壇》製作組

轉載和引用《菁英論壇》文章，請保持原文內容，並標明出處。

（責任編輯：劉明湘）

推薦視頻

【菁英論壇】專家揭祕DeepSeek 科技戰還是宣傳戰？

專家：DeepSeek遭業界爭議 並不厲害

DeepSeek靠中共宣傳力量推上去

中國不缺技術和人才 缺乏系統和環境

專家：DeepSeek遭業界爭議並不厲害

中國不缺技術和人才缺乏系統和環境