2025年02月05日菁英論壇

【菁英論壇】專家揭祕DeepSeek 科技戰還是宣傳戰?

【新唐人北京時間2025年02月05日訊】出大事兒了!過去一年備受華爾街投資者寵愛的英偉達,最近突然一天之內暴跌一成六,市值損失了超過6000億美元。原因是因為中國一個名不見經傳的小公司,推出了一款叫深度求索DeepSeek的AI模型工具,自吹這個功能非常厲害,而且花的成本又非常低。
大家知道,英偉達之所以受到追捧,是因為它開發的高端AI芯片。投資者現在突然發現,不用你英偉達這種先進的AI芯片,有人同樣已經做出了先進的AI模型,所以英偉達的股票就被拋售了。但真實情況真的是如此嗎?DeepSeek到底在中國大陸、那個深不見底的黑洞當中,探索出了什麼樣的絕招呢?還是中共搞的宣傳戰?

專家:DeepSeek遭業界爭議 並不厲害

獨立電視製片人李軍在新唐人《菁英論壇》節目中表示,DeepSeek造成了很大的風波,它大概是在2024年聖誕節前後拋出來的。當時網上到處都在傳,說中國在AI技術上又一次彎道超車了,一下子遙遙領先了。
DeepSeek是杭州深度求索人工智能基礎技術研究有限公司的產品。深度求索公司於2023年7月,由中國量化資管巨頭幻方量化創立。創始人和首席執行官,是現年40歲的梁文鋒。
李軍說,這個公司花了500萬美元,就訓練出了可以堪比Chat GPT、OpenAI一樣的人工智能。而且消息發布的當天,就上了中共央視新聞。黨媒要宣傳它,肯定要通過中宣部同意的,而且幾乎所有的媒體都在報,說DeepSeek開發的模型,在多項測試中表現都優於OpenAI,而且訓練成本只有美國的十分之一、百分之一。它的收費以後可能也就是OpenAI的1%。說DeepSeek的最新突破,已經動搖了美國科技行業的無敵地位。
但不久,國內外的學者就在思考一個問題了。這家據說只有4個人交社保的公司,憑什麼能做到這一點?有一家美國AI企業的CEO說,他知道DeepSeek至少用了5萬塊英偉達H100芯片,而且是用4納米的工藝製造的最先進的芯片。CEO質疑,美國對中國全面芯片制裁,這5萬塊4納米的芯片是哪來的?
當然這裡面可能最關心此事的應該是微軟了,因為它是OpenAI的主要投資人,還有一些高科技公司,大家發現的問題越來越多。金融時報報導說,微軟安全研究人員發現,DeepSeek有關聯的個人,使用OpenAI應用程式設計發展介面API,竊取了大量資料。
李軍說,據媒體報導,川普總統的人工智能主管薩克斯表示,有大量證據表明,DeepSeek依靠蒸餾OpenAI 模型的資料來開發自家技術。路透社消息稱,Deepseek信息準確性只有17%,遠低於西方流行的人工智能軟件水準。總之,Deep seek既不是原創,也不先進,但是贏在宣傳的能力上。
台灣人工智能實驗室創辦人杜奕瑾在《菁英論壇》表示,我想DeepSeek其實有兩階段的論文。第一階段是DeepSeek V3,它是自己訓練的基礎模型。這個基礎模型裡面有提到它用混合專家的模型,以及有一個叫多層注意力機制的這種方式,讓基礎模型的訓練可以降到比較低階的GPU,278.8萬個小時就可以訓練出來。
如果說這是真實的話,的確它這個基礎模型的訓練相對來講是低的。但是它為什麼使用知識蒸餾,去提取OpenAI的資料呢?就是說,當我們在做基礎模型訓練的時候,原本的資料整理是非常重要的。但你不是自己整理的,而很多是用知識蒸餾的方式。知識蒸餾的方式,就好比說有一個不是那麼厲害的模型,要回答類似問題的時候,你會拿一個非常昂貴的基礎模型,去教導一個小的模型,獲得更好的性能。
所以,從OpenAI所得到的信息,看起來就是OpenAI它過去是有提供知識蒸餾的方法,這個知識蒸餾的方法是收費的。但原本是讓別人去知識蒸餾,變成它的比如說o1-mini的小模型。但是,看起來deepseep把這個知識蒸餾的內容拿出來之後,訓練成為它自己的模型,而且甚至在開源的原始碼裡面也有這一段原始碼出來。所以,這就是比較有爭議的地方。
也就是說,現在在講訓練大模型,最複雜的也最昂貴的就是在於基礎模型。但是這個資料的準備到模型的訓練,你都是直接利用大模型訓練結果,再去做自己的模型的訓練,那其實並不代表你的東西是省成本的,而是你把別人的模型的結果,再來做一個知識蒸餾之後,自己再做訓練,這當然是會節省。
另外一個,就是DeepSeek發佈的模型推理能力。過去大型語言模型是很快去回答,比較沒有推理的能力。當我們問大型語言模型一個問題,GPT4跟 o1的差別是,o1會經過一個推理的過程之後再告訴你答案,而並不是象GPT4直接回答你。用經過推理的結果再去回答的這個成果,是會比沒有推理過的來的好,相對來講它所需要的時間和成本也會比較高。
所以,DeepSeek這次有一個叫R1的模型發佈的部分,我看從DeepSeek的發佈到OpenAI的回應,DeepSeek學習到了o1怎麼去做模型的推理能力,所以它是可以用相對比較小的資源,做到模型的訓練。
杜奕瑾說,我們剛才講到這個混合專家模型或是模型蒸餾,是過去我們人工智能業界廣泛都有在使用的。現在很多人認為, DeepSeek做的事情,就是mini現在這個OpenAI在做o1的這種方法,只是過去OpenAI沒有把這個論文發表出來。
所以這也就是為什麼可以看到,市場上有這樣的極端,就是很多人說這個成果是很好的,可以逼近到OpenAI大模型的成果。但你是用了很小的算力,其實你看DeepSeek它的知識提取裡面,用到openAI的知識去做模型的蒸餾,你就可以知道它的這個成果,是基於很多的、已經既有的成果再去堆疊起來的。那你這樣做,說你花了很少的資源,其實讓有些真正在做模型訓練的就會覺得說,這個好像沒有什麼厲害的。
杜奕瑾表示,關於僅投資500萬美元,剛剛我們講到,有幾個很重要的投資。第一個就是能力成本的投資,這個是算力的投資;還有資料收集和整理的投資。以這三個角度來講,我相信DeepSeek講只花500萬美元,是沒有把能力資源算進去。又因為它是直接把OpenAI的內容,知識蒸餾提取出來,所以相對來講,資料整理的投資也是比較少的。
我看的話,因為DeepSeekV3並沒有提到原本的開源,原本它的資料整理的內容,也讓我覺得,它在講說用了幾百萬美元,它是真的把大量的3個兆的資料,去做基礎模型訓練,還是說它是拿別人知識提取的內容,再去做促進訓練的成本,它並沒有把它公開,並沒有把它講得非常的清楚。
所以,這就會讓真正在做模型基礎訓練的會覺得,這個500萬美元相對來講,你如果不把我們講的成本算進去,其實也沒什麼厲害。因為在這個市場上,已經有非常多的在做這種知識蒸餾的小模型。

DeepSeek靠中共宣傳力量推上去

杜奕瑾在《菁英論壇》表示,這一次DeepSeek的發布,跟過去傳統上我們在做這種資料的技術演進的發布,有很大的不一樣。比如說你可以比較,現在有非常多的AI小新創,不管是OpenAI或者是新創,在做這種新的模型發布或者是演進。其實人工智能相關模型的進步,是不斷地堆疊累積上去的。
杜奕瑾說,Deep Seek這個發布,我們團隊也有注意到,中共官媒有大力宣傳。我們觀察微博相關的協同團體,也是同時在發動,再到短影音的部分,可以看到在臉書、YouTube上面開始有很多大量的這種帳號,有點像殭屍帳號。它實際上沒有什麼朋友關注,但它就是不斷地發大量的信息,類似Deep Seek橫空出世、英偉達以後沒有前景了等等。而短影音從聲音到影像,都是用AI合成的。
也就是說,它是有一波從官媒帶領到網路平臺的炒作。它選的時間點也蠻有趣的,在農曆新年的小年夜,在美國市場開盤前的盤前交易去炒作。說英偉達的股票跌了百分之十幾,透過這個宣傳造成股票前的市場跌了,之後再去放大英偉達的股票跌百分之十幾,那是盤前交易的下跌。但因為這個消息被宣傳得太大了。所以,也就造成後面交易市場股票的下跌。
杜奕瑾說,所以,它並不是象一般傳統科技公司,我們過去在發表新的技術之後,大家就來試用,但Deep Seek是完全不同規格的待遇跟操作。那就可以知道,這個Deep Seek信息,其實在後面是有國家級推手給推上去的。

中國不缺技術和人才 缺乏系統和環境

資深媒體人郭君在《菁英論壇》表示,過去20年,中國的科技創新確實發展很快,美國已經感到前所未有的危機。美國菁英和中國菁英們探討的問題,現在都涉及到這種技術上的激烈競爭。但在我看來,所有的這些競爭,都不是一個技術、兩個技術的問題,而是一套體制,一個完整的生態環境、生態系統。我認為中國能夠在這些競爭中勝出,因為一兩個技術突破不是決定性的因素。
郭君說,中國和蘇聯60年代的時候,都在半導體的科技上有突破,當時都很先進,但到了80年代全面落後了。原因不在於技術和人才,而在於缺乏這個系統和環境。
過去這些年,中國有一些技術、新公司,這些都是過去20年,美國和中國全面合作的結果。很多中國的技術或者是中國的高科技公司,都是發端於美國的,而且是憑藉美國的這個生態系統長出來的。
通俗地說,是矽穀加華爾街模式。矽穀提供技術創新、華爾街提供資金。但實際上,華爾街不僅僅提供資金,而且提供市場營銷、工程管理、財務管理,還有吸引更多投資者的策略等等一系列的服務,他不是一個射後不理的機制。
一個創新公司,背後有一堆專家幫助它的管理層,這才是華爾街公司的作用。這些在中國,並不是非常發達,因為這需要一大批職業經理人,而且是遊離在系統之外的職業經理人,他能夠獨立。中國的這批人,現在大量都在離開中國。
郭君說,現在,中美之間正在發生的是全面脫鉤,資金脫鉤、技術脫鉤只是一個層面,而整個培育新科技的生態脫鉤,可能才是最重要的。缺了這個生態系統,中國可能會有超越性的新技術,然後出現一些新公司,但它很難繼續生長。過去那個環境,長出了阿裡巴巴、騰訊、華為公司的生態環境,現在已經全部都改變了。
郭君表示,我們只要看一個問題,美國大學畢業生,最希望去高科技公司,甚至是新創的公司工作。但中國大學畢業的年輕人,現在最希望去當公務員、去當官。這是兩種體制,最後會有不同的結果,以前美國和蘇聯的競爭,已經給出了這個答案。
新唐人、大紀元推出的新檔電視節目《菁英論壇》,是立足於華人世界的高端電視論壇,該節目將彙集全球各界精英,聚焦熱點議題,剖析天下大勢,為觀眾提供有關社會時事和歷史真相的深度觀察。
本期《菁英論壇》全部內容,敬請線上收看。
《菁英論壇》製作組
轉載和引用《菁英論壇》文章 ,請保持原文內容,並標明出處。
(責任編輯:劉明湘)

推薦視頻