正文

【禁聞】專訪杜奕瑾：DeepSeek被炒作過頭

2025年02月03日中國禁聞新聞

【新唐人北京時間2025年02月04日訊】中國初創公司DeepSeek聲稱用600萬美元研發出媲美OpenAI的AI模型，一度引發美股暴跌。不過，輿論很快開始反轉。多個研究機構發現DeepSeek背後存在諸多問題。我們就此專訪了台灣人工智慧實驗室（Taiwan AI Labs）創辦人杜奕瑾。

台灣人工智慧實驗室創辦人杜奕瑾分析，DeepSeek宣傳的特別之處在於：一是在小年夜，二是可以觀察到許多訊息操作。

台灣人工智慧實驗室創辦人杜奕瑾：「我們在看DeepSeek相關的這個訊息裡面，第一個就是官媒主導的這個成分是比例是佔的非常的高。那再來就是這個網路上，你如果說在微博，或者是在Facebook你都可以看到，很多這種不是屬於真正使用者的這個帳號，就開始非常的活躍。它並不是真的人，那其實平常也沒有什麼訂戶，那它就是用人工智慧的方法去做這個AI的這個短影音，不斷地在放大『美股下跌』的這個消息，『中美科技競爭中國贏了』這個消息。把一個很簡單的這個開源的這個成果，變成一個拉到這種國家層級去做這種科技競爭的這個炒作，那從官媒、從微博、以及從這個網絡上面的操作，這個從我們的感覺，就是蠻像以前中國跟俄羅斯在國家主導一些議題上面，它炒作的這種方式。」

有研究機構發現，在1月27日美股暴跌前夕，大量中共網軍在美國社交媒體炒作DeepSeek的消息。而杜奕瑾發現，「DeepSeek出世導致美股下跌」是一種因果顛倒的說法。

杜奕瑾：「它有點就是從訊息的導向，造成Pre-Market（盤前交易）的市場的下跌，因為Pre-Market相對來講是比較好操作的，那在這藉由放大Pre-Market市場的下跌，再去影響到這個正常交易時間的這個市場的這個結果。那正常交易市場的結果，那就可以放大造成美國股票這種大量下跌是因為DeepSeek的推出，這其實有點反因為果。我們看到的是，有很大量的訊息操作造成交易市場的Pre-Market下跌之後，那交易市場的Pre-Market之後大家才去注意到，DeepSeek這個東西是什麼東西？然後再去討論這個東西。而不是去討論這DeepSeek這個東西，而造成市場的這個下降。」

中共官方如此操作，目的是什麼呢？

杜奕瑾：「它藉由這個的操作，那它其實可以展現的就是，其實中國並不需要靠這種最高算力的模型芯片，也可以把模型做得很好，我想展示的是這個訊息。」

不過，情況真是這樣嗎？開發ChatGPT的美國科技公司OpenAI已經表示，有證據顯示DeepSeek可能通過「蒸餾」技術（distillation）接觸到了他們的數據，盜用其模型進行開發。

杜奕瑾解釋，模型「蒸餾」技術是把大模型的知識提取出來之後，再交給小模型去做訓練，本來是業內為了降低成本的常見的做法，但DeepSeek可能利用它來建立自己的競爭模型，這違反了OpenAI 的服務條款。

杜奕瑾：「其實它（DeepSeek）原始碼裡面就有一段就是寫到，它其實是有用到這個OpenAI開放的這個模型蒸餾的這種方式，那我相信其實他們在做資料訓練的時候，是有使用OpenAI的模型蒸餾方式去提取很多相關的資料來做訓練，那這個可能在OpenAI它原本的這個授權是不允許的，那所以OpenAI就把它（DeepSeek）的這個賬號做關閉。」

DeepSeek聲稱使用更少算力更低成本，性能媲美ChatGPT。杜奕瑾表示，根據過往AI開發的經驗，一旦在某一個領域有一個衡量標準出現，中國都會想辦法把自己模型的跑分結果調到超過美國模型。他比喻這就像一個「很會考試的模型」。

杜奕瑾：「科技公司在訓練這個模型的時候，我們會希望從廣泛的知識裡面去學到這個技能，那以這個技能再去參加考試，那再從這個考試結果知道，我們訓練的結果是怎麼樣，這是一般的美國的大科技公司大概是這樣子來做。那其實中國擅長的就是，當我們知道這些考試題目是什麼之後，那我們就是可以依照這些考試題目去，調整模型在它的這個Performance（表現），在它的這個分數上面就可以跑到比較好，那就是訓練一個『非常會考試的』這個模型。但實際上只要離開這個領域，因為它模型相對來講它的參數沒有那麼多，沒有那麼聰明也沒有那麼有經驗，那所以它只要離開這個領域，它的成果就會下降很多，那這個也是非常常見。」

杜奕瑾認為，DeepSeek有一點被炒作過頭，國家力量在背後推動，導致很多不是資訊專業的評語加入討論，讓原本簡單的科技發展變得很複雜。

編輯/尚燕採訪/易如後製/陳建銘