【新唐人北京時間2025年02月04日訊】中國初創公司DeepSeek聲稱用600萬美元研發出媲美OpenAI的AI模型,一度引發美股暴跌。不過,輿論很快開始反轉。多個研究機構發現DeepSeek背後存在諸多問題。我們就此專訪了台灣人工智慧實驗室(Taiwan AI Labs)創辦人杜奕瑾。
台灣人工智慧實驗室創辦人杜奕瑾分析,DeepSeek宣傳的特別之處在於:一是在小年夜,二是可以觀察到許多訊息操作。
台灣人工智慧實驗室創辦人杜奕瑾:「我們在看DeepSeek相關的這個訊息裡面,第一個就是官媒主導的這個成分是比例是佔的非常的高。那再來就是這個網路上,你如果說在微博,或者是在Facebook你都可以看到,很多這種不是屬於真正使用者的這個帳號,就開始非常的活躍。它並不是真的人,那其實平常也沒有什麼訂戶,那它就是用人工智慧的方法去做這個AI的這個短影音,不斷地在放大『美股下跌』的這個消息,『中美科技競爭中國贏了』這個消息。把一個很簡單的這個開源的這個成果,變成一個拉到這種國家層級去做這種科技競爭的這個炒作,那從官媒、從微博、以及從這個網絡上面的操作,這個從我們的感覺,就是蠻像以前中國跟俄羅斯在國家主導一些議題上面,它炒作的這種方式。」
有研究機構發現,在1月27日美股暴跌前夕,大量中共網軍在美國社交媒體炒作DeepSeek的消息。而杜奕瑾發現,「DeepSeek出世導致美股下跌」是一種因果顛倒的說法。
杜奕瑾:「它有點就是從訊息的導向,造成Pre-Market(盤前交易)的市場的下跌,因為Pre-Market相對來講是比較好操作的,那在這藉由放大Pre-Market市場的下跌,再去影響到這個正常交易時間的這個市場的這個結果。那正常交易市場的結果,那就可以放大造成美國股票這種大量下跌是因為DeepSeek的推出,這其實有點反因為果。我們看到的是,有很大量的訊息操作造成交易市場的Pre-Market下跌之後,那交易市場的Pre-Market之後大家才去注意到,DeepSeek這個東西是什麼東西?然後再去討論這個東西。而不是去討論這DeepSeek這個東西,而造成市場的這個下降。」
中共官方如此操作,目的是什麼呢?
杜奕瑾:「它藉由這個的操作,那它其實可以展現的就是,其實中國並不需要靠這種最高算力的模型芯片,也可以把模型做得很好,我想展示的是這個訊息。」
不過,情況真是這樣嗎?開發ChatGPT的美國科技公司OpenAI已經表示,有證據顯示DeepSeek可能通過「蒸餾」技術(distillation)接觸到了他們的數據,盜用其模型進行開發。
杜奕瑾解釋,模型「蒸餾」技術是把大模型的知識提取出來之後,再交給小模型去做訓練,本來是業內為了降低成本的常見的做法,但DeepSeek可能利用它來建立自己的競爭模型,這違反了OpenAI 的服務條款。
杜奕瑾:「其實它(DeepSeek)原始碼裡面就有一段就是寫到,它其實是有用到這個OpenAI開放的這個模型蒸餾的這種方式,那我相信其實他們在做資料訓練的時候,是有使用OpenAI的模型蒸餾方式去提取很多相關的資料來做訓練,那這個可能在OpenAI它原本的這個授權是不允許的,那所以OpenAI就把它(DeepSeek)的這個賬號做關閉。」
DeepSeek聲稱使用更少算力更低成本,性能媲美ChatGPT。杜奕瑾表示,根據過往AI開發的經驗,一旦在某一個領域有一個衡量標準出現,中國都會想辦法把自己模型的跑分結果調到超過美國模型。他比喻這就像一個「很會考試的模型」。
杜奕瑾:「科技公司在訓練這個模型的時候,我們會希望從廣泛的知識裡面去學到這個技能,那以這個技能再去參加考試,那再從這個考試結果知道,我們訓練的結果是怎麼樣,這是一般的美國的大科技公司大概是這樣子來做。那其實中國擅長的就是,當我們知道這些考試題目是什麼之後,那我們就是可以依照這些考試題目去,調整模型在它的這個Performance(表現),在它的這個分數上面就可以跑到比較好,那就是訓練一個『非常會考試的』這個模型。但實際上只要離開這個領域,因為它模型相對來講它的參數沒有那麼多,沒有那麼聰明也沒有那麼有經驗,那所以它只要離開這個領域,它的成果就會下降很多,那這個也是非常常見。」
杜奕瑾認為,DeepSeek有一點被炒作過頭,國家力量在背後推動,導致很多不是資訊專業的評語加入討論,讓原本簡單的科技發展變得很複雜。
編輯/尚燕 採訪/易如 後製/陳建銘