DeepSeek影響與爭議一次看懂!關鍵5個問題,專家:歷史拐點來臨
圖片來源:DeepSeek官網
創辦人梁文鋒是一名1985後世代的企業家,出生於廣東湛江吳川巿,浙江大學畢業,具備電子資訊工程和計算機科學的學士和碩士學位。他透過自己創立的對沖基金,為DeepSeek的研發提供部分資金支持。
DeepSeek如何以低成本,並在極短時間訓練出高性能AI模型?除了有能降低計算複雜度的新技術,另外還有一項關鍵:蒸餾(Distillation)。簡單來說就是「站在巨人的肩膀上」。DeepSeek無需從零開始構建大型AI模型,而是以其他公司(例如OpenAI)投入大量資金和時間開發的AI技術(例如ChatGPT)作為「教師模型」,以該模型產出的資料(tokens),來訓練自己「學生模型」,以快速提升自身能力。
而OpenAI也的確提出指控,DeepSeek是偷拿他們的模型來開發。雖然「蒸餾」本身是AI訓練常見的做法,但盜用疑慮則取決於是否經過授權。
DeepSeek,對AI技術有什麼影響?
對於DeepSeek將帶來的影響,我們訪問長年耕耘邊緣AI領域、掌握NPU技術的耐能智慧執行長劉峻誠,他提到了幾個層面:
一、打破技術框架
DeepSeek的成功,打破了傳統AI訓練必須依賴GPU的框架。劉峻誠指出,DeepSeek在不使用高成本GPU的情況下進行AI訓練,大幅降低了門檻和成本。
在其方法論的支持下,未來各企業推出的大語言模型能力差異將變得很小。「大語言模型的訓練將變得沒那麼重要,執行推論變得比較重要。」
二、促進AI的個人化與在地化
DeepSeek的開源策略,將使個人和國家都能建立自己的AI,減少對大型科技公司的依賴,個人化、主權化的AI在資料安全上也更有保障。
此外,劉峻誠也認為這是AI發展的重要拐點,AI將離開「雲」進入「端」的領域,落地到各種應用裝置百花齊放。
三、推動NPU的普及
劉峻誠將GPU比喻為卡車,而NPU則是小客車,NPU更適合在城市中運行,只是大多數人都習慣開卡車。而當使用GPU運行AI的成本,已高到無法持續的地步,必然會驅動NPU的崛起。
特別是在ChatGPT等大語言模型出現後,「就像油價漲了200倍,讓一些卡車司機願意去學小客車。」劉峻誠比喻。
目前GPU高耗能的問題,已牽涉到環境、地緣政治。劉峻誠認為,NPU的節能與高效,是未來AI發展的趨勢,而DeepSeek的崛起有助於加速實現。
(責任編輯 / 溫為翔)