Cheers 首頁
每日5分鐘
技能飆升中
為提供您更多優質的內容,本網站使用 cookies 分析技術。若繼續閱覽本網站內容,即表示您同意我們使用 cookies,關於更多 cookies 資訊請閱讀我們的 隱私權政策
就在台灣多數民眾沈浸於農曆新年時,DeepSeek一夕間引發全球科技業股價震盪。號稱以極低的成本改寫AI訓練規則,更採用開源模型,我們是否正見證AI下個階段的轉捩點?

創辦人梁文鋒是一名1985後世代的企業家,出生於廣東湛江吳川巿,浙江大學畢業,具備電子資訊工程和計算機科學的學士和碩士學位。他透過自己創立的對沖基金,為DeepSeek的研發提供部分資金支持。

DeepSeek如何以低成本,並在極短時間訓練出高性能AI模型?除了有能降低計算複雜度的新技術,另外還有一項關鍵:蒸餾(Distillation)。簡單來說就是「站在巨人的肩膀上」。DeepSeek無需從零開始構建大型AI模型,而是以其他公司(例如OpenAI)投入大量資金和時間開發的AI技術(例如ChatGPT)作為「教師模型」,以該模型產出的資料(tokens),來訓練自己「學生模型」,以快速提升自身能力。

而OpenAI也的確提出指控,DeepSeek是偷拿他們的模型來開發。雖然「蒸餾」本身是AI訓練常見的做法,但盜用疑慮則取決於是否經過授權。

DeepSeek,對AI技術有什麼影響?

對於DeepSeek將帶來的影響,我們訪問長年耕耘邊緣AI領域、掌握NPU技術的耐能智慧執行長劉峻誠,他提到了幾個層面:

一、打破技術框架

DeepSeek的成功,打破了傳統AI訓練必須依賴GPU的框架。劉峻誠指出,DeepSeek在不使用高成本GPU的情況下進行AI訓練,大幅降低了門檻和成本。

在其方法論的支持下,未來各企業推出的大語言模型能力差異將變得很小。「大語言模型的訓練將變得沒那麼重要,執行推論變得比較重要。」

二、促進AI的個人化與在地化

DeepSeek的開源策略,將使個人和國家都能建立自己的AI,減少對大型科技公司的依賴,個人化、主權化的AI在資料安全上也更有保障。

此外,劉峻誠也認為這是AI發展的重要拐點,AI將離開「雲」進入「端」的領域,落地到各種應用裝置百花齊放。

三、推動NPU的普及

劉峻誠將GPU比喻為卡車,而NPU則是小客車,NPU更適合在城市中運行,只是大多數人都習慣開卡車。而當使用GPU運行AI的成本,已高到無法持續的地步,必然會驅動NPU的崛起。

特別是在ChatGPT等大語言模型出現後,「就像油價漲了200倍,讓一些卡車司機願意去學小客車。」劉峻誠比喻。

目前GPU高耗能的問題,已牽涉到環境、地緣政治。劉峻誠認為,NPU的節能與高效,是未來AI發展的趨勢,而DeepSeek的崛起有助於加速實現。

延伸閱讀

  1. 1 不會寫程式=沒前途?微軟總裁:想升遷,應向文組人學習
  2. 2 DeepSeek如何在AI競賽中彎道超車?3個關鍵做法,高效運用人才與資源
  3. 3 半導體科技大老聚會中,他是最年輕的臉孔!曾獲獎無數、又被追債上億,劉峻誠謹記「勿忘初心」
  4. 4 英特爾華裔CEO陳立武首登Computex!解密半導體巨頭如何從低谷重生:他做了哪些事助公司營收連三季回溫?
  5. 5 不只發展AI,更思考人類未來 中央大學推動全校性AI教育嶄新布局

你可能有興趣的