DeepSeek如何在AI競賽中彎道超車?3個關鍵做法,高效運用人才與資源
圖片來源:Pexels
由於這些人才本身就有強烈的自律能力與成長動力,因此梁文鋒並未給他們太多的鞭策和要求。此外,他深知過度鼓勵內部競爭反而會產生不必要的內耗,因而規定「禁止賽馬」,也就是用KPI排名的方式來做人才管理。
值得注意的是,部分軟體和AI領域的人才的確不能套用一般模式來管理。MeandMine兒童科學手作遊戲新創公司創辦人黃文馨就觀察到,在矽谷有許多AI或軟體方面的奇才本身可能是高功能自閉患者或是有閱讀障礙而有人際方面和學歷上的挑戰,但那些客觀條件並不能反映這些人才的能力和價值。
梁文鋒從一開始就很明確DeepSeek要做的是打地基的基礎科學研究。他鼓勵團隊成員由下而上自發組隊學習新技術、新知識,為了解決問題形成自然分工。DeepSeek最初只是一個年輕研究員對於「MLA(多頭潛在注意力)」的研究有興趣,團隊討論後認為有潛力,就投入資源發展,孰知如今竟孕育出令模型訓練成本大降的關鍵架構。
關鍵2:強調跨學科合作、敢於提問、放大格局
創新的前提是,敢於挑戰傳統智慧,摸著石頭過河。既然要做最前瞻的科學基礎研究,就得靠不怕失敗,樂於解決陌生問題,且能有開放的眼界和心胸應用其他學科的知識來找答案。
此外,大語言模型就怕「Garbage in, garbage out」(餵AI垃圾、它就吐不出鑽石),因此資料的品質至關重要。換言之,團隊自然需要有各領域高手,包括人文、歷史、社會、理工、農學科等背景,擅長找資料且產出高品質內容來訓練AI的「資料百曉生」。
這也呼應了為何隨著生成式 AI 技術的成熟與落地,紛紛有專家提醒,台灣不缺技術開發人員,但對於企業最重要卻也最缺乏的,是將 AI 導入企業應用的各個部門的種子人員。
「這群人不一定來自於傳統的資訊科學領域,也不見得對語言或程式模型很熟悉,他們擁有的,反而是擁有將產業需求與痛點,轉成提問的能力,」台灣微軟總經理卞志祥指出:「多數人在面對一局生意、一個趨勢的時候,很少能提出宏觀且全面的問題,引導出解法。但如今,我們更需要的人才是,能夠跳脫既有思維、拉升層級,把問題格局放大的破局者。 」
(責任編輯 / 溫為翔)