AI時代最性感、有趣的職業?SAS台灣資料科學家工作心法大解密!
圖片來源:圖片由賽仕電腦軟體股份有限公司提供
《哈佛商業評論》曾撰文指出,資料科學家是21世紀最性感的職業
如今,10多年過去了,去年《哈佛商業評論》又以〈資料科學家仍然是21世紀最性感的職業嗎?〉為題,直指隨著AI在商業領域的應用愈來愈廣泛、普遍,儘管資料科學家的工作內容已和過去有所不同,但企業對這個職位的需求,卻比任何時候都要來得高。
事實上,在AutoML、ChatGPT等AI相關工具接連問世後,善於運用AI工具、從資料中抽絲剝繭的資料科學家,已成為協助企業解決商業問題、找出價值的重要角色。究竟,「資料科學家」這個聽來神秘難解的職稱,平常都在做些什麼事?

資料科學家的日常 終日與數據為伍
SAS台灣業務顧問部顧問謝宗翰透露,SAS台灣的資料科學家在服務客戶時,都必須經歷需求訪談、定義問題、釐清和整理資料、建立模型、實際落地和監控、持續再訓練模型等重重步驟,「這些工作就是資料科學家的日常。」
以SAS台灣和台北榮總合作的「三階段布局AI臨床應用技術藍圖」專案來說,第一階段打造出的「血液透析即時預判系統」,主要是將北榮的大數據平台,串接血液透析機等聯網機器的資料,以為洗腎病友做出個人心衰竭風險預測,目前準確率高達90%。謝宗翰提到,會選擇從「血液透析即時預判系統」開始,就是在SAS的資料科學家與醫師進行需求訪談後,才定義出的問題,「和醫師聊過我們就知道,造成洗腎病友死亡的其中一個原因,是因為沒有即時發現心衰竭問題,因此『心衰竭的風險預判』,成為我們定義出來且希望用AI模型克服的問題。」
(✔習得技能:啟程資料科學家之路,獲取國際認證,幫履歷加分!)
其次,確定問題後,便要釐清現有的資料,若有不足、代碼紊亂等情形,則要與企業IT部門溝通,逐步蒐集、清洗資料,接著才能進入資料科學家的專業――「建模」。建好AI模型後,要再協助企業與現有系統串接、實際落地,並持續更新資料、訓練模型,才算完成一個完整專案,「持續更新資料、監控和訓練模型相當重要,資料科學家要檢視布建在環境中的模型夠不夠準確?表現好不好?待蒐集資料後,就會回到流程的最一開始,檢討是不是需要重新定義問題。每個專案都處在這樣的循環中。」謝宗翰強調。