造船、遊戲背景都歡迎,國泰金SRE人才靠「這優勢」搶贏科技業
圖片來源:以下圖片由國泰金控提供
SRE是近年崛起的新IT人才類型。從Google公開SRE維運方法論開始,這一套確保全球性服務高可靠度的作法,在科技業大力推廣;2021年台積電成為台灣率先招募SRE的高科技製造業者。國泰世華銀行中台發展部協理鄭正略表示, Google 提倡的SRE是以開發者的角度落實監控管理(Ops SRE),後來則有從維運者角度來監控(Dev SRE)。對國泰金控來說,要提升營運監控的能力,保持營運維穩及應變快速,兩種SRE人才特點並須兼具;如此,負責開發監控者也必須了解維運狀況、問題排除,並協助開發人員改善。
「這樣特殊的科技人才,必須由自己培訓,我們盤點國泰的資源與部門過去的經驗,規劃了國泰金控SRE人才培育計畫。」從基礎到進階課程的課程設計,透過培訓過程建置儀表板,同時,每個SRE新鮮人都有一位有經驗的導師帶領,以三階段、每階段3個月的考題培訓新團隊。從2022年12月迄今,培養了30多位SRE新血,效果非常好。未來,SRE將從地端前進到公有雲的監控,建構更完善整體的監控中心。
國泰世華銀行中台發展部協理鄭正略
SRE自主服務監控 第一時間排除所有狀況
「過去系統出有問題了,客訴電話進來,我們才會知道要去排除。現在,透過Ops SRE 自主式服務監控,『自動告警制』會主動通知相關人員去追蹤排除,讓我們比客戶更早知道系統可能有狀況,降低客戶服務的風險發生。」鄭正略強調,當數位金融服務越來越多元,如何升級服務與資訊安全,讓許多狀況在客戶發現之前就處理完成,正是國泰推動SRE人才培訓的目標之一。
國泰金控中台發展部測試發展科SRE工程師黃柏憲,原本在遊戲公司擔任系統工程師,專注在硬體、CPU與系統監控,從社群廣告看見國泰SRE人才培訓班,「除了台積電,就是國泰金控有SRE這個職缺!」對課程內容與監控管理的學習有高度興趣而來。「相較於科技業,國泰有完整的教學,包括SOP&UI 管理實作、Kafka、Grafana、AWS 基礎等,有助我從硬體監控轉為軟體監控的能力增進。」而轉換到金融業,服務對象更廣,服務監控的重要性更高,也讓黃柏憲感到具挑戰性。
Mentor制、開放溝通 新人學習更給力
「從科技產業轉換到金融業時,首先感受到的是公司提供的豐富教育訓練。這不僅包括SOP文件,還有一對一的Mentor制度和各種原廠教育影片(如OpenShift、AWS等),這些都大大縮短了我適應公司業務的時間,同時強化了我與世界各地IT領域的專業對接。」黃柏憲也點出金融業的決策流程較保守謹慎,與科技產業快速、基於Try Error的節奏形成鮮明對比,也因此在金融業服務需要更多的耐心和細緻的分析能力。