6步驟預測 精準掌握顧客行為
圖片來源:unsplash.com
上一期,我介紹了商業分析6步驟:TASSS$,預測分析也有6步驟,預測分析的目的是要建立一個預測模型,正確性很重要,因此流程必須更嚴謹。
預測模型的建立,有3種派別,分別是SAS公司的SEMMA、SPSS公司的CRISP-DM,以及我歸納出比較容易理解的方法:TAMEDI。
T-A-M-E-D-I分別代表6個步驟:Task、Analysis、Modeling、Evaluation、Deployment及Interpretation & Insight。
1.Task(課題):與商業分析最大的不同是,預測分析的課題在於解決「一個人」的問題。例如:「如何提高每個顧客的貢獻率?」、「如何喚醒每個沉睡中的客人?」
2.Analysis(分析):分析內涵包括理解現有資料、蒐集新資料、清理不必要的資料,以及確認分析的資料都是有效的。
3.Modeling(模型):建立模型首先要決定採用何種演算法,每一種演算法都有優缺點,沒有絕對好壞。其次,模型是用我們手上的資料建立,所以資料的正確性非常重要,否則會建立錯誤的模型,給出錯誤的預測。
建立模型時,要先將資料分成「Training Data」及「Test Data」。通常,80%的資料是Training Data,用來建立初步模型;另外20%的資料是Test Data,用來驗證模型的正確性。大數據軟體可以讓我們設定這兩種資料的比率,同時隨機抽取。
4.Evaluation(評估):當我們用Test Data檢驗模型準確度時,會出現4種可能,例如,當銀行決定是否放款給某位客人時,會先預測這個客人會不會逾期不還,而有:①預測客人會按期繳款,銀行決定把錢借給他(True Positive)。②預測客人不會按期繳款,銀行決定不把錢借給他(True Negative)。③預測客人會按期繳款,但銀行不願借錢給他(False Positive)。④預測客人不會按期繳款,但銀行同意把錢借給他(False Negative)。
第1、2種預測結果是正確的,所以出現比率愈高愈好;第3、4種則是愈低愈好。這種預測可以應用在很多地方,例如:顧客瀏覽各項資訊後,會不會購買產品?銀行該不該核發信用卡給這個申請者?這個病人會不會得到阿茲海默症?
5.Deployment(導入):將已經確認的演算法及模型,導入實務應用。這個階段操作系統的人就是使用者或前台人員,不再是大數據科學家。