深度學習讓機器變大腦,電腦也能畫地圖
圖片來源:unsplash.com、Google developers@YouTube、劉呈逸
超過10億個月活躍用戶、涵蓋3300萬公里、220個國家與上億的地標資料,運行超過10年的地面實況計劃(Ground truth),使得Google 地圖早早成為地圖軟體的一方之霸。
2017年,Google更將人工智慧技術裡的「深度學習」與地圖結合。Google地圖的軟體工程師盧金比爾(Andrew Lookingbill)於2018年9月舉辦的「Google機器學習系列媒體聚──Google地圖應用」,分享深度學習在地圖上的應用。
金比爾指出,辨識街景資訊對於電腦自動化作業是很大的挑戰。門牌或招牌雖已涵蓋製作地圖所需的內容,但這些資訊通常混雜且無序,而派出的街景車並非每次都能以同樣的角度截取圖資。
過去透過字元辨識軟體去分析影像內容的光學字元識別(OCR)方法,並不足以應付此類雜亂的資訊,深度學習便很適合在此時發揮力量。
何謂深度學習?人工智慧依應用層面有強弱之分,強人工智慧意指任何領域通用且具備人的能力;弱人工智慧則專指在某些特定領域具備人的能力,例如聲音、圖像識別。

深度學習則屬於弱人工智慧裡機器學習的一個分支,用機器模擬人類大腦在處理資料的運作模式,配合「餵食」大量資料讓機器深度學習,就能訓練機器學習出一套辨識模型,讓機器能夠從未結構化的抽象資料,判讀出有意義的內容。
金比爾的團隊利用深度學習裡的深度遞歸神經網路(RNN),建立出一套注意力機制,讓機器能夠主動關注或忽視圖像裡的某些元素;甚至能在機制裡制定規範化指令,例如要求機器將影像路牌裡的“Av.“字元,指定辨識為大道“Avenue”。
這套模型不僅能夠大幅改善地圖資訊的辨識率,也能對地圖資訊匱乏的開發中國家,帶來許多正面效益。Google於2017年在奈吉利亞拉哥斯城的地圖繪製計劃中,導入這套注意力機制的成果著實立竿見影,計劃期間就新增2萬條街道名稱、5萬個地址與10萬個店家資訊。
深度學習的力量可不僅止於此。透過機器建立出的模型機制,不僅能自動在錯綜複雜的衛星地圖辨識出建築物,更能在地圖上標示出建築物的俯視平面圖。今年初開始,就有1.1億個建築物透過這套模型繪製到地圖上。