深度學習讓機器變大腦，電腦也能畫地圖

作者／劉呈逸 | 2018-09-27

瀏覽數

20649

今年舉行的I/O大會上，Google宣布將把擴增實境（AR）技術應用到地圖中，網友只要在使用地圖時，同步開啓手機相機，就能在實景中直接顯示導航資訊。這解救了一打開地圖就眼花撩亂、難以判讀的「無方向感一族」，可透過直覺式引導，順利抵達目的地…

圖片來源：unsplash.com、Google developers＠YouTube、劉呈逸

超過10億個月活躍用戶、涵蓋3300萬公里、220個國家與上億的地標資料，運行超過10年的地面實況計劃（Ground truth），使得Google 地圖早早成為地圖軟體的一方之霸。

2017年，Google更將人工智慧技術裡的「深度學習」與地圖結合。Google地圖的軟體工程師盧金比爾（Andrew Lookingbill）於2018年9月舉辦的「Google機器學習系列媒體聚──Google地圖應用」，分享深度學習在地圖上的應用。

金比爾指出，辨識街景資訊對於電腦自動化作業是很大的挑戰。門牌或招牌雖已涵蓋製作地圖所需的內容，但這些資訊通常混雜且無序，而派出的街景車並非每次都能以同樣的角度截取圖資。

過去透過字元辨識軟體去分析影像內容的光學字元識別（OCR）方法，並不足以應付此類雜亂的資訊，深度學習便很適合在此時發揮力量。

何謂深度學習？人工智慧依應用層面有強弱之分，強人工智慧意指任何領域通用且具備人的能力；弱人工智慧則專指在某些特定領域具備人的能力，例如聲音、圖像識別。

深度學習則屬於弱人工智慧裡機器學習的一個分支，用機器模擬人類大腦在處理資料的運作模式，配合「餵食」大量資料讓機器深度學習，就能訓練機器學習出一套辨識模型，讓機器能夠從未結構化的抽象資料，判讀出有意義的內容。

金比爾的團隊利用深度學習裡的深度遞歸神經網路（RNN），建立出一套注意力機制，讓機器能夠主動關注或忽視圖像裡的某些元素；甚至能在機制裡制定規範化指令，例如要求機器將影像路牌裡的“Av.“字元，指定辨識為大道“Avenue”。

這套模型不僅能夠大幅改善地圖資訊的辨識率，也能對地圖資訊匱乏的開發中國家，帶來許多正面效益。Google於2017年在奈吉利亞拉哥斯城的地圖繪製計劃中，導入這套注意力機制的成果著實立竿見影，計劃期間就新增2萬條街道名稱、5萬個地址與10萬個店家資訊。

深度學習的力量可不僅止於此。透過機器建立出的模型機制，不僅能自動在錯綜複雜的衛星地圖辨識出建築物，更能在地圖上標示出建築物的俯視平面圖。今年初開始，就有1.1億個建築物透過這套模型繪製到地圖上。

1 2

天下學習 X AIA｜AI素養課程系列1：AI基礎：掌握核心概念

天下學習 X AIA｜AI素養課程系列2：快速掌握Gen AI

AI時代的教育：面對瞬息萬變的模糊未來，孩子為何而學、要學什麼、如何去學？

路在前方On the Road : 改造23個臺灣公路生活圈