為提供您更多優質的內容,本網站使用 cookies 分析技術。若繼續閱覽本網站內容,即表示您同意我們使用 cookies,關於更多 cookies 資訊請閱讀我們的 隱私權政策
線上課程
每日5分鐘
技能飆升中
今年舉行的I/O大會上,Google宣布將把擴增實境(AR)技術應用到地圖中,網友只要在使用地圖時,同步開啓手機相機,就能在實景中直接顯示導航資訊。這解救了一打開地圖就眼花撩亂、難以判讀的「無方向感一族」,可透過直覺式引導,順利抵達目的地…
深度學習讓機器變大腦,電腦也能畫地圖

超過10億個月活躍用戶、涵蓋3300萬公里、220個國家與上億的地標資料,運行超過10年的地面實況計劃(Ground truth),使得Google 地圖早早成為地圖軟體的一方之霸。

2017年,Google更將人工智慧技術裡的「深度學習」與地圖結合。Google地圖的軟體工程師盧金比爾(Andrew Lookingbill)於2018年9月舉辦的「Google機器學習系列媒體聚──Google地圖應用」,分享深度學習在地圖上的應用。

金比爾指出,辨識街景資訊對於電腦自動化作業是很大的挑戰。門牌或招牌雖已涵蓋製作地圖所需的內容,但這些資訊通常混雜且無序,而派出的街景車並非每次都能以同樣的角度截取圖資。

過去透過字元辨識軟體去分析影像內容的光學字元識別(OCR)方法,並不足以應付此類雜亂的資訊,深度學習便很適合在此時發揮力量。

何謂深度學習?人工智慧依應用層面有強弱之分,強人工智慧意指任何領域通用且具備人的能力;弱人工智慧則專指在某些特定領域具備人的能力,例如聲音、圖像識別。

深度學習則屬於弱人工智慧裡機器學習的一個分支,用機器模擬人類大腦在處理資料的運作模式,配合「餵食」大量資料讓機器深度學習,就能訓練機器學習出一套辨識模型,讓機器能夠從未結構化的抽象資料,判讀出有意義的內容。

金比爾的團隊利用深度學習裡的深度遞歸神經網路(RNN),建立出一套注意力機制,讓機器能夠主動關注或忽視圖像裡的某些元素;甚至能在機制裡制定規範化指令,例如要求機器將影像路牌裡的“Av.“字元,指定辨識為大道“Avenue”。

這套模型不僅能夠大幅改善地圖資訊的辨識率,也能對地圖資訊匱乏的開發中國家,帶來許多正面效益。Google於2017年在奈吉利亞拉哥斯城的地圖繪製計劃中,導入這套注意力機制的成果著實立竿見影,計劃期間就新增2萬條街道名稱、5萬個地址與10萬個店家資訊。

深度學習的力量可不僅止於此。透過機器建立出的模型機制,不僅能自動在錯綜複雜的衛星地圖辨識出建築物,更能在地圖上標示出建築物的俯視平面圖。今年初開始,就有1.1億個建築物透過這套模型繪製到地圖上。

延伸閱讀

  1. 1 在口袋裡的辦公室
  2. 2 大數據是利器,前提是要懂得傳遞給「對的人」
  3. 3 電腦逼人類進步,制勝就靠「突發奇想」
  4. 4 Google地圖完全攻略目錄:一次學會21個旅遊導航常用密技

你可能有興趣的