地表最強偵測機!Google Vision API - 工程師的零與一

文章推薦指數: 80 %
投票人數:10人

Google Vision API 就像是Google 的照片搜尋功能,主要能夠讓機器學習圖片中的物件(如人臉、商標Logo、圖片中的文字等等),還可以偵測是否有暴力色羶 ... Notice:Undefinedvariable:first_catin/home/u957110350/domains/itforce01.com/public_html/wp-content/themes/mynote/inc/template-tags.phponline579 Notice:Tryingtogetproperty'cat_ID'ofnon-objectin/home/u957110350/domains/itforce01.com/public_html/wp-content/themes/mynote/inc/template-tags.phponline579 首頁 地表最強偵測機!GoogleVisionAPI 地表最強偵測機!GoogleVisionAPI 0 地表最強偵測機!GoogleVisionAPI 地表最強偵測機!GoogleVisionAPI   人工智慧影像辨識術已日臻成熟,什麼都騙不過它! 近年人工智慧(AI)已經應用到很多專業的產業領域中,如醫療、咖啡、零售、人臉合成、養殖業、無人駕駛、救流浪貓等等。

知名科技公司 Google也展現了將人工智慧技術帶入日常生活的決心,並推出了新一代機器學習產品。

正在學習 Python的你,對於這些資訊應該不陌生.本文要介紹的GoogleVisionAPI為GoogleCloud提供的人工智慧影像辨識工具,還被聯合利華Unilever採用、傢俱大廠IKEA也透過CloudVisionAPI打造一款商品搜尋應用程式,消費者只要對產品拍照,立即就能得知詳細資訊。

目錄 動手玩玩GoogleVisionAPI 標籤偵測(LABEL_DETECTION) 臉部偵測(FACE_DETECTION) 煽情露骨內容偵測(SAFE_SEARCH_DETECTION) 標誌偵測(LOGO_DETECTION) 地標偵測(LANDMARK_DETECTION) OCR文字辨識(DOCUMENT_TEXT_DETECTION) 動手玩玩GoogleVisionAPI GoogleVisionAPI就像是Google的照片搜尋功能,主要能夠讓機器學習圖片中的物件(如人臉、商標Logo、圖片中的文字等等),還可以偵測是否有暴力色羶腥的內容等等。

簡單而言,VisionAPI會自動辨認照片出現的物品並逐一做標籤。

只要點我打開GoogleCloudVisionAPI的網頁,將圖片拖曳進下圖中的紅色區域,就能無痛、無料試玩大多數的API功能。

API功能可簡單分成臉部辨識、標籤偵測、Web、文本辨識等等,下面將會就各個功能分別做說明。

標籤偵測 今天我們上傳一張圖片,API就會回傳一組或多組回應。

下圖為我們上傳一張貓咪圖片的範例,API回傳了多組回應。

每一組回應包含三個值:mid、description以及score。

上圖中右側顯示有description以及score。

description:這就是對該物件的文字敘述,例如:Cat(貓)、Mammal(哺乳類)等;而score就是CloudVisionAPI對於這個敘述的信心分數。

如此例中Cat為100%,代表API認為「貓」是圖片中的主題,因此給了最高分。

其他敘述還有Mammal(哺乳類)99%、Felidae(貓科動物)97%、TabbyCat(虎斑貓)95%等。

利用這個文字敘述,可以輕易找出照片內容關鍵字,對於大量照片的分類、關鍵資訊的抽取都很有幫助。

而mid值則是Machine-generatedidentifier(機器合成辨識)的縮寫,要點選「ShowJSON」才會看的到。

如果API偵測出的物件或特徵是知識卡裡面的資料,那麼mid值就會秀出該物件在知識圖譜中的位置(如下圖紅框內容所示): 臉部偵測 可以偵測輸入圖片中的多個臉孔,並可針對圖片中的每個臉,個別指出臉部的喜怒哀樂、特徵、位置、是否有戴眼鏡、是否模糊等。

點選「ShowJSON」則可以看到更細部的分析,包含左右眼的位置、眼睛上下緣的位置、人臉的仰角、傾角、可能的情緒狀態等極細微的特徵 煽情露骨內容偵測 此功能可偵測5種內容:adult(成人)、spoof(詐騙)、medical(藥物)、violence(暴力)、racy(性刺激),幫助使用者過濾出可能有爭議而不適合顯示的圖片。

下圖為使用裸體假人圖測試API的結果。

API則依據假人的裸體判斷此圖「可能」含有adult(成人)及racy(性刺激)的內容。

標誌偵測 此功能可偵測出圖片中是否含有著名商標。

以下圖為例,賽車上的「RedBull」就被偵測出來了。

地標偵測 此功能可偵測出圖片中是否含有著名地標。

以下圖為例,台北101的地點、經緯度都被偵測出來了。

OCR文字辨識這功能很強大,能抓取圖片中出現的文字,可存成文字檔,省去輸入謄稿的時間。

    參考連結: 蝦咪!假新聞可能是來自人工智慧的傑作? PTT創辦人杜奕瑾成功打造人工智慧語音辨識APP:雅婷逐字稿 靠人工智慧輕鬆養蝦!現在就連蝦養殖也能靠手機搞定! 高薪像做夢?!Java課程讓你夢想成真! 信不信由你,因為Java課程讓我獲得我想要的生活! NOWnews今日新聞 中國IT教育領導品牌 達內教育集團第一家海外授權中心     最後修改日期:2019-05-16 AIAI人工智慧PythonPython人工智慧Python課程人工智慧 近期文章 人間福音!谷歌地圖用人工智慧幫規劃”最省油路線” 人工智慧醫療再躍進!AI測腸癌靈敏度99.7%! 人工智慧無接觸經濟夯,保護金融資安不費力(下) 人工智慧無接觸經濟夯,保護金融資安不費力(上) Google提主題取代群組,解救FLoC爭議(下) Google提主題取代群組,解救FLoC爭議(上) 2021年必收12個UI/UX網頁設計工具(4) 分類 AI課程(225) APCS認證(7) AR/VR(4) CSS(1) Facebook(1) Google(9) googleads(2) HTML5教學(42) Java(17) javascript(26) NVIDIA(1) photoshop(3) Python課程(122) SEM(1) SEO優化(57) UI/UX設計(4) UI設計(28) Unity3D(1) 人工智慧(9) 人工智慧醫療(2) 前端工程師(59) 廣告關鍵字課程(2) 數位設計(8) 未分類(93) 機器學習(3) 程式語言(36) 網路前端(2) 網路行銷課程(38) 網頁前端(1) 蘋果(1) 設計課程(52) 達內教育(22) 標籤AI AI人工智慧 C++ CSS Google HTML5 HTML5教學 Java javascript JavaScript教學 JAVA工程師 JAVA面試 Python Python人工智慧 python函數 python教學 python程式語言 Python課程 SEO SEO優化 SEO教學 SEO課程 UI UI設計 UI課程 UX Web前端 人工智慧 前端 前端工程師 大數據 大數據課程 工程師 會計課程 機器學習 社群行銷 程式 網路行銷 網路行銷課程 網頁設計 語法 達內PTT 達內教育評價 長尾關鍵字 電腦課程 文章導覽 上一篇文章前端工程師溝通術:你得先了解網站的規劃流程!下一篇文章網頁設計時,如何用AWD偷吃步,還能達到無痛優化?



請為這篇文章評分?