動手玩玩Google Cloud Vision API

2024-11-16

文章推薦指數： 80 %

投票人數：10人

可簡單分成臉部辨識、標籤偵測、Web、文本辨識等等，下面將會就各個功能分邊說明。

不過，就算不真正設置API 到自己的project 中，網頁版就值得大家試試看 ... 動手玩玩GoogleCloudVisionAPI#科技新知文/Allen｜編輯/Quen 我們之前曾經提過GoogleCloudVisionAPI（雲視覺API）在YouTube影片、空拍機影片的應用，透過此API能從圖片之中擷取內容的特徵，例如照片中出現的物體、是否有人臉等等。

其實，CloudVisionAPI可說是用來「理解」圖片內容的工具，就如同語音方面使用CloudNaturalLanguageAPI來「理解」字句中的意義一樣。

我們今天就來看看CloudVisionAPI能「看懂」哪些特徵吧！動手玩！只要前往GoogleCloudVisionAPI的官方網頁，就能無壓力試玩大多數的API功能！不僅不用錢，連網頁、API都不需要先架設！將檔案拖放進去就可以開始試用CloudVisionAPI強大的解析功能。

檔案拖入後，還可以簡單的在上方選擇想偵測的特徵：可簡單分成臉部辨識、標籤偵測、Web、文本辨識等等，下面將會就各個功能分邊說明。

不過，就算不真正設置API到自己的project中，網頁版就值得大家試試看他的威力了！標籤偵測（LABEL_DETECTION）在API中要求返回LABEL_DETECTION這個特徵時，API會回傳一組或多組回應，每組3個值：mid、description以及score。

mid：Machine-generatedidentifier。

如果API偵測出的物件或特徵是GoogleKnowledgeGraph裡面有的資料，那麼就會秀出該物件在KnowledgeGraph知識圖譜中的位置。

（前情提要：KnowledgeGraph是將世間萬物建立關係網路的龐大資料庫） description：這就是對該物件的文字敘述，例如：摩天輪。

score：顧名思義，就是CloudVisionAPI對於這個猜測的信心分數囉！同一張圖片內可能同時被偵測到許多物件或特徵，此時回傳的值會像是這樣： “labelAnnotations”:[{“mid”:“/m/017m8l”,“description”:“waterway”,“score”:0.9609974},{“mid”:“/m/0838f”,“description”:“water”,“score”:0.9603445},{“mid”:“/m/03ktm1”,“description”:“bodyofwater”,“score”:0.93432164},{“mid”:“/m/08rrcl”,“description”:“watertransportation”,“score”:0.9240506},{“mid”:“/m/019jd”,“description”:“boat”,“score”:0.9176671},……………………] 這個案例就是上面這張圖的回傳結果，API認為「水路運輸」是圖片中的主角，因此給了最高分；下面說的「大面積的水」、「船」、「划船」等特徵也都會列出來。

利用這個特徵值，可以輕易找出照片內容關鍵字，對於大量照片的分類、關鍵資訊的抽取都很有幫助。

臉部偵測（FACE_DETECTION）可以偵測輸入圖片中的多個臉孔，並可指出臉部特徵。

此API會回傳一組非常龐大的特徵集faceAnnotations，包含人臉的位置、是否高興、是否生氣、是否有戴眼鏡、是否模糊等等，甚至包含左眼在哪裡、眼睛上緣、下緣的位置等極細微的特徵都能透過此API獲取。

圖中可看出除了偵測人臉位置外，API還會回傳人臉的仰角、傾角、可能的情緒狀態等資訊。

煽情露骨內容偵測（SAFE_SEARCH_DETECTION）大家一定用過Google搜尋吧？Google會自動擋掉成人、血腥等內容，靠的就是一樣的技術。

使用此功能可偵測4種內容：adult、spoof、medical、violence，幫助使用者過濾不適合顯示出來的圖片。

標誌偵測（LOGO_DETECTION）此功能可以偵測出圖片中是否含有著名商標。

這項偵測同標籤偵測，一樣會有每組3個值回傳：mid、description以及score。

像是筆者在臉部偵測放的這張圖，其中的UNIQLO就被認出來了：地標偵測（LANDMARK_DETECTION）顧名思義，此功能可偵測圖片中著名的自然景觀或人工造景、建築等地標級物件。

除了常規的mid、description、score 以外，回傳值還會包含該地標在圖片中的位置（類似臉部偵測的方框），以及此地標的經緯度位置資訊locations。

筆者嘗試了自己拍的台北101與紐約中央車站都被正確的辨識出來了。

OCR文字辨識（DOCUMENT_TEXT_DETECTION）這也是很強大的功能，能圖片中出現的文字變成文字檔，省去輸入謄稿的時間。

GoogleCloudVisionAPI是非常強大的利器，由於多年來Google做搜尋引擎的經驗與技術累積，CloudVisionAPI可說是「看盡」世間萬物，又透過各種MachineLearning的training，讓辨識率大幅提高，甚至能偵測到很多人類沒有察覺的特徵細節。

今天就打開網頁玩玩看吧！參考資料來源 *GoogleCloudVisionAPIhttps://cloud.google.com/vision/ *GoogleCloudVisionAPIDocumentationhttps://cloud.google.com/vision/docs/ *FilteringinappropriatecontentwithCloudVisionAPIhttps://cloud.google.com/blog/big-data/2016/08/filtering-inappropriate-content-with-the-cloud-vision-api相關文章GoogleAPI是什麼？一次搞懂五種GoogleAPI，聽說讀寫樣樣通！什麼是推薦系統？如何應用深度學習TensorFlow來提升戰鬥力資料安全更上層樓的關鍵：機密運算手把手教你設定GCP預算與快訊訂閱CloudMile電子報所有CloudMile最新消息、產品動態、活動資訊和特別優惠，立即掌握。

名字 *姓氏 *公司 *電子信箱 *我已閱讀並同意CloudMile 隱私權政策與個資同意書.送出聯絡我們沒問題，我們可以幫您！只要撥打以下電話，即可聯繫銷售了解更多資訊。

新加坡：+65-6993-2383馬來西亞：+603-2280-6902香港：+852-3481-0068台灣：+886-2-2757-6077撥打電話聯絡我們

請為這篇文章評分？

延伸文章資訊

[Day8] 關於人臉偵測(Face Detection)的二三事

如果是要辨識影像中的人臉叫做人臉識別(Facial Recognition)，或者，更常聽到的是 ... 做手機應用(App)：Google ML Kit與Amazon Rekognition，...

google人臉辨識api，大家都在找解答旅遊日本住宿評價

偵測臉部和臉部特徵(不支援臉部辨識)。勾號.,在本示例中，您将使用GoogleVisionAPI检测图片中的人脸。为了证明自己已正确检测到人脸，您将借助相应数据在每个人脸周围画 ...

google圖片辨識(Vision), 影片辨識(Video), 語音辨識, 語言翻譯, 自然 ...

Faces : 顯示了這張圖中哪裡有臉；還有辨識表情，像這張圖他認為圖片中的人很開心。 https://ithelp.ithome.com.tw/upload/images/. Labels :...

Google Cloud Vision API教學：Face ID刷臉時代來臨！｜Live ...

Google Cloud Vision API｜介紹與應用人臉辨識越來越普及，應用也越來越廣泛而Google ...

GCP也能這樣玩！隨意上傳一張圖考考機器人的眼睛吧 ...

GCP入門文第一篇介紹號稱Google機器人的眼睛～～CLOUD VISION API 。 ... 各樣的物品，它不單單只能辨識物品，還能偵測圖片內的個別物件，透過圖片進行臉部辨識與情緒 ...

動手玩玩Google Cloud Vision API

文章推薦指數： 80 %

請為這篇文章評分？

延伸文章資訊

最新文章

相關網站資訊

更年期食療

更年期情緒

更年期症状

胰島素肥胖

胰島素阻抗

皮膚紅腫硬硬的

親子天下寶寶生活

毒品危害防制條例修法

抑鬱症安慰

應用寶

攝護腺

恐慌症睡覺

動手玩玩Google Cloud Vision API

文章推薦指數： 80 %

請為這篇文章評分？

延伸文章資訊

最新文章

相關網站資訊

更年期食療

更年期情緒

更年期症状

胰島素肥胖

胰島素阻抗

皮膚紅腫硬硬的

親子天下 寶寶生活

毒品危害防制條例修法

抑鬱症安慰

應用寶

攝護腺

恐慌症睡覺

親子天下寶寶生活