人工智慧三大關鍵技術|數位時代BusinessNext

文章推薦指數: 80 %
投票人數:10人

過去60多年來,對人工智慧的研究未曾停歇,如今人工智慧即將帶領人類迎向劃時代的科技盛世,那麼該如何理解這門學問?本文從三大關鍵技術為您解析。

新聞 最新新聞數位專題熱門圖解專家觀點 主題分類 前端科技5G通訊AI與大數據電動車/交通科技物聯網區塊鏈能源環保服務消費新零售金融科技服務創新產業應用半導體與電子產業醫療生技資訊安全智慧城市智慧製造雲端運算與服務數位生活3C生活遊戲/電競影音/新媒體教育/人文企業職場商業經營創新創業行銷與Martech職場/工作術程式開發產業動態 數位行銷學院 課程一覽企業內訓團票預購 品牌活動 社群活動未來商務展MeetTaipei 品牌社群 未來商務Meet創業小聚 雜誌 最新出刊訂閱優惠關於我們內容轉載規範服務條款與隱私權政策廣告刊登場地租借徵才聯絡我們客服信箱:[email protected]服務時間:週一~週五09:00-12:00;13:30-17:0010694台北市光復南路102號9樓aboutus|廣告刊登|場地租借|內容授權 新聞 專題 社群 活動課程雜誌調查所Podcast登入/ 註冊熱門新聞活動會員Podcast«上篇下篇»02人工智慧三大關鍵技術 過去60多年來,對人工智慧的研究未曾停歇,如今人工智慧即將帶領人類迎向劃時代的科技盛世,那麼該如何理解這門學問?本文從三大關鍵技術為您解析。

詹峻陽 2016.11.01|AI與大數據人工智慧(ArtificialIntelligence)的研究,過去60多年來從未停歇,而今總算有了不凡的突破,從AlphaGo到智慧語音助理、自動駕駛技術等,無疑捕捉了無數人們的注意力,宣告著劃時代的科技盛世已經到來。

1950年,圖靈在他名為〈運算機器與智慧(ComputingMachineryandIntelligence)〉的論文裡提問:「機器能思考嗎?(CanMachineThink?)」,挑戰了人類對計算機智慧的想像。

圖靈認為人們會首先流於爭執機器與思考的定義,卻沒有辦法很精確地討論問題核心:「機器會有智慧嗎?」由於機器智能難以確切定義,圖靈在該論文首次對如何判定機器具有智慧,提出了著名的「圖靈測試」:如果機器與人類進行非面對面(例如在中間以布幕隔離)對話(例如使用文字訊息),人類卻無法辨認出對方是機器,那麼這台機器就具有智慧。

圖靈測試無論在當時或現代,對於人工智慧研究而言都是重要且相對嚴謹的研究提案,後續許多業界與學界的研究都企圖挑戰圖靈測試:如1966年麻省理工學院人工智慧研究室的約瑟夫.維森鮑姆(JosephWeizenbaum),以字串比對自動回覆的方式所開發出的聊天機器人ELIZA;或到2014年,英國雷丁大學(UniversityofReading)重磅宣布其所開發出的Eugene,已經通過測試,但後來被質疑標準有誤。

其實,人工智慧一詞直到1956年,才在美國新罕布夏州一場為期兩個月的研究工作坊「達特茅斯暑期人工智慧研究計畫(TheDartmouthSummerResearchProjectonArtificialIntelligence)」上,由負責組織會議的電腦高階語言LISP之父約翰・麥卡錫(JohnMcCarthy)正式定名。

這場工作坊所討論的問題:「計算機、自然語言處理、神經網絡、計算理論、抽象化與隨機創造」後來都成為人工智慧研究發展的重要領域,而達特茅斯會議也因此成為人工智慧領域的經典起源。

歷經了60年的發展,人工智慧的研究領域因種種困難而起起落落,經歷了無數個轉角。

起初仿造動物神經元,希望打造強人工智慧的人工神經網絡(ArtificialNeuronNetwork),先是經歷了機器無法應付計算複雜度的困境,無法取得研究經費而停滯;同一時期另一脈絡的弱人工智慧,則發展出博聞強記、分辨率隨資料質與量逐步提升而快速進展的機器學習。

如今,人與機器的對話,已因商業應用的普及而不再困難。

這一甲子,到底電腦科學家解決了些什麼問題呢?從人工智慧三大關鍵技術突破或可窺探未來。

關鍵技術一:文藝復興後的人工神經網絡對於人工智慧,電腦科學家當然希望可以直接模仿生物的神經元運作,因此設計數學模型來模擬動物神經網絡的結構與功能。

所謂人工神經網絡是一種仿造神經元運作的函數演算,能接受外界資訊輸入的刺激,且根據不同刺激影響的權重轉換成輸出的反應,或用以改變內部函數的權重結構,以適應不同環境的數學模型。

機器學習MachineLearning機器學習是可以尋找適合讓電腦做預測或數學模型分類的一種演算方法。

這種演算方法主要透過蒐集大量原始數據與標準答案,以訓練資料調整且選擇相應的數學模型,同時並藉由驗證資料比對計算分類結果,來判定模型是否適合用來預測或分類。

1951年,科學家馬文.閔斯基(MarvinMinsky)第一次嘗試建造了世上第一個神經元模擬器:Snarc(StochasticNeuralAnalogReinforcementCalculator),它能夠在其40個「代理人」和一個獎勵系統的幫助下穿越迷宮。

六年後,康乃爾航空工程實驗室的法蘭克.羅森布拉特(FrankRosenblatt)設計、發表神經網絡的感知器(Perceptron)實作後,人工神經網絡(或稱類神經網絡)學者曾經一度振奮,認為這個突破終將帶領人工智慧邁向新的發展階段。

但,人工智慧領域的研究在1970年代因為缺乏大規模數據資料、計算複雜度無法提升,無法把小範圍的問題成功拓展為大範圍問題,導致計算機領域無法取得更多科學研究預算的投入而沉寂。

到了1980年代,科學家首先透過思考上的突破,設計出新的演算方法來模擬人類神經元,迎來神經網絡發展的文藝復興時期。

物理學家約翰.霍普費爾德(JohnHopfield)在1982率先發表Hopfield神經網絡,開啟了神經網絡可以遞迴設計的思考。

四年後,加州大學聖地牙哥分校教授大衛.魯梅爾哈特(DavidRumelhart)提出了反向傳播法(BackPropagation),透過每次資料輸入(刺激)的變化,計算出需要修正的權重回饋給原有函數,進一步刷新了機器「學習」的意義。

科學家更進一步把神經元延伸成為神經網,透過多層次的神經元締結而成的人工神經網絡,在函數表現上可以保有更多「被刺激」的「記憶」。

目前多層次的人工神經網絡模型,主要包含輸入層(inputlayer)、隱層(hiddenlayer)與輸出層(outputlayer),另外根據資料輸入的流動方向,又分為單向流動或可以往回更新前一層權值的反向傳播法。

由於神經網絡模型非常仰賴計算規模能力,為了增加高度抽象資料層次的彈性,電腦科學家將之複合為更複雜、多層結構的模型,並佐以多重的非線性轉換,將其稱之為深度學習(DeepLearning)。

關鍵技術二:靠巨量數據運作的機器學習科學家發現,要讓機器有智慧,並不一定要真正賦予它思辯能力,可以大量閱讀、儲存資料並具有分辨的能力,就足以幫助人類工作。

1970年代,人工智慧學者從前一時期的研究發展,開始思辯在機器上顯現出人工智慧時,是否一定要讓機器真正具有思考能力?因此,人工智慧有了另一種劃分法:弱人工智慧(WeakAI)與強人工智慧(StrongAI)。

弱人工智慧意指如果一台機器具有博聞、強記(可以快速掃描、儲存大量資料)與分辨的能力,它就具有表現出人工智慧的能力。

強人工智慧則是希望建構出的系統架構可媲美人類,可以思考並做出適當反應,真正具有人工智慧。

機器學習(MachineLearning)可以視為弱人工智慧的代表,只要定義出問題,蒐集了適當的資料(資料中通常需要包含原始數據與標準答案,例如人像圖片與該圖片內人像的性別、年齡),再將資料分做兩堆:訓練用與驗證用,以訓練用資料進行學習,透過特定的分類演算法抽取特徵值,建構出資料的數學模型,以該數學模型輸入驗證用資料,比對演算的分類結果是否與真實答案一樣,如果該數學模型能夠達到一定比例的答對率,則我們認為這個機器學習模型是有效的。

這種具有標準答案,並以計算出的預期結果進行驗證的機器學習,通常被稱為監督式學習。

相對於監督式學習,非監督式學習則強調不知道資料該如何分類的機器學習,換句話說,我們提供電腦大量資料,但不告訴它(或許我們也真的不知道)這些資料該用什麼方式進行分類,然後電腦透過演算法將資料分類,人類只針對最終資料分類進行判別,在數據尋找規律就是機器學習的基礎。

機器學習的發展方向,是在設計、分析一些讓電腦可以自動「學習」的演算法,讓機器得以從自動分析資料的過程中建立規則,並利用這些規則對還沒有進行分析的未知資料進行預測。

過程中,時常運用統計學技巧,並轉化成電腦程式,進而計算出資料的分界條件來做預測。

深度學習DeepLearning深度學習是機器學習的一種分支,也是目前機器學習發展方向的主流。

其概念主要是複合多層複雜結構的人工神經網絡,並將其中函數作多重非線性轉換,使之增加高度抽象化資料、記憶資料影響能力。

弱人工智慧作為人工智慧領域的發展途徑,無論是監督式學習或非監督式學習,隨著資料被大規模蒐集、經由網際網路被傳遞、輔以雲端架構支援的運算,用機器學習來解決人類基礎的問題變成一種可能。

目前機器學習也是人工智慧商業應用最廣泛的一種技術。

舉凡搜尋引擎、圖像辨識、生物特徵識別、語音與手寫識別與自然語言處理、甚至是檢測金融詐欺等等,都是常見的應用。

關鍵技術三:人工智慧的重要應用:自然語言處理對人類來說,如何讓這些現代自己製造出來的機器們,可以聽懂人話,並與人類「合作」,絕對是可以推動我們面對未知宇宙的重要助手。

自然語言處理(NaturalLanguageProcessing,NLP)的研究,是要讓機器「理解」人類的語言,是人工智慧領域裡的其中一項重要分支。

英國雷丁大學的演化生物學家馬克.佩葛(MarkPagel)認為,最早的一種「社會科技」是人類的「語言」,語言的發明讓早期人類部落透過新工具:「合作」在演化上占有優勢。

自然語言處理可先簡單理解分為進、出計算機等兩種:其一是從人類到電腦──讓電腦把人類的語言轉換成程式可以處理的型式,其二是從電腦回饋到人──把電腦所演算的成果轉換成人類可以理解的語言表達出來。

自然語言處理NaturalLanguageProcessing自然語言處理又可分為不同的階段,包含:語音或文字辨識、自動分詞與詞性標注、語句生成與文本朗讀等。

主要著重如何以電腦處理並運用自然語言,並企圖讓機器「理解」人類的語言,是人工智慧領域裡的其中一項重要分支。

無論是從人類到電腦,或從電腦到人類,語言處理通常都使用到我們一般學習外語所要具備的聽、說、讀、寫等技能。

其中:聽與說主要使用到聽覺與發音,對電腦而言就是能夠透過麥克風「聽」到人類說話,把聽到的聲音轉成文字(這是語音辨識),或把電腦想要表達的意思轉成人類可以理解的詞句(這是自然語言生成),再用耳機或喇叭「唸」給人類聽(這是語音合成,功能通常稱作文本朗讀:texttospeech)。

科學家與工程師們也致力於影像文字辨識,影像來源可以是掃描完成的文件影像檔案、也可以是手機鏡頭的即時影像,目標的文字體則可以是一般鉛字印刷品或列印的文件,也可以是手寫文字(手寫文字辨識)。

當計算機透過「聽」或「讀」,將人類的話語或文章轉成文字、語句進到處理層,還需要能夠自動分詞(wordsegmentation),也就是電腦必須拆解人類的語句來理解語意,才可以進而給出相應的答案。

例如一般人對手機說:「今天香港會不會下雨」,手機必須錄下聲音、並且濾掉雜音、將這句話的聲音轉化為文字、將這句文字拆解成不同詞句,並標注上不同詞性(speechtagging)。

「瞭解」使用者想要知道氣象資訊的命令後,手機必須對能提供「天氣」資訊的伺服器發出相應的(告訴伺服器要的地理資料是香港、並把今天轉換為實際的日期時間)資訊請求,包含未來數小時區間氣溫、氣象(是多雲、雨或晴天等)、風速、降雨機率、濕度、氣壓、空氣品質或紫外線指數等。

人工神經網絡ArtificialNeuralNetwork,ANN簡單地說,人工神經網絡就是以數學函數模擬生物神經元的運作,透過數學模型模擬生物的神經傳導與反應,並藉此接受外界資訊輸入的刺激,根據不同刺激影響權重來轉換輸出反應。

當伺服器回應了前述的相應數據後,手機可以選擇用螢幕畫面來回應,但更貼心的作法是把這些資訊翻譯成「人話」,然後用聲音唸出來。

這時的處理可以把「香港接下來八小時會是晴天,氣溫攝氏25度,降雨機率是10%,空氣品質良好」這個句子,透過合成不同語詞聲音後說出來。

但是,使用者問的其實是「會不會」下雨,所以必須進一步把降雨機率10%、晴天等等資訊轉換成「會不會」的尺度,例如10%可以轉化為「不太會」或是「只有很小的機率」一詞。

人類互動最重要的工具就是語言,無論是文字或語音,語音智慧助理讓人能和機器說話,無非是近年行動裝置普及後,最令人興奮的進展之一。

1951年科學家馬文.閔斯基第一次嘗試建造了世上第一個神經元模擬器:Snarc,它能夠在其40個「代理人」和一個獎勵系統的幫助下穿越迷宮。

數字焦點01人工智慧經濟席捲全球03Google人工智慧產品大爆發的幕後秘辛關鍵字:#人工智慧#機器學習本網站內容未經允許,不得轉載。

追蹤我們 BnextMedia媒體群|數位時代經理人ShoppingDesign創業小聚未來商務 ©2021BusinessNextMediaCorp.All RightsReserved.106台北市大安區光復南路102號9樓



請為這篇文章評分?