機器學習與主動學習 - 程式前沿
文章推薦指數: 80 %
把主動學習方法引入蛋白亞細胞定位預測問題中,基於損失函式和標籤概率,構建非實驗標記樣本挑選演算法。
利用三個分類器在三個資料集上進行實驗,按照挑選 ...
程式語言前端開發IOS開發Android開發雲端運算人工智慧伺服器搜尋資料庫軟體開發工具機器學習與主動學習2018.07.15程式語言《機器學習,θ機器學習,機器學習,機器學習和,機器學習的,預測HOME程式語言機器學習與主動學習Advertisement1.利用主動學習方法,基於一個可以衡量樣本有用性的評估函式,利用該函式估計出每個樣本對於分類預測的價值從而主動挑選出最具價值的樣本。
把主動學習方法引入蛋白亞細胞定位預測問題中,基於損失函式和標籤概率,構建非實驗標記樣本挑選演算法。
利用三個分類器在三個資料集上進行實驗,按照挑選出來的順序把非實驗樣本逐漸加入到原始訓練集中重新訓練當前分類器並用測試集測試分類器的效能。
實驗結果一方面表明取得的最好預測結果均比未加非實驗樣本和加入所有非實驗樣本時高,這說明該演算法可以選擇合適數量的非實驗樣本從而提高預測效果;另一方面表明訓練資料缺乏問題比較嚴重時,預測效果提高的也越多,這說明非實驗樣本對於提高分類器效能的重要性。
因此基於主動學習的非實驗蛋白資料挑選演算法能夠有效實現最具價值樣本的挑選,可以有效地解決蛋白亞細胞定位預測中實驗資料缺乏的問題。
多元統計方法一般採用多元高斯分佈。
多元統計模型雖然易於揭示基本生物統計規律,但是預測能力比較差,一方面因為模型不易克服噪音和異常資料的影響,另一方面因為多元統I十方法難以整合多種異構蛋白特徵資訊。
在機器學習領域,模式識別(PatternRecognition]就是對一個給定的值進行處理和分析後分配一個標籤的過程,典型的例子就是分類問題。
模式識別問題非常具有一般性,輸出型別也有很多。
基於模式識別的預測方法就是運用數學和工程學工具從完整的蛋白質序列中提取能夠描述該蛋白質特徵的模式。
本文提出了一種主動選擇單標籤樣本的方法,在多個資料集上進行實驗。
該方法通過選擇額外的非實驗資料來解決資料缺乏的問題。
假設已經利用現有的訓練資料訓練好了一個分類器,該方法是基於一個可以衡量每個非實驗樣本的有用性並挑選出最具價值的樣本作為候補訓練資料的框架,利用該框架就可以挑選出有用的樣本,然後把挑選出的樣本加入到原始訓練集重新訓練已有的分類器,從而可以得到更好的預測結果。
2.****Veryimportant機器學習中的主要分類演算法KNN近鄰SVM支援向量機高斯過程模型2.1KNN特點優點:演算法簡單,研究人員在寫演算法程式時比較容易。
缺點:1)一是當樣本數量不平衡時,有可能導致當輸入一個新樣本時,該樣本的K個近鄰中數量較多的類的樣本佔多數,那麼這個新樣本將會被歸為數量較多的這一類,導致分類準確率降低;2)二是計算量較大,因為對每個新樣本進行分類時,都要計算該樣本與所有訓練樣本的距離,目前常用的解決方法是事先去除對分類作用較小的樣本。
3.主動學習技術傳統的被動學習構造訓練集時採用隨機抽樣的方法,這種分類模型效能較差,容易受到噪音樣本的干擾,這種隨機抽樣方法選擇的資料不能滿足研究人員的要求。
近幾年,主動學習方法發展迅速,利用該方法,學習器可以主動地選擇訓練資料,具備了這種靈活性之後,學習器就降低了對大批量標註樣本的需求。
在標註樣本缺乏的情況下,分類器仍然可以利用某些對分類有用的未標註樣本來提高分類器的效能。
主動學習就可以實現這個目的,主動學習主要基於機器學習的方法,利用某種方法從未標註樣本中選擇對分類有價值的資料從而提高分類效果。
AdvertisementAdvertisement写评论取消回覆很抱歉,必須登入網站才能發佈留言。
近期文章Vue中容易被忽視的知識點2019.12.09if我是前端Leader,談談前端框架體系建設2019.12.09Spark入門(一)用SparkShell初嘗Spark滋味2019.12.08Spark入門(二)如何用Idea運行我們的Spark項目2019.12.08Spark入門(三)Spark經典的單詞統計2019.12.08Spark入門(四)Spark的map、flatMap、mapToPair2019.12.08Spark入門(五)Spark的reduce和reduceByKey2019.12.08Spark入門(六)Spark的combineByKey、sortBykey2019.12.08Spark入門(七)Spark的intersection、subtract、union和distinct2019.12.08Spark實戰尋找5億次訪問中,訪問次數最多的人2019.12.08AdvertisementAdvertisement
延伸文章資訊
- 1【Active Learning - 01】深入學習“主動學習”:如何顯著地減少 ...
主動學習作爲一種新的機器學習方法,其主要目標是有效地發現訓練數據集中高信息量的樣本,並高效地訓練模型。與傳統的監督方法相比,主動學習具有如下優點 ...
- 2什麼是active learning? - 每日頭條
主動學習算法主要分為兩階段: 第一階段為初始化階段,隨機從未標註樣本中選取小部分,由督導者標註,作為訓練集建立初始分類器 ...
- 3以人為中心的機器學習與互動式機器學習簡介 - iT 邦幫忙
這篇想要續談前一篇有略提到的「互動式機器學習(Interactive Machine ... 就得先簡單地介紹機器學習中一個也是滿重要的主題「主動式學習(Active Learning)」.
- 4機器學習與主動學習 - 程式前沿
把主動學習方法引入蛋白亞細胞定位預測問題中,基於損失函式和標籤概率,構建非實驗標記樣本挑選演算法。利用三個分類器在三個資料集上進行實驗,按照挑選 ...
- 5主動學習(ACTIVE LEARNING) - 幫趣
主動學習(Active Learning)的大致思路就是:通過機器學習的方法獲取到那些比較「難」分類的樣本數據,讓人工再次確認和審覈,然後將人工標註得到的 ...