關(guān)于我們
書單推薦
新書推薦
|
機器學習中的監(jiān)督與無監(jiān)督學習--模型、算法與應用
近年來隨著計算機技術(shù)的快速發(fā)展,機器學習被廣泛應用于信息檢索、自然語言處理、計算機視覺及自動化控制等方面。由于機器學習在實際應用中對不同問題所提供的條件各不相同,如含有標簽信息的數(shù)據(jù)、不含標簽信息的數(shù)據(jù)等,針對不同的數(shù)據(jù)類型有多種解決方法:監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習。本書針對監(jiān)督和無監(jiān)督學習方法進行理論的概述、模型的改進和應用領(lǐng)域的探究。
針對監(jiān)督概率主題模型的研究,本書將文本分析作為研究的重點,文本分析起源于20世紀50年代,然而其取得突破性進展則是在1990年后隨著機器學習及其它相關(guān)技術(shù)的發(fā)展而獲得的。文本分析是指通過擴展和應用數(shù)據(jù)挖掘、機器學習的相關(guān)方法,從各種文本數(shù)據(jù)中提取、挖掘有用信息的過程。通常人工撰寫的各種文本語料都是將各種文本語義進行復雜的抽象概念轉(zhuǎn)換的結(jié)果。其中包含的各種抽象概念被定義為“主題”,文檔的寫作過程即根據(jù)這些主題對文檔進行相應的文字描述、加工的過程。而文本分析的主要任務是對文檔中的文字進行有效的分析,與文章寫作相反的過程對文檔中包含的各種主題信息進行識別,從而獲得計算機可以解釋的文檔主題,為基于文檔分析的信息檢索、信息提取、自然語言處理等任務提供可靠的依據(jù)。 針對無監(jiān)督聚類模型的研究,本書主要涉及并行優(yōu)化、行人重識別、圖像識別領(lǐng)域的應用。
你還可能感興趣
我要評論
|