關(guān)于我們
書單推薦
新書推薦
|
文本數(shù)據(jù)挖掘與Python應(yīng)用
教材系統(tǒng)地介紹文本數(shù)據(jù)挖掘的相關(guān)概念,利用Python作為工具進行相關(guān)試驗,其內(nèi)容主要包括:文本挖掘產(chǎn)生的背景及發(fā)展;文本挖掘的概念、文本模型表示、文本內(nèi)容的預(yù)處理,包括分詞、去停用詞以及特征抽;文本相似度的概念等。介紹文本分類的概念及常用方法,如KNN算法、SVM算法等,并對分類結(jié)果進行評價;在介紹文本聚類聚類的概念時是,同樣介紹聚類常用算法,如K均值算法、層次聚類法、密度聚類法等,作為有文本分類、文本聚類的應(yīng)用,最后給出了信息抽取、社會網(wǎng)絡(luò)中的實體關(guān)系抽取和事件抽取。
你還可能感興趣
我要評論
|