關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
漢語(yǔ)詞自動(dòng)生成研究 讀者對(duì)象:人工智能自動(dòng)語(yǔ)言處理領(lǐng)域的學(xué)生和研究人員
漢語(yǔ)是一種意合語(yǔ)言,其詞義絕大多數(shù)來(lái)源于內(nèi)部語(yǔ)素義的組配,而大數(shù)據(jù)背景下,基于海量數(shù)據(jù)的語(yǔ)義信息提取能夠?yàn)檎Z(yǔ)素義的描寫(xiě)和刻畫(huà)提供充分知識(shí)。本書(shū)將大數(shù)據(jù)相關(guān)資源和漢語(yǔ)詞的語(yǔ)素義提取和描述方法結(jié)合,詳細(xì)描述漢語(yǔ)詞的內(nèi)部組配機(jī)制和生成規(guī)則,最終更好的實(shí)現(xiàn)漢語(yǔ)詞的自動(dòng)生成。 漢語(yǔ)詞的生成一個(gè)重新解構(gòu)的語(yǔ)素義集合在一定的組配機(jī)制作用下進(jìn)行內(nèi)部成分再替換的過(guò)程。這一過(guò)程涉及語(yǔ)義提取、語(yǔ)義解構(gòu)、語(yǔ)素替換和組配規(guī)則生成四個(gè)過(guò)程。其中高質(zhì)量的語(yǔ)義提取是前提,多維度的解構(gòu)是所有工作的基礎(chǔ)。作者通過(guò)海量數(shù)據(jù)的挖掘和篩選針對(duì)性構(gòu)建語(yǔ)素義知識(shí)庫(kù)的形式,為漢語(yǔ)詞的語(yǔ)義分析提供支撐,然后根據(jù)語(yǔ)素的組配關(guān)系,確定詞項(xiàng)生成的語(yǔ)義來(lái)源。語(yǔ)素替換是語(yǔ)義生成的核心,包括語(yǔ)義近似度計(jì)算和義項(xiàng)選擇兩個(gè)環(huán)節(jié)。項(xiàng)目通過(guò)構(gòu)詞結(jié)構(gòu)、語(yǔ)素義、物性角色等語(yǔ)義知識(shí),以“語(yǔ)素概念”為基礎(chǔ),計(jì)算漢語(yǔ)語(yǔ)素義相似度,然后根據(jù)語(yǔ)素義項(xiàng)編碼,從而判斷可以生成替換的語(yǔ)素及對(duì)應(yīng)的義項(xiàng)。組配規(guī)則是決定漢語(yǔ)新詞能否正確生成的重要因素,項(xiàng)目通過(guò)構(gòu)建語(yǔ)素組配規(guī)則庫(kù)的形式,生成漢語(yǔ)詞的組配機(jī)制,使替換對(duì)象得以正確組合。 整個(gè)流程語(yǔ)素義的挖掘和描述出發(fā),通過(guò)基于神經(jīng)網(wǎng)絡(luò)模型的詞向量生成工具尋找語(yǔ)素概念的近義詞網(wǎng),最終達(dá)到由語(yǔ)義到文本的自動(dòng)生成,可以說(shuō)是典型的利用大數(shù)據(jù)及人工智能技術(shù)來(lái)處理語(yǔ)言的問(wèn)題。這一技術(shù)對(duì)自動(dòng)文摘、機(jī)器寫(xiě)作和機(jī)器翻譯有著重要影響。
你還可能感興趣
我要評(píng)論
|