

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、詞義消歧(WordSenseDisambiguation,WSD)是計算語言學和自然語言處理領域一個重要的研究課題,也是近些年來該領域的熱點研究問題之一。本文研究的重點在于統(tǒng)計詞義消歧技術,它根據(jù)使用的訓練方法的不同可以分為有指導和無指導的兩大類。早期的詞義消歧研究以基于知識的和有指導的機器學習方法為主,隨著計算技術和存儲技術的改進和提高,無指導方法受到的重視程度越來越高。
本文研究內容包括以下三個方面:
1.介紹資
2、源建設的情況。這部分包括IR-Lab分類詞典的建設和語料庫的建設兩個方面。IR-Lab分類詞典的建設對語料庫的建設以及等價偽詞的構造提供了很大的幫助。
2.考察了貝葉斯模型、最大熵模型、支持向量機和決策樹模型等四種數(shù)學建模方法在詞義消歧上的應用效果。通過各個模型的比較研究,發(fā)現(xiàn)貝葉斯模型和最大熵模型性能比其它幾個模型更為理想,尤其是貝葉斯模型,在構建和實現(xiàn)上比其它幾個模型相對要簡便易用,機器學習過程也簡潔高效。
3.
3、提出等價偽詞概念和等價偽詞的構造方法,并以此實現(xiàn)無指導的詞義消歧方法。利用得到的兩種較優(yōu)的機器學習方法:貝葉斯模型及最大熵模型,本文嘗試了基于等價偽詞的無指導詞義消歧方法,在Senseval-3的測試數(shù)據(jù)上獲得了81%的正確率,明顯優(yōu)于相應的有指導方法。實驗表明等價偽詞的概念以及建立在等價偽詞基礎上的無指導詞義消歧技術為探索詞義消歧的新技術提供了一個新的思路和方法。
綜上所述,本文在機器學習和無指導的詞義消歧方法上都作了一些有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于語義的中文詞義消歧技術研究.pdf
- 基于句法樹的中文詞義消歧方法研究.pdf
- 面向全文標注的中文詞義消歧研究與實現(xiàn).pdf
- 基于統(tǒng)計學習的詞義消歧關鍵技術研究.pdf
- 基于隱馬爾可夫模型的中文詞義消歧方法研究.pdf
- 基于SVM的離合詞詞義消歧.pdf
- 基于Moses的漢語詞義消歧.pdf
- 基于語義概念的詞義消歧方法.pdf
- 漢語詞義消歧研究.pdf
- 基于語義的漢語詞義消歧方法研究.pdf
- 基于語義范疇擴展的詞義消歧的研究.pdf
- 中文詞義歸納研究.pdf
- 基于語義向量的無導詞義消歧.pdf
- 基于語義類詞法信息的詞義消歧
- 基于語義類詞法信息的詞義消歧.pdf
- 基于依存句法分析的詞義消歧方法研究.pdf
- 基于深度學習的漢語詞義消歧方法研究.pdf
- 基于IT-Kid概念庫的詞義消歧方法研究.pdf
- 基于語料庫的漢語詞義消歧方法研究.pdf
- 基于知網和貝葉斯模型的詞義消歧技術的研究.pdf
評論
0/150
提交評論