關聯規(guī)則Eclat算法改進研究.pdf_第1頁
已閱讀1頁,還剩47頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數據挖掘是從海量數據中獲取有效的、新穎的、潛在有用的知識,并最終形成可理解的模式的非平凡過程。現今的數據庫系統已經能夠實現查詢、統計和報表,但處理方式相對單一,都只是對一定范圍內的數據進行簡單的數字化處理,而不能提取隱藏在這些數據背后的內在信息。隨著各行各業(yè)廣泛應用信息管理系統,帶來了數據量的急速膨脹,人們迫切希望有一種功能,它能夠提供更高層次的數據分析,從而更好地支持決策或科研工作。關聯規(guī)則挖掘是數據挖掘中關聯分析的運用,是數據挖掘一

2、個非常重要的學科,具有很高的理論價值和廣泛的應用前景。
   關聯規(guī)則反映一個事物與其他事物之間的相互依存性和關聯性。如果兩個或多個事物之間存在著一定的關聯關系,那么其中一個事物就能夠通過其他事物預測到。關聯規(guī)則挖掘算法用于發(fā)現關聯規(guī)則,諸多的研究人員和學者對其進行了大量的研究。現有的關聯規(guī)則算法大多數是基于Apriori和FP-growth的迭代算法。通常數據庫有水平數據表示和垂直數據表示兩種形式,本文深入分析了頻繁項集的挖掘

3、問題,描述了現有的關聯規(guī)則分類和挖掘算法,并著重對傳統Apriori算法和AprioriTid算法進行分析,指出了他們各自的優(yōu)缺點。對于挖掘算法的性能,通常采用垂直數據表示的算法要高于水平數據表示,Eclat算法是首個采用垂直數據表示的經典關聯挖掘算法。
   本文首先對Eclat算法進行了深入地研究和分析,并在此基礎上提出了一種改進算法——hEclat。該算法把散列表與布爾矩陣相結合,提出散列布爾矩陣的思想,對傳統Eclat算

4、法中求兩個Tidsets集合交集的操作進行改進,以提高求交集的速度,從而達到提升整個算法生成頻集、挖掘關聯規(guī)則的效率。
   對關聯規(guī)則挖掘而言,已有的很多研究只注重解決算法的時間效率,而忽視了關聯規(guī)則的多維特性,通過在關系數據庫中提取出用戶感興趣的多維關聯規(guī)則,在商務決策方面將更具指導意義,也更能夠滿足實際情況的需要。本文在傳統Eclat算法基礎上提出MD-Eclat算法,并構造了一種新的數據預處理方法,實現從關系數據庫的普通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論