基于貝葉斯網絡的分布式商務數據挖掘模型研究.pdf_第1頁
已閱讀1頁,還剩68頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、面對日趨激烈的商業(yè)競爭,各企業(yè)紛紛走上信息化道路,通過ERP提高企業(yè)的商業(yè)競爭力。進而,對這些海量的ERP數據進行數據挖掘,從中得到潛在的、有用的知識,以輔助商業(yè)決策。但是隨著企業(yè)的不斷發(fā)展壯大,原來在企業(yè)中起過很大作用的數據庫管理系統(tǒng)的數據量成倍增加,其管理逐步由集中式向分布式發(fā)展,如何有效地對這些分布的數據庫進行數據挖掘成為新的挑戰(zhàn)。 傳統(tǒng)的數據挖掘基本上是一個本地的數據分析工具,僅能對本地數據集產生一定的理解性或概括性的知

2、識,而在數據分布環(huán)境下,除了結點上是物理分布的,處理的是海量數據,同時還要兼顧數據的安全性以及非共享數據的隱私性。針對這些問題,以數據挖掘中的分類和預測為重點,本文提出了基于貝葉斯網絡的分布式商務數據挖掘模型(DDMMBN, Distributed Data Mining Model Based on BayesianNetwork),該模型是以具有移動Agent功能的Bee-gent系統(tǒng)為框架,以貝葉斯網絡相關性學習理論為方法,以屬性

3、多叉樹為中間過程,從分布的商業(yè)數據庫中訓練得到綜合的貝葉斯網絡,利用綜合的貝葉斯網絡推理實現對客戶的分類和消費量的預測。 該模型(DDMMBN)中提出了屬性多叉樹這一數據結構,該屬性多叉樹能反應各分布的數據集的屬性特征值,它可以通過移動Agent訪問各分布的數據集,調用其屬性多叉樹構建算法而得到,然后利用屬性多叉樹得到貝葉斯網絡。該屬性多叉樹能很好地解決數據分布的問題,不需要將各分布的數據匯總,大大地減輕了網絡負擔,節(jié)省了本地存

4、儲空間。同時,由于該屬性多叉樹只是概括了分布數據集的特征值,而不需要涉及每條數據記錄的細節(jié),故在一定程度上能很好地解決其分布數據的隱私性問題。本文在詳細闡述了貝葉斯網絡理論、分布式數據挖掘相關技術和移動Agent技術后,針對商業(yè)企業(yè)中客戶的分類和消費量的預測問題,提出了該基于貝葉斯網絡的分布式商務數據挖掘模型(DDMMBN)。以Bee-gent系統(tǒng)為基礎,建立了該模型的原型系統(tǒng),利用已有的商業(yè)數據,與數據匯總法和加權表決法相比較,證明了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論