基于電力系統大數據集的知識發(fā)現方法的研究與實現.pdf_第1頁
已閱讀1頁,還剩80頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、流程工業(yè)的數據挖掘和知識發(fā)現是一個非常復雜但很有研究價值的領域。流程工業(yè)的內部環(huán)節(jié)每天都在產生并儲存著大量的運行數據,這些數據中蘊含著較多的知識等待人們去挖掘。流程工業(yè)工藝流程的各個環(huán)節(jié)組成的序列是一個時間序列,隨著時間的推移,內部環(huán)節(jié)依次運行。在目前的相關研究中,根據設備運行數據獲取內部環(huán)節(jié)的工藝順序是一個比較新穎也比較困難的問題;從流程工業(yè)數據中提取關聯規(guī)則已經不是一個新的話題,但是目前的研究方法提取的關聯規(guī)則僅是布爾型規(guī)則,而無法

2、挖掘出流程工業(yè)中多環(huán)節(jié)間的關聯關系;同時內部環(huán)節(jié)的狀態(tài)之間的如何影響,某個環(huán)節(jié)的變化對其他環(huán)節(jié)會產生怎樣的響應也是一個重要的問題,這些問題的研究和解決將會給流程工業(yè)帶來較大的意義。
  在此背景下,基于流程對象本文提出了一個知識發(fā)現模型——Time series-Clustering-Association-Chain/Tree Flow(簡稱為T-C-A-C/T Flow)。這是一個算法流,目的在于提取流程對象中具有強關聯關系的

3、關聯鏈,最終根據關聯鏈獲得其狀態(tài)關聯鏈。首先對流程對象數據進行預處理,包括T階段和C階段,其過程較為復雜,為減少運算時間,采用基于差分的數據取樣方法來選擇具有代表性的樣本數據作為該階段研究對象。為發(fā)現流程對象時序特征,提出一種基于極值的時序發(fā)現算法,通過對每個環(huán)節(jié)的極值進行計算,得到其他環(huán)節(jié)對基環(huán)節(jié)的時間距,根據時間距確定該流程對象的工藝順序。根據該順序對原始數據和差分數據進行調整就可以得到符合工藝順序的數據。為了使不同狀態(tài)類別的數據得

4、到區(qū)分和聚合,本文在提取關聯鏈之前先對時序調整后的數據進行最佳k類的k-means聚類,該過程也同時降低了計算復雜度。最佳k值采用基于凝聚度和分離度的輪廓系數評價函數來確定,通過對聚類結果進行評價,根據評價系數選擇最佳k值。對聚類集,采用基于 Apriori的維間關聯規(guī)則算法提取不同環(huán)節(jié)的聚類間的二項關聯規(guī)則,再根據該規(guī)則的支持度和興趣度確定環(huán)節(jié)間二項關聯規(guī)則及其關聯度?;陉P聯度,由所有的環(huán)節(jié)間關聯規(guī)則生成關聯鏈(最強關聯鏈和關聯樹)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論