基于最大聯(lián)合信息系數的多元數據關聯(lián)性分析方法及應用研究.pdf_第1頁
已閱讀1頁,還剩101頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著信息技術的迅猛發(fā)展,數據獲取與數據存儲的能力大大提升,人們在各行各業(yè)迅速積累起了大量的數據,大規(guī)模和超大規(guī)模的數據存儲系統(tǒng)不斷涌現(xiàn)。多元數據作為一種廣泛使用的數據存儲形式,幾乎無處不在,并且在實際問題中,大部分的系統(tǒng)普遍具有多元性,系統(tǒng)任一分量的變化都是由與之相互作用的其他分量決定的,并且決定系統(tǒng)發(fā)展變化規(guī)律的信息分布在與之相關的所有變量之中,很難通過任意單一變量進行建??坍?,因此開展多元數據關聯(lián)性分析方法的研究具有重要的理論意義和

2、應用價值。
  傳統(tǒng)的關聯(lián)分析都是以理論模型為基礎,少量精準數據為支撐,再通過某些具體的算法進行求解;然而對于復雜系統(tǒng)以及開放、半開放系統(tǒng),傳統(tǒng)的關聯(lián)分析方法很難為其建立理論模型,如今在大數據背景下,一些無法解析的復雜機理,卻可以通過大量數據之間的某種關聯(lián)規(guī)律進行刻畫。本文結合大數據時代特點,圍繞多元數據的關聯(lián)性分析實際問題,系統(tǒng)的研究了多變量間關聯(lián)關系的分析方法,本文的主要工作如下:
 ?。?)建立了多元數據的關聯(lián)分析的核

3、心方法及整體流程框架
  首先,介紹了關聯(lián)分析問題的基本概念,給出了多元數據關聯(lián)性分析問題的數學描述,及對該問題的求解思路,并且針對傳統(tǒng)關聯(lián)分析方法存在的問題,對大規(guī)模高維數據的處理方法,以及多元數據關聯(lián)關系的探索性分析方法進行了研究,進而建立了多元數據關聯(lián)性分析方法的整體流程框架,將分析流程分為五個步驟:數據獲取、數據預處理、數據壓縮、探索性關聯(lián)分析以及對多元數據關聯(lián)性分析結果的評價解釋,并對各個步驟的主要任務進行了詳細的闡述。

4、
 ?。?)提出了多元數據最大聯(lián)合信息系數及其他聯(lián)合信息指標
  本文基于互信息相關理論,將雙變量最大信息系數拓展至了多維,提出了多變量最大聯(lián)合信息系數以及其他一系列聯(lián)合信息指標,對各指標的含義給出了嚴格的定義表達,對各指標滿足的特性給出了嚴格的定理證明,并且將多變量聯(lián)合信息指標的特性與傳統(tǒng)關聯(lián)指標進行對比,驗證了本文所提指標的在多元數據關聯(lián)分析中的有效性。
 ?。?)提出了多元數據最大聯(lián)合信息系數及其他聯(lián)合信息指標的

5、求解算法
  在對多元數據聯(lián)合信息指標求解算法的討論中,本文提出并證明了聯(lián)合信息指標的最優(yōu)劃分方案滿足遞推關系定理,從而實現(xiàn)了求解最優(yōu)劃分方案的動態(tài)規(guī)劃算法,并基于此算法,給出了多變量聯(lián)合信息指標理論上的最優(yōu)求解算法和近似求解的算法。
 ?。?)進行了多元數據的關聯(lián)分析方法的實例研究
  本文最后對所提的關聯(lián)分析方法進行了實例研究,首先,基于仿真數據進行數值算例研究,對基于MJIC及其他聯(lián)合信息指標的探索性分析方法的有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論