基于粒計(jì)算的多尺度聚類(lèi)方法.pdf_第1頁(yè)
已閱讀1頁(yè),還剩81頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中發(fā)現(xiàn)隱藏的、有價(jià)值的知識(shí)和規(guī)則的過(guò)程。聚類(lèi)分析是其中一項(xiàng)重要的挖掘技術(shù),已經(jīng)得到了研究人員的密切關(guān)注,并且在模式識(shí)別、金融經(jīng)濟(jì)分析、市場(chǎng)決策、圖像處理等領(lǐng)域有廣泛的應(yīng)用。多尺度科學(xué)是典型的跨學(xué)科課題,將多尺度科學(xué)引入數(shù)據(jù)挖掘領(lǐng)域,為數(shù)據(jù)挖掘領(lǐng)域的研究打開(kāi)了新的思路和方向。
  針對(duì)于多尺度數(shù)據(jù)挖掘多局限于空間、圖像數(shù)據(jù)的缺陷,本文以聚類(lèi)為切入點(diǎn),主要研究一般數(shù)據(jù)集的尺度特性以及多尺度聚類(lèi)的理論和方法,目的是

2、多角度、多層次的對(duì)數(shù)據(jù)進(jìn)行分析,為用戶(hù)提供多元化的決策支持。粒計(jì)算是解決復(fù)雜問(wèn)題、挖掘海量數(shù)據(jù)的新方法。粒計(jì)算模擬了人類(lèi)思考問(wèn)題的方式,多層次分析問(wèn)題,根據(jù)實(shí)際需要,時(shí)而從整體上分析宏觀(guān)特征,時(shí)而進(jìn)入某一部分研究細(xì)節(jié)特點(diǎn)。這種“分而治之”的思想與多尺度聚類(lèi)是非常契合的。因此,本文將粒計(jì)算作為宏觀(guān)層面的方法論基礎(chǔ),指導(dǎo)多尺度聚類(lèi)的算法設(shè)計(jì),為多尺度聚類(lèi)算法提供新的視角。
  論文以粒計(jì)算中的等價(jià)劃分模型為基礎(chǔ),構(gòu)建多尺度數(shù)據(jù)模型,為

3、多尺度聚類(lèi)算法提供數(shù)據(jù)預(yù)處理方法;闡述尺度轉(zhuǎn)換、尺度效應(yīng)、尺度選擇的相關(guān)知識(shí),研究多尺度聚類(lèi)理論基礎(chǔ);提出多尺度聚類(lèi)的定義,從粒子的角度分析多尺度聚類(lèi)的實(shí)質(zhì),最終構(gòu)建多尺度聚類(lèi)體系結(jié)構(gòu),為多尺度聚類(lèi)提供算法框架;同時(shí),基于信息粒度改進(jìn)相似度計(jì)算方法,結(jié)合斑塊模型和IDW插值法,分別提出多尺度聚類(lèi)尺度上推算法和多尺度聚類(lèi)尺度下推算法。
  本文以多尺度聚類(lèi)為研究核心,主要完成了如下工作:
  1)研究多尺度聚類(lèi)理論基礎(chǔ)

4、  針對(duì)目前多尺度聚類(lèi)存在的問(wèn)題,從多尺度數(shù)據(jù)模型、尺度轉(zhuǎn)換、尺度效應(yīng)、尺度選擇四個(gè)方面對(duì)多尺度聚類(lèi)的理論基礎(chǔ)進(jìn)行研究。首先,從粒計(jì)算中的等價(jià)劃分模型出發(fā),分析數(shù)據(jù)集中的等價(jià)關(guān)系,并參考粒化方法,提出一般數(shù)據(jù)集尺度化的方法,并給出尺度、尺度劃分、多尺度數(shù)據(jù)集、祖-孫尺度、父-子尺度的數(shù)學(xué)定義;其次,歸納尺度轉(zhuǎn)換的原因和分類(lèi);然后,分析尺度效應(yīng)的定義以及尺度效應(yīng)的具體體現(xiàn);最后,給出多尺度聚類(lèi)尺度選擇的三大原則和三個(gè)量化標(biāo)準(zhǔn),為后續(xù)多尺度

5、聚類(lèi)算法的實(shí)現(xiàn)提供基礎(chǔ)。
  2)構(gòu)建多尺度聚類(lèi)算法框架
  首先,結(jié)合聚類(lèi)和尺度知識(shí),明確多尺度聚類(lèi)的定義;其次,從粒子的角度分析多尺度聚類(lèi)的實(shí)質(zhì)——知識(shí)的尺度轉(zhuǎn)換,指出多尺度聚類(lèi)尺度轉(zhuǎn)換的對(duì)象應(yīng)該是能夠代表聚類(lèi)的特征描述符,如簇心、簇內(nèi)相似度等;最后,搭建多尺度聚類(lèi)體系結(jié)構(gòu),歸納出多尺度聚類(lèi)的三個(gè)階段:數(shù)據(jù)的多尺度轉(zhuǎn)換、知識(shí)的多尺度轉(zhuǎn)換、多尺度決策,為算法設(shè)計(jì)提供指導(dǎo)框架和實(shí)現(xiàn)思路。
  3)提出多尺度聚類(lèi)算法

6、r>  首先,基于信息粒度提出改進(jìn)的相似度計(jì)算方法。在此基礎(chǔ)上,根據(jù)多尺度聚類(lèi)體系結(jié)構(gòu),結(jié)合已有的尺度轉(zhuǎn)換方法,提出基于斑塊模型的多尺度聚類(lèi)尺度上推算法UAMC((U)pscaling(A)lgorithm of(M)ulti-scale(C)lustering)和基于IDW插值法的多尺度聚類(lèi)尺度下推算法DAMC((D)ownscaling(A)lgorithm of(M)ulti-scale(C)lustering)。
  4)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論