基于大規(guī)模視覺(jué)模式學(xué)習(xí)的高性能圖像表示.pdf_第1頁(yè)
已閱讀1頁(yè),還剩113頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著數(shù)字媒體設(shè)備和智能手機(jī)的普及,以及社交網(wǎng)絡(luò)和網(wǎng)絡(luò)共享的流行,網(wǎng)絡(luò)上的圖像數(shù)據(jù)規(guī)模越來(lái)越大,相應(yīng)的識(shí)別需求越來(lái)越多。大規(guī)模圖像數(shù)據(jù)為圖像識(shí)別領(lǐng)域中的識(shí)別、分類、檢索等問(wèn)題帶來(lái)了更多的挑戰(zhàn),也孕育著更多的機(jī)遇。
  在過(guò)去幾年里,物體檢索是大規(guī)模圖像檢索中的熱門(mén)問(wèn)題。大規(guī)模詞表產(chǎn)生的稀疏圖像表示是檢索中快速查詢的保證,高性能圖像表示是檢索性能的保證。本文通過(guò)對(duì)局部特征空間中視覺(jué)模式學(xué)習(xí)和圖像表示的研究,可以快速產(chǎn)生高性能的圖像表示

2、,提升大規(guī)模圖像檢索系統(tǒng)的性能。
  為了解決大規(guī)模圖像的識(shí)別問(wèn)題,視覺(jué)屬性和中層圖像表示最近幾年成為研究熱點(diǎn)。本文通過(guò)研究視覺(jué)屬性學(xué)習(xí)和中層圖像表示的產(chǎn)生,可以快速學(xué)習(xí)大規(guī)模視覺(jué)屬性、產(chǎn)生可用于識(shí)別和檢索的高性能表示。
  本文的主要研究工作和創(chuàng)新之處如下:
  (1)提出了一種快速構(gòu)造高性能大規(guī)模視覺(jué)詞表的算法。針對(duì)當(dāng)前大規(guī)模圖像檢索系統(tǒng)的性能瓶頸,本文提出了一種快速構(gòu)建高性能大規(guī)模視覺(jué)詞表的算法。大規(guī)模圖像檢索系

3、統(tǒng)依賴于大規(guī)模視覺(jué)詞表,用以產(chǎn)生稀疏表示,進(jìn)而實(shí)現(xiàn)快速、準(zhǔn)確搜索。當(dāng)前最好的近似算法構(gòu)造大規(guī)模詞表時(shí)不能同時(shí)兼顧速度和性能。本文利用近似算法迭代過(guò)程中視覺(jué)模式的繼承關(guān)系,提出一種可以保證快速收斂的魯棒近似算法。該算法基本不增加時(shí)間、空間代價(jià)。理論分析表明,算法會(huì)在有限輪收斂到精確算法的收斂解。實(shí)驗(yàn)驗(yàn)證表明,產(chǎn)生同等性能的視覺(jué)詞表,所需時(shí)間是已有最優(yōu)算法的1/10。大規(guī)模圖像檢索系統(tǒng)利用該算法可以快速產(chǎn)生更大規(guī)模的高性能詞表,為系統(tǒng)的速度

4、和性能提供技術(shù)保證。該算法也可以應(yīng)用到其它視覺(jué)模式發(fā)現(xiàn)中,快速構(gòu)造大規(guī)模視覺(jué)模式集合。
  (2)提出了一種基于給定的大規(guī)模視覺(jué)詞表產(chǎn)生高性能圖像表示的算法。大規(guī)模圖像檢索系統(tǒng)中,針對(duì)給定大規(guī)模詞表后的圖像表示產(chǎn)生問(wèn)題,本文提出了一種高性能且對(duì)參數(shù)魯棒的算法,用于量化局部特征并產(chǎn)生圖像表示。本文分析了多重量化對(duì)提高大規(guī)模圖像檢索中稀疏表示性能的作用,測(cè)試了匯集環(huán)節(jié)中不同匯集方法在大規(guī)模圖像檢索問(wèn)題中的效果,并比較了檢索和識(shí)別中已有

5、量化算法的差異。本文從高斯核函數(shù)具有的尺度選擇性出發(fā),提出一種算法,最小化核函數(shù)空間重構(gòu)誤差的。該算法邏輯清晰、目標(biāo)簡(jiǎn)潔、求解簡(jiǎn)單,而且應(yīng)用到實(shí)際實(shí)驗(yàn)中可以產(chǎn)生更好的表示。該算法可以更好地利用更多近鄰信息產(chǎn)生高性能稀疏圖像表示;學(xué)得的多重量化權(quán)重能夠更好地利用距離中局部信息,使得產(chǎn)生的表示對(duì)于近鄰參數(shù)變化更加魯棒。
  (3)提出了一種快速產(chǎn)生高性能線性表示的方法。針對(duì)一般圖像表示問(wèn)題,本文從線性中層表示出發(fā)提出了一種間接地快速學(xué)

6、習(xí)大量潛在視覺(jué)屬性并產(chǎn)生高性能表示的方法。當(dāng)前基于視覺(jué)屬性的中層表示的各種研究,多數(shù)直接將屬性模型的輸出值組成一個(gè)長(zhǎng)向量作為中層表示。這種表示方式,中層表示是模型輸出的線性映射,表示具有線性不變性。本文以此為出發(fā)點(diǎn),提出通過(guò)學(xué)習(xí)這樣的語(yǔ)義子空間,間接地學(xué)習(xí)視覺(jué)屬性。通過(guò)子空間學(xué)習(xí)算法可以快速學(xué)習(xí)包含大規(guī)模潛在視覺(jué)屬性的語(yǔ)義子空間,這樣的語(yǔ)義子空間不僅可以通過(guò)線性映射產(chǎn)生維度可變的高性能中層表示,而且語(yǔ)義空間的投影具有很強(qiáng)的語(yǔ)義性,可以借

7、助人工標(biāo)注給其語(yǔ)義含義命名。
  (4)提出了一種產(chǎn)生高性能非線性表示的方案。在一般圖像表示問(wèn)題中對(duì)所有線性形式表示都不能充分利用屬性模型信息的缺陷。本文受其它問(wèn)題中非線性表示的研究啟發(fā),提出一種基于屬性的非線性中層表示方案,用以產(chǎn)生高性能中層表示。該非線性表示方案對(duì)視覺(jué)屬性定義、屬性模型學(xué)習(xí)和表示產(chǎn)生三個(gè)環(huán)節(jié)分別提出要求:定義高度有偏的二元分類問(wèn)題,學(xué)習(xí)局部有效的支持向量機(jī)模型,最后采用恰當(dāng)?shù)某叨葏?shù)利用非線性映射產(chǎn)生中層表示。

8、其中,非線性表示可以更好地利用屬性模型的偏移和尺度信息,因而具有更高性能;局部有效的屬性模型指明輸出值中存在一定冗余信息,使后續(xù)的信息壓縮成為可能;高度有偏的二元分類問(wèn)題保證很容易定義大量視覺(jué)屬性,且這些視覺(jué)屬性都只作用于特征空間的一個(gè)局部,為產(chǎn)生稀疏表示提供堅(jiān)實(shí)的基礎(chǔ)。實(shí)驗(yàn)驗(yàn)證了非線性表示可以顯著提高表示的性能。
  本文通過(guò)前兩點(diǎn)的工作,提供了一種快速建立高性能稀疏表示的完整方案,對(duì)于當(dāng)前大規(guī)模圖像檢索的系統(tǒng)瓶頸問(wèn)題給出了有效

9、的改進(jìn),保證大規(guī)模圖像檢索系統(tǒng)快速可以產(chǎn)生更高性能的高維稀疏表示。
  本文的后兩點(diǎn)工作,從線性表示和非線性表示角度,對(duì)于視覺(jué)屬性和一般圖像中層表示問(wèn)題進(jìn)行了系統(tǒng)地研究。本文提出的快速產(chǎn)生線性表示的方法、產(chǎn)生高性能非線性表示的方案,為后續(xù)的視覺(jué)屬性和高性能中層表示研究提供了堅(jiān)實(shí)的基礎(chǔ)。特別是本文最后給出的非線性中層表示,該方案容易得到稀疏表示,具有應(yīng)用到大規(guī)模圖像檢索系統(tǒng)中解決同類物體檢索問(wèn)題的潛力。
  本文的研究表明,從

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論