

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、<p><b> 畢業(yè)設(shè)計文獻綜述</b></p><p><b> 計算機科學(xué)與技術(shù)</b></p><p> 手寫數(shù)字識別技術(shù)研究</p><p><b> 一、前言部分</b></p><p> 手寫數(shù)字識別(Handwritten Numeral R
2、ecognition)是光學(xué)字符識別技術(shù)(Optical Character Recognition,簡稱OCR)的一個分支,它研究的對象是:如何利用電子計算機自動辨認人手寫在紙張上的阿拉伯?dāng)?shù)字。</p><p> OCR是模式識別的一個分支,按字體分類主要分為印刷體識別和手寫體識別兩大類.而手寫體識別又可分為受限手寫體和不受限識別體,按識別方式有課分為在線識別和脫機識別。在整個OCR領(lǐng)域中,最為困難的就是脫機
3、手寫字符的識別。到目前為止,盡管人們在脫機手寫英文,漢字識別的研究中已取得很多可喜成就,但距實用還有一定距離。而在手寫數(shù)字識別這個方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動輸入提供了一種解決方案。</p><p> 字符識別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國家,各民族的文字(如:漢字,英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機手寫方面技術(shù)已
4、趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號組成的各種編號和統(tǒng)計數(shù)據(jù),如:郵政編碼,統(tǒng)計報表,財務(wù)報表,銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識別。因此,手寫數(shù)字的識別研究有著重大的現(xiàn)實意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會和經(jīng)濟效益。[1][2][15]</p><p><b> 二、主題部分</b></p><p
5、> (一).手寫數(shù)字識別研究的理論意義</p><p> 手寫數(shù)字識別作為模式識別領(lǐng)域的一個重要問題,也有著重要的理論價值:</p><p> 1.阿拉伯?dāng)?shù)字是唯一的被世界各國通用的符號,對手寫數(shù)字識別的研究基本上與文化背景無關(guān),這樣就為各國,各地區(qū)的研究工作者提供了一個施展才智的大舞臺。在這一領(lǐng)域大家可以探討,比較各種研究方法。</p><p> 2
6、.由于數(shù)字識別的類別數(shù)較小,有助于做深入分析及驗證一些新的理論。</p><p> 3.盡管人們對手寫數(shù)字的識別已從事了很長時間的研究,并已取得了很多成果,但到目前為止機器的識別本領(lǐng)還無法與人的認知能力相比,這仍是一個有難度的開放問題(Open problem)。</p><p> 4.手寫數(shù)字的識別方法很容易推廣到其它一些相關(guān)問題,很多學(xué)者就是把數(shù)字和英文字母的識別放在一塊兒研究的。
7、[1][2]</p><p> ?。ǘ┦謱憯?shù)字識別方法與研究難度</p><p> 手寫數(shù)字識別在學(xué)科上屬于模式識別和人工智能的范疇。在過去的四十年中,人們想出了很多辦法獲取手寫字符的關(guān)鍵特征。這些手段分兩大類:全局分析和結(jié)構(gòu)分析。對前者,我們可以使用模板匹配,象素密度,矩,特征點,數(shù)學(xué)變換等技術(shù)。這類的特征常常和統(tǒng)計分類方法一起使用。對后者,多半需要從字符的輪廓或骨架上提取字符形狀的
8、基本特征,包括:圈,端點,節(jié)點,弧,突起,凹陷,筆畫等等。與這些結(jié)構(gòu)特征配合使用的往往是句法的分類方法.。多年的研究實踐表明,對于完全沒有限制的手寫數(shù)字,幾乎可以肯定:沒有一種簡單的方案能達到很高的識別率和識別精度。因此,最近這方面的努力向著更為成熟,復(fù)雜,綜合的方向發(fā)展。一方面,研究工作者努力把新的知識運用到預(yù)處理,特征提取,分類當(dāng)中,如:神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)形態(tài)學(xué)等。我認為,在手寫數(shù)字識別的研究中,神經(jīng)網(wǎng)絡(luò)技術(shù)和多種方法的綜合是值得重視的
9、方向.</p><p> 雖然數(shù)字的類別只有十種,筆劃又簡單,其識別問題似乎不是很困難。但事實上,一些測試結(jié)果表明,數(shù)字的正確識別率并不如印刷體漢字識別正確率高,甚至也不如聯(lián)機手寫體漢字識別率高,而只僅僅優(yōu)于脫機手寫體漢字識別。這其中主要原因是:第一,不同數(shù)字之間字形相差不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難;第二,數(shù)字雖然只有十種,而且筆劃簡單,但同一數(shù)字寫法千差萬別,全世界各個國家各個地區(qū)的人都用,其書寫上帶有
10、明顯的區(qū)域特性,很難完全做到兼顧世界各種寫法的極高識別率的通用性數(shù)字識別系統(tǒng)。另外,在實際應(yīng)用中,對數(shù)字識別單字識別正確率的要求要比文字要苛刻得多。這是因為,數(shù)字沒有上下文關(guān)系,每個單字的識別都事關(guān)重要,而且數(shù)字識別經(jīng)常涉及的財會,金融領(lǐng)域其嚴格性更是不言而喻的。因此,用戶的要求不是單純的高正確率,更重要的是極低的,千分之一甚至萬分之一以下的誤識率。此外,大批量數(shù)據(jù)處理對系統(tǒng)速度又有相當(dāng)?shù)囊?許多理論上很完美但速度過低的方法是行不通的
11、。因此,研究高性能的手寫數(shù)字識別算法是一個有相當(dāng)?shù)奶魬?zhàn)性的任務(wù)。[1][2][3][7][8]</p><p> (三)學(xué)習(xí)和測試樣本庫的選擇</p><p> 如前一部分提到的,手寫數(shù)字的寫法帶有明顯的地區(qū)性和民族性,因而選擇一個可供系統(tǒng)訓(xùn)練和測試使用的樣本庫是手寫數(shù)字識別研究的重要基礎(chǔ)之一,對識別系統(tǒng)的性能也有重要的影響。研究者對所需的樣本庫有兩種選擇:一是自己根據(jù)需要建立專門的樣
12、本庫,二是選用其它機構(gòu)做好的現(xiàn)成的樣本庫。前者的優(yōu)點是帖近自己的應(yīng)用,缺點也是明顯的:要費相當(dāng)?shù)木η掖硇院茈y保證,與其它人的結(jié)果不好比較。因此,現(xiàn)在的趨勢是使用有權(quán)威性的通用樣本庫。目前,比較有代表性的,樣本數(shù)量較大的手寫數(shù)字樣本庫有:</p><p> 1.NIST數(shù)據(jù)庫,由美國國家標(biāo)準(zhǔn)與技術(shù)局收集;</p><p> 2.CEDAR數(shù)據(jù)庫,是由紐約州立大學(xué)Buffalo分校計算
13、機科學(xué)系文本分析與識別中完成的郵政編碼的樣本庫;</p><p> 3.ETL數(shù)據(jù)庫,由日本電工技術(shù)研究所收集;</p><p> 4.ITPT數(shù)據(jù)庫,由日本郵電通信政策研究所收集。[2][3]</p><p> (四)識別系統(tǒng)性能的評價</p><p> 作為一個識別系統(tǒng),我們最終要用某些參數(shù)來評價其性能的高低,手寫數(shù)字識別也不例外
14、。評價的指標(biāo)除了借用一般文字識別里的通常做法外,還要根據(jù)數(shù)字識別的特點進行修改和補充。</p><p> 對一個手寫數(shù)字識別系統(tǒng),可以用三方面的指標(biāo)表征系統(tǒng)的性能:</p><p><b> *正確識別率</b></p><p> A=正確識別樣本數(shù)/全部樣本數(shù)*100%</p><p><b> *替
15、代率(誤識率)</b></p><p> S=誤識樣本數(shù)/全部樣本數(shù)*100%</p><p><b> *拒識率</b></p><p> R=拒識樣本數(shù)/全部樣本數(shù)*100%</p><p> 三者的關(guān)系是:A+S+R=100%</p><p> 數(shù)字識別的應(yīng)用中,人們往
16、往很關(guān)心的一個指標(biāo)是"識別精度",即:在所有識別的字符中,除去拒識字符,正確識別的比例有多大,我們定義:</p><p> 識別精度P=A/(A+S)*100%.</p><p> 一個理想的系統(tǒng)應(yīng)是R,S盡量小,而P,A盡可能大。而在一個實際系統(tǒng)中,S,R是相互制約的,拒識率R的提高總伴隨著誤識率S的下降,與此同時識別率A和識別精度P的提高。因此,在評價手寫數(shù)字識
17、別系統(tǒng)系統(tǒng)時,我們必須綜合考慮這幾個指標(biāo)。另外,由于手寫數(shù)字的書寫風(fēng)格,工整程度可以有相當(dāng)大的差別,因此必須弄清一個指標(biāo)在怎樣的樣本集合下獲得的。</p><p> 以上多種因素使得不同系統(tǒng)的性能很難做絕對比較,根據(jù)我從文獻中所看到的和在科研實踐中的體會,可以認為目前手寫數(shù)字識別研究的較高水平是:對自由書寫的數(shù)字,在不拒識時達到96%以上的識別率;在拒識少于15%的樣本時,誤識率能降到0.1%以下。[4][5]
18、[6][13][14]</p><p> ?。ㄎ澹┦謱憯?shù)字識別的應(yīng)用</p><p> 手寫數(shù)字識別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國的研究工作者重視的一個主要原因。下面將介紹基于手寫數(shù)字識別的應(yīng)用系統(tǒng)的特殊要求,以及一些以手寫數(shù)字識別技術(shù)為基礎(chǔ)的典型應(yīng)用。</p><p> 1.基于手寫數(shù)字識別的應(yīng)用系統(tǒng)的特殊要求:</p><
19、p> 盡管手寫數(shù)字識別與一般的文本(如:漢字,英文等)識別同屬于光學(xué)字符識別(OCR)的大范疇,從應(yīng)用的角度出發(fā),手寫數(shù)字識別應(yīng)用系統(tǒng)有很多特殊的要求:識別精度要達到很高的水平:</p><p> (1)識別精度要達到很高的水平:在一般的文本識別中,信息的冗余較大,有充分的上下文信息,因而對識別的精度要求不是十分高,達到98%-99%就足夠了。而在數(shù)字識別中,由于沒有上下文關(guān)系,數(shù)據(jù)中的每一位數(shù)字都至關(guān)
20、重要(試想:在財務(wù)報表中,把40,000元認成90,000元,從字符識別的角度僅認錯了一個數(shù)字,但對用戶而言,這是一個絕對不能容許的錯誤)。一般來說,這類實用系統(tǒng)的精度至少應(yīng)在99.9%以上。前面已經(jīng)提到,高性能的自由手寫數(shù)字識別是一個很困難的問題,至今為止還沒有什么方法能與人的辨識能力相比,那么在目前的技術(shù)水平下,如何滿足高精度的要求呢?</p><p> ?、僖髸鴮懻哂靡?guī)定的字型認真填寫,避免使用某些容易造
21、成混淆的變體。這個限制對用戶可能是很不方便的,因為這意味著書寫速度的降低和書寫習(xí)慣的改變,但從整體上,系統(tǒng)的識別水平將有大幅度的提高,能很大程度上提高系統(tǒng)的運行效率。</p><p> ?、谔岣呔茏R率.通過提高拒識率就可以減低誤識率,直到達到指定的精度要求。當(dāng)然,拒識的增多意味著操作人員的介入的增加,這對用戶是極為不利的。</p><p> ?、奂尤脒壿嬓r?在通信系統(tǒng)中,人們常通過加校驗
22、碼來保證數(shù)據(jù)的高質(zhì)量傳輸,常見的校驗碼有:奇偶校驗,漢明碼等。在基于手寫數(shù)字的應(yīng)用系統(tǒng)中,我們也可以采用類似的方法。不過,這時校驗方式應(yīng)盡量簡單,直觀,利于填寫人快速算出。對處理速度也有很高的要求:。</p><p> ?。?)對處理速度也有很高的要求:數(shù)字識別面對的都是極其大量的數(shù)據(jù)報表,一般都要求達到每分鐘幾頁到幾十頁的處理能力(包括掃描到完成識別的全過程)。而眾所周知,處理速度與處理精度是一對矛盾,現(xiàn)在既要
23、達到前面提到的高識別精度,又要有如此之高的速度,無疑增加了系統(tǒng)的設(shè)計難度。不過近年來,硬件水平提高很快,目前市場上已有較低價格,每分鐘可掃描10-20頁的高性能掃描儀;微機的運算速度更是飛快提高。這些都為高的處理速度奠定了堅實的基礎(chǔ)。</p><p> (3)要能批量自動作業(yè).在一般的文本識別中,多是操作者一頁頁地送入文本,手工幫助機器進行版面分割(機器的自動分割能力往往是十分有限的)后再開始識別,很難保證高質(zhì)
24、量的批量自動識別。而在數(shù)字識別系統(tǒng)中這是一個必須做到且應(yīng)能做到的基本要求。原因如下:</p><p> ?、偃绻宽摰奶幚矶家耸止椭瓿?系統(tǒng)的綜合處理速度無法達到要求;</p><p> ?、趻呙鑳x的自動進紙(ADF-Automatic Document Feeding)技術(shù)已十分成熟;</p><p> ?、厶幚淼膶ο笤诤芏嗲闆r下是版面完全相同的大批表格,很
25、容易作到欄目的自動提取.要有便于批量快速校對修改的手段.</p><p> (4)要有便于批量快速校對修改的手段.[5][6][9][10][11]</p><p> 手寫數(shù)字識別在大規(guī)模數(shù)據(jù)統(tǒng)計中的應(yīng)用:</p><p> 在大規(guī)模的數(shù)據(jù)統(tǒng)計(如:行業(yè)年檢,人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入,則需要耗費大量的人力和物力。近年來在這類工作中
26、采用OCR技術(shù)已成為一種趨勢。因為在這種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所以往往可以通過專門設(shè)計表格和對書寫施加限制以便于機器的自動識別。目前國內(nèi)的大多數(shù)實用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對識別結(jié)果做全面的檢查,最終保證結(jié)果正確無誤??梢钥闯?這是一類相對容易的應(yīng)用,對識別核心算法的要求比較低,是目前國內(nèi)很多單位應(yīng)用開發(fā)的熱點。[1][3]</p><p> 手寫數(shù)字
27、識別在財務(wù),稅務(wù),金融領(lǐng)域中的應(yīng)用:</p><p> 財務(wù),稅務(wù),金融是手寫數(shù)字識別大有可為的又一領(lǐng)域。隨著世界經(jīng)濟的迅速發(fā)展,每天等待處理的財務(wù),稅務(wù)報表,支票,付款單等越來越多。如果能把它們用計算機自動處理,無疑可以節(jié)約大量的時間,金錢和勞力。與上面提到的統(tǒng)計報表處理相比,在這個領(lǐng)域的應(yīng)用難度更大,原因有:</p><p> ①對識別的精度要求更高;</p><
28、;p> ②處理的表格往往不止一種,一個系統(tǒng)應(yīng)能智能地同時處理若干種表格;</p><p> ?、塾捎谔幚碡灤┯谡麄€日常工作之中,書寫應(yīng)盡量按一般習(xí)慣(如:不對書寫者的寫法做限定,書寫時允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對識別及預(yù)處理的核心算法要求也提高了。[1][3][15]</p><p> 4.手寫數(shù)字識別在郵件分揀中的應(yīng)用:</p><p
29、> 隨著人們生活水平的提高,經(jīng)濟活動的發(fā)展,通信聯(lián)系的需求使郵件的互換量大幅度增加,我國郵件業(yè)務(wù)量也在不斷增長,預(yù)計到2000年,一些大城市的中心郵局每天處理量將高達幾百萬件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動化成為大勢所趨。在郵件的自動分揀中,手寫數(shù)字識別(OCR)往往與光學(xué)條碼識別(OBR---Optical Bar Reading),人工輔助識別等手段相結(jié)合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機的性能指標(biāo):O
30、CR拒分率30%,OCR分揀差錯率1.1%。[1][3]</p><p><b> 三、總結(jié)部分</b></p><p> 隨著世界信息化進程的加速,手寫數(shù)字識別已經(jīng)在系統(tǒng)控制、人工智能、生物醫(yī)學(xué)工程、遙感數(shù)據(jù)分析、軍事目標(biāo)識別等領(lǐng)域發(fā)揮了重要的作用,在國民經(jīng)濟、國防建設(shè)、社會發(fā)展和社會治安等方面得到廣泛的應(yīng)用。因此對于這方面的研究也應(yīng)該加強,以推動信息化的快速發(fā)
31、展。</p><p> 手寫數(shù)字識別的難點在于:第一,不同數(shù)字之間字形相差不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難;第二,數(shù)字雖然只有十種,而且筆劃簡單,但同一數(shù)字寫法千差萬別,所以使識別率和識別精度達不到要求。我認為,手寫數(shù)字識別應(yīng)用系統(tǒng)性能的關(guān)鍵與瓶頸仍然在于手寫數(shù)字識別核心算法的性能上,怎么解決手寫數(shù)字識別系統(tǒng)應(yīng)用中的難點,以改善核心算法,突破瓶頸是我們要首先考慮的問題,只有解決了難點,在核心算法上有了新的突破
32、,才能研究出零誤識率和底拒識率的高速識別算法,達到我們的最終目標(biāo)。</p><p><b> 四、參考文獻</b></p><p> [1] 曹丹等.手寫數(shù)字識別的研究進展[J].電腦知識與技術(shù).2009.03.</p><p> [2] 婁震等.自由手寫體數(shù)字識別研究[J].計算機學(xué)報.1999.10. </p><
33、p> [3] 張捷.手寫數(shù)字識別的研究與應(yīng)用[D]; 西安:西安建筑科技大學(xué);2004.</p><p> [4] 王鵬.基于神經(jīng)網(wǎng)絡(luò)的手寫體字符識別[D]. 北京:北京工業(yè)大學(xué)學(xué)報.2007.09. </p><p> [5] 王軍.基于模板匹配的聯(lián)機手寫數(shù)字識別[J].現(xiàn)代計算機(專業(yè)版).2008.</p><p> [6] 朱小燕等.基于反饋的
34、手寫體字符識別方法的研究[J].清華大學(xué)計算機科學(xué)與技術(shù)系.2002.05.</p><p> [7] 楊淑瑩等.圖像模式識別-VC++技術(shù)實現(xiàn)[M].北京:清華大學(xué)出版社.2005.</p><p> [8] 王愛玲等.MATLAB R2007圖像處理技術(shù)與應(yīng)用[M].北京:電子工業(yè)出版社.2008.</p><p> [9] 施少敏.基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字
35、識別方法[J].兵工自動化.2006.10.</p><p> [10] 付慶鈴等.基于人工神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別[J].北京工商大學(xué)學(xué)報.2004.122.</p><p> [11] 黃巧巧.基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別系統(tǒng)研究[D].華中師范大學(xué).2009.05.</p><p> [12] 王永亮.小波神經(jīng)網(wǎng)絡(luò)在手寫數(shù)字識別中研究與應(yīng)用[D].山東理
36、工職業(yè)學(xué)院.電腦編程技巧與維護.2010.14.</p><p> [13] Gonzalez,Wood.Digital Image Processing[M].Prentice Hall.2008.</p><p> [14] Richard O.Duda.Pattern Classification[M]. wiley-Interscience. 2000.</p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 手寫數(shù)字識別技術(shù)研究【畢業(yè)設(shè)計+開題報告+文獻綜述】
- 手寫數(shù)字識別技術(shù)研究【開題報告】
- 手寫數(shù)字識別技術(shù)研究【畢業(yè)設(shè)計】
- 手寫體數(shù)字識別技術(shù)研究.pdf
- 基于svm的手寫數(shù)字識別的應(yīng)用與實現(xiàn)【文獻綜述】
- 數(shù)字調(diào)制技術(shù)研究[文獻綜述]
- 基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別技術(shù)研究.pdf
- 手寫體數(shù)字識別中的關(guān)鍵技術(shù)研究.pdf
- 對等網(wǎng)絡(luò)流量識別技術(shù)研究綜述[文獻綜述]
- 離線手寫簽名識別技術(shù)研究.pdf
- 聯(lián)機手寫漢字識別技術(shù)研究.pdf
- 基于改進液體狀態(tài)機的手寫數(shù)字識別技術(shù)研究.pdf
- 基于SVM技術(shù)的手寫數(shù)字識別的研究.pdf
- 調(diào)制技術(shù)研究綜述【文獻綜述】
- 光電技術(shù)研究綜述【文獻綜述】
- 手寫體數(shù)字識別.pdf
- 指紋識別技術(shù)綜述【文獻綜述】
- 光學(xué)手寫數(shù)字字符識別技術(shù)的研究.pdf
- 基于ARM9的手寫體數(shù)字識別技術(shù)研究與實現(xiàn).pdf
- 票據(jù)中手寫數(shù)字識別的研究.pdf
評論
0/150
提交評論