車牌號碼中表達的資訊??

車牌號碼中表達的資訊是什麼?車牌號是就是車輛的身份證,比如贛A—22158中的"贛"代表省份,字母A代表所在城市,而後面的數字就是車輛的編號。no汽車牌照識別是基於圖像分割和圖像識別理論,對含有汽車牌照的圖像進行分析處理,從而確定汽車牌照在圖像中的位置,並進一步提取和識別出文本字元。從不同車牌圖像中分割出的字元圖像各式各樣,尺寸變化範圍大,增加了識別的難度。儘管可以採用圖像變換方法將分割出的所有字元圖像歸一化為相同尺寸,但歸一化過程又不可避免地丟失有用的字元資訊,造成圖像失真,無助於提高識別準確率,並且浪費時間,降低了識別速度。

本文通過分析汽車牌照的特點,提出了一種利用字元的筆劃特徵和結構知識對汽車牌照中的字母和數位進行識別的方法。試驗表明,該方法識別速度快、準確率高,不受字元圖像大小影響,適應性強。

1車牌字元結構和識別

中國大陸汽車牌照中使用的字元包括59個漢字、25個英文字母(字母I不用)和10個阿拉伯數字三種類型共94個,且都是印刷體,結構固定、筆劃規範。圖1是車牌號碼中使用的全部字母和數位的圖像。這些字元的結構在水準方向有三種類型:左右對稱、左大右孝左小右大。在豎直方向同樣有三種結構,即上下對稱、上大下孝上小下大。如車牌號碼中使用的數位"8",就屬於左右對稱且上下對稱。

從圖1可以看出,全部字母和數位的筆劃共有兩大類:直筆劃和弧筆劃。直筆劃又可分為橫筆劃、豎筆劃、左斜筆劃(相當於漢字筆劃中的"撇")和右斜筆劃(相當於漢字筆劃中的"捺")。弧筆劃是一條曲線段,本文將其分為兩類:開弧筆劃和閉弧筆劃。所謂開弧筆劃,指該弧筆劃沒有形成封閉環,如字母"C"。而閉弧筆劃則形成一個封閉的環,如數字"0"。






根據字元圖像的這一特點,本文採用下述方法對字母和數位進行逐級分類,形成一棵識別決策樹,每個字元就是一個葉子:

(1)首先在待識別的字元圖像中搜索封閉環的數量和位置。

(2)根據搜索到封閉環的結果判斷字元所在的類封閉環字元類、雙封閉環字元類、無封閉環字元類。 (3)針對每一類分別進行處理。

(4)雙封閉環字元只有"8"和"B",因此只要抽取豎筆劃即可區分出這兩個字元。"B"的左半部分有一長豎,而"8"沒有。

(5)單封閉環的字元有"A"、"D"、"O"、"P"、"Q"、"R"、"0"、"4"、"6"和"9"。根據封閉環的位置將這些字元分成三類:封閉環在上部;封閉環在下部和封閉環在中間,然後再根據結構特點和抽取的筆劃特徵進行識別。

.封閉環在上部的字元有"P"、"R"和"9"。如果待識別字元圖像上半部分有一個封閉環,則從左半部分抽取豎筆劃;若左側部分沒有豎筆劃,則該字元為"9";若在左半部分抽取到豎筆劃,繼續抽取右斜筆劃;抽取到右斜筆劃,該字元為"R";否則為"P"。

.封閉環在下部的字元有"A"、"4"和"6"。如果待識別字元圖像下半部分有一個封閉環,則從右半部分抽取豎筆劃;若右側部分有豎筆劃,則該字元為"4";若在右半部分沒有抽取到豎筆劃,繼續抽取橫筆劃;抽取到橫筆劃,該字元為"A";否則為"6"。

.封閉環在中間的字元有"D"、"O"、"Q"和"0"。實際應用中,"O"和"0"的圖像完全相同,可以作為同一個字元處理。如果待識別字元圖像中間有一個封閉環,則首先利用上下對稱特點判斷是否為"Q";若上下對稱,則為"0"("O")或"D";然後按照左右對稱特徵區分字元"0"和"D"。

(6)無封閉環的字元有"C"、"E"、"F"、"C"、"H"、"J"、"K"、"L"、"M"、"N"、"S"、"T"、"U"、"V"、"W"、"X"、"Y"、"Z"、"l"、"2"、"3"、"5"和"7",通過抽取筆劃對這些字元進行識別,具體步驟如下:

· 抽取橫筆劃和豎筆劃。

· 若待識別字元圖像沒有橫筆劃和豎筆劃,則該字元為"S"、"V"或"X"。

· 若待識別字元圖像只有橫筆劃而沒有豎筆劃,則該字元為"2"、"3"、"7"或"Z"。

· 若待識別字元圖像只有豎筆劃而沒有橫筆劃,則該字元為"1"、"C"、"J"、"K"、"M"、"N"、"U"、"W''或"Y"。

· 待識別字元圖像既有橫筆劃又有豎筆劃的字元為"5"、"E"、"F"、"C"、"H"、"l"或"T"。

."S"、"V"和"X"的識別。抽取左斜筆劃和右斜筆劃,"S"沒有這兩種筆劃,從而可識別出"S"。"X"的兩條斜筆劃交點位於字元圖像的中間位置,而"V"的兩條斜筆劃相交於字元圖像的下部,以此識別"X"和"V"。

· 識別2"、"3"、"7"和"Z"。這四個字元中只有"Z"有兩條橫筆劃,從而可以此識別出"Z"。"3"和"7"的橫筆劃都位於上部,而"2"的橫筆劃位於下部,這樣又可以識別出"2"。對於"3"和"7",利用左斜筆劃進行識別。"7"具有左斜筆劃,而"3"沒有。

·識別"1"、"C"、"J"、"K"、"M"、"N"、"U"、"W"和"Y"。根據豎筆劃的數量將這些字元分為三類,"1"、 "C"、"J"、"K"和"Y"都是一條豎筆劃、"M"、"N"和"U"是兩條豎筆劃,而"W"有三條豎筆劃,這樣就完成了"W"的識別。

對於一條豎筆劃的字元,判斷該筆劃的位置是在左邊("C"和"K")、中間("1"和"Y")還是在右邊("J"),即可識別出"廠。根據有無右斜筆劃區分"C"和"K",按照中間豎筆劃的長短區分"1"和"Y"。

.由於字元"N"有一右斜筆劃,以此將其從"M"和"U"中識別出來。對於"M"和"U",依靠結構特徵已無法識別,本文使用字元圖像中前景圖元個數與背景圖元個數的比值來判斷。根據這兩個字元的特點,只計算字元上半部分即可。 · 識別"5"、"E"、"F"、"G"、"H"、"I"和"T"。這些字元中,只有"E"具有三條橫筆劃,"F"有兩條橫筆劃,其餘為一條橫筆劃。剩下的字元中,按照豎筆劃的數量分為兩組: "5"、"L"和"T"為一條豎筆劃,"G"和"H"為兩條豎筆劃。"H"的兩條豎筆劃長度相同,而"G"的兩條豎筆劃則一長一短,這是區分"G"和"H"的標誌。"T"的豎筆劃在中間,"5"和"L"的豎筆劃在左邊。"L"的豎筆劃長,"5"的豎筆劃短,這樣就完成了"5"、"T"和"L"的識別。

搜索封閉環實際上就是在字元圖像中搜索連通域。在字元的二值圖像中,假定字元圖元值"1",背景圖元值為"0",則:






(1)無封閉環的字元圖像中只有兩個連通域,即字元連通域和背景連通域,圖2(a)中的B和F。

(2)只有一個封閉環的字元圖像中有三個連通域,即一個字元連通域和兩個背景連通域,圖2(c)中的B1、B2和F。

(3)有兩個封閉環的字元圖像中有四個連通域,即一個字元連通域和三個背景連通域,圖2(b)中的B1she、B2、B3和F。

搜索封閉環的演算法如下:

(1)讀入二值字元圖像。

(2)找到一個圖元值為"0"的背景圖元點B。

(3)搜索B的連通域,並將該連通域內的圖元全部標記為背景1。

(4)遍歷圖像中圖元值為"0"的圖元。

(5)若所有"0"圖元都已標記為背景1,則該圖像內封閉環個數為0,跳轉到(11)。

(6)若存在沒有標記為背景1的"0"圖元點B1,則有封閉環。

(7)搜索B1的連通域,並將該連通域內的圖元全部標記為背景2。

(8)遍歷圖像中圖元值為"0"的圖元。

(9)若所有"0"圖元都已標記為背景1或背景2該圖像內封閉環個數為1,跳轉到(11)。

(10)若存在沒有標記為背景1或背景2的"0"圖元,則該圖像內封閉環個數為2。

(11)結束搜索,返回封閉環個數。

字元的筆劃抽取可參見文獻[1]

2識別測試

利用本識別方法,筆者對從車牌中分割出的字元進行了識別測試。所測試的字元包括了車牌中所使用的全部35個數位和字母共7000幅圖像,其中圖幅最大的為l00xl00圖元,而最小的是20x20圖元。正確識別的有6946幅,正確率超過99%。其中識別錯誤的圖像主要集中在字母"0"和"D"。通過對這些容易識別錯誤的字元進行二次識別,可以大大提高識別準確率

本文提出的字元識別方法的核心就是通過決策樹對字元群體層層分類,從樹幹開始逐步縮小識別範圍,直到最後只有一類字元,即識別成功。

該方法具有如下特點:

(1)不需要建立識別樣本庫,完全依據字元自身的結構特徵進行逼近識別。
(2)不需要將待識別字元與全部字元進行匹配識別,因而提高了識別速度和準確率。

更多文章