基于圖像識別技術的汽車衡檢定數據自動化處理系統的設計
本文旨在通過攝像裝置對汽車衡的數字稱重顯示器中所顯示的稱重結果進行拍攝,將拍攝結果自動截圖成數字圖像,并以數字圖像處理、模式識別、計算機視覺等技術為基礎,將得到的每一張數字圖像進行分析、識別后轉換成文本格式錄入到軟件中,并根據檢定規程要求進行一系列運算得到最終結果,自動完成原始記錄的運算、生成和保存等一系列操作。整個過程計算機自動處理,排除人為干預,從而進一步提高檢定效率和數據處理的正確率。
1.概述
汽車衡采用現代傳感器技術、電子技術和計算機技術一體化的電子稱量裝置,是國家重點管理的強制檢定計量器具,根據其自身特點一般可以分為電子秤、電子天平等類型,其檢定依據一般是按照JJG 539-1997《數字指示秤》和JJG1036-2008《電子天平》進行的。然而這兩個規程中所規定的檢定項目以及數據的處理都相當復雜,檢定過程中70%的時間耗費在數據處理上,完整檢定一臺汽車衡至少需要耗費30分鐘以上時間,我們可以清晰地看到目前檢定汽車衡一直存在著兩個問題:一是檢定效率低,尤其是面對農貿市場量大面廣的電子計價秤,其現場檢定更加需要檢定員快速、精準的反應;其次是數據處理往往一不小心就容易出現錯誤,時常陷入“一子錯滿盤皆輸”的尷尬境地,現場檢定實用性不高,時常受人以詬病。因此,很多專家學者一直在追求一種能夠自動檢定的裝置來滿足檢定規程的要求,有的利用的傳感器讀取數據、有的根據RS232接口獲取稱量結果等,但由于其操作復雜性、數據讀取格式的不一致性等一系列問題,最終無法真正實現自動化檢定的實物裝置,更何況全自動檢定對于電子秤來說自動加載砝碼,尤其是感應砝碼相對來說不易實現,而對于電子天平來說其高準確度等級的砝碼的加載更加成為自動化檢定裝置的障礙.
小編結合日常的檢定工作,設計了一款半自動的檢定裝置,所謂半自動檢定,即檢定時砝碼
的取與放由檢定員來操作,顯示裝置中的稱量結果由攝像頭等裝置獲取并自動錄入到計算機,根據圖像處理技術對獲取的結果進行自動識別,從而將結果自動保存到原始記錄中進行自動化運算,得到最終的檢定結果,具體思路架構如圖1所示。
2.圖像識別系統設計
2.1圖像識別開發基本流程
本系統中最關鍵的技術是圖像識別系統,所謂圖像識別就是指利用計算機或其他數字設備對圖像信息進行各種加工和處理,抽取輸入樣本的模式表達形式與預先存儲在計算機中標準樣本的模式表達形式進行逐一比對,用一定的準則進行判斷,找出最接近輸入樣本表達形式進行匹配其識別過程主要包括圖像采集、圖像預處理特征提取模式匹配四個環節,一個典型的識別過程如圖2所示.
2.2圖像采集
本系統第一步需要用圖像采集設備對電子衡器的顯示結果進行攝取并錄入到系統軟件中進行后續處理,由于輸入的只是簡單的一副圖像,目前市場上的攝像頭基本能夠滿足要求。
2.3圖像預處理
含有復雜的顯示裝置背景和自然背景,同時在衡器檢定過程中易受現場的照明條件。油污以及錄入的圖像傾斜等因素的影響,嚴重影響獲取圖像的質量,給之后的識別過程帶來很大的障礙,因此在開始處理前需要進行圖像變換、復原和校正去噪等一系列預處理來消除對圖像的影響。預處理是圖像自動識別系統中非常重要的一步,它的好壞直接影響圖像識別的效果。預處理的目的是去除圖像中的噪聲,把它變成一幅清晰的點線圖,以便于提取正確的圖像特征,主要包括灰度化二值化和數字分割等。
2.3.1圖像的灰度化
用攝像頭攝錄得到的圖像是24位真彩圖像,又稱為RGB圖像。,其存儲量要求很大,而且在進行圖像處理時,計算量也隨之增加,不便于圖像的識別處理,所以在圖像預處理過程中,要對圖像進行灰度化,將彩色的圖像轉換為灰度圖像的過程叫做灰度化,由于彩色圖像每個像素的顏色由R、G、B三個分量組成,統稱為顏色空間模型如果一幅圖像的顏色空間是一維的(一個顏色值只有一個顏色分量),則這幅圖像就是一副灰度圖,在位圖圖像中,一般以R=B=G來顯示灰度圖像,那么如何來確定R、G、B三個分量的值使接下來的圖像處理更為方便、快捷和穩定呢?根據經驗,圖像的灰度化往往采用加權平均值法
2.3.2圖像的二值化
圖像經過灰度化處理后,所產生的灰度圖像是由256個灰度級別組成的灰度圖像,具有較為豐富的明暗度,但在搜索目標對象時,背景像素容易干擾,如圖4所示的灰度圖像中背景色仍然具有較大的噪點,極易影響后期圖像識別的質量,因此要進行二值化,二值化是對圖像進一步進行壓縮,我們采用固定閥值,把灰度設置成0或255,,這樣一來就把這個灰度級減少到1位2個灰度級,使圖片只有前景和背景信息,就得到一副二值圖,可以簡單的將圖片定義前景為白色,背景為黑色,那么二值圖像中的數據全部是0或1,運行效果如圖5、如圖6所示。
2.3.3數字圖片分割并存儲
二值化后得到的圖像仍然是一個整體,包括數字和數字之間的空白,我們需要從中分離出每個數字以便進行后續的單個數字的識別。圖像分割技術一般采用的是邊緣檢測法,圖像的邊緣是圖像的最基本特征,邊緣點是指圖像中周圍像素灰度有階梯變化的那些像素點,即灰度數導數較大或極大的地方,根據這個原理我們可以對圖片進行分割,并將分割好的圖片存儲在計算機中。
2.4數字圖片識別
數字圖片識別就是把處理后的圖片還原回字符文本的過程,包括特征提取和模式匹配等操作
常用做法是:先獲取該數字圖片的特征碼,然后使用各種分類算法對該特征碼進行分類,將其打上相應的類標簽、分類模型的訓練,是對字符庫中的每個字符進行特征化處理,得到每個字符的特征碼,該字符的標簽就是該字符本身,利用特征碼加上字符的標簽對字符庫中的所有數據進行訓練,得到相應的分類模型。當然,得到了待識別字符的特征碼后,也可以使用相似性度量和字符庫中的字符的特征碼進行比較,將該字符識別為與其特征碼相似性最高的字符。在每個字符的邊界內,按行(或列)掃描該圖片,檢測其中的每個像素點,如果像素為白色則為,如果像素為黑色則為1,將這些0和1連起來組成的字符串就構成了該字符圖片的特征碼。將最終得到的特征碼與我們預先設置好的特征庫內的特征碼進行逐一比對,如果匹配成功則返回正確的結果。
2.5騰訊優圖開放平臺簡介
本系統是利用騰訊公司現成的優圖OCR識別技術進行圖片識別的,騰訊優圖是一個開放的平臺,具有人臉識別、圖片識別等集成功能,我們采用了該平臺的OCR識別技術,即利用光學字符識別技術,將圖片上的文字內容,直接轉換為可編輯文本,該平臺集成了圖像灰度處理、二值化數字分割和存儲、數字圖片識別等一系列功能,能夠將本系統所需功能整合實現,并且優圖OCR識別技術支持數字識別和超過7000個常用漢字的識別,在內部測試集上,單字識別準確率可達到中文98%以上,數字99%以上。現有身份證、名片、營業執照識別的全流程解決方案,為用戶提供最方便快捷的證件信息錄入體驗,使用優圖技術,僅需輕輕一拍,即可自動完成證件信息識別錄入。該平臺首先具有高適用性,能夠自動檢測定位、版式分析、字符切分、文字識別、信息息校驗,優圖OCR識別技術技術涵蓋了整個證件檢測識別框架的所有核心算法。極高的文本行定位、字符切分準確率,支持橫向、豎向拍攝,可容忍透視畸變、光照不均、部分遮擋的情況,適應各種照片分辨率,具備非常高的復雜環境可用性,其次,是具有高穩定性,優圖身份證識別、名片識別營業執照識別服務已成功應用于微眾銀行、QQ廣點通等內部核心業務,接受過海量用戶和復雜場景的考驗,各項反饋良好,因此用于簡單的數字識別更加具有穩定性.
3.數據自動化處理系統的設計
一個最基本的數據自動化處理系統即為一個簡易的計量管理子系統,主要包括:用戶管理、企業管理、器具管理、原始記錄管理、檢定報告管理和統計報表等功能,其基本框架如圖7所示.
本文僅討論跟數據處理有關的原始記錄錄入模塊,其余模塊不在此贅述.根據上述原理設計處理的數字識別系統如圖8所示。
圖8中,界面最左邊是攝像頭時時攝錄情況中間有兩個按鈕分別是識別與截圖識別,右邊最上面是一個標簽,顯示識別后的文本數據,下面是一個復制到粘貼板并插入按鈕,下面來介紹具體功能。
(1)最左邊是攝像頭,它具體負責在檢定時對檢定數據的攝取,其攝取的質量好壞直接影響著后續的文字識別,因此攝像頭的質量、像素以及擺放和錄制都是相當重要的,應盡可能攝取我們所需要的信息。
(2)識別、按鈕,當按下此按鈕時,系統將進行文字識別,識別后的內容會顯示在右邊上方的標簽欄中,如圖9所示。
(3)但往往我們所攝錄的攝像頭沒有像上圖那樣目標明確,我們實際中往往得到的是顯示裝置連帶背景的非標準圖像,如圖10所示。因此我們就要用到截圖識別這項功能。
當遇到圖10所示情況時,我們就要用到截圖識別這項功能了,該功能類似于的截圖功能,就是將我們所需要的部分截圖并識別之,點擊截圖識別,然后將鼠標放置到需要截圖的起始點按住鼠標左鍵拖動到圖片的結束點后松掉左鍵,如圖11所示。
按照上述方法松掉左鍵后系統就自動進行文字識別,其結果如圖12所示。
(4))復制到粘貼板并插入按鈕就是將識別未識別后數字文本復制到電腦的粘貼板上方便用戶使用,并且具有直接插入粘貼到系統文本框中的功能如圖13所示。,將攝像頭對準電子秤攝錄,然后按截圖識別按鈕對視頻中的稱重結果處進行截圖,這樣一來就會在右邊標簽處顯示,若識別成功便點擊復制到粘貼板并插入按鈕直接輸入到系統軟件中,若識別不成功,則調整攝像頭繼續進行識別,直到識別成功為止。
4.結論
用圖像識別技術進行地磅的檢定大大提高了檢定效率,時間縮短了三分之二以上,并且
用計算機進行數據處理更加提高了原始記錄計算的正確率。由于筆者經驗有限,只是簡單將汽車衡檢定與計算機技術相結合,希望上述思路方法能夠起到拋磚引玉的作用,讓更多的從業者提出更加科學合理的建議,進一步提高汽車衡檢定的工作效率工作質量,為營造一個更加科學更加合理公平公正的的環境而努力。