前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺的基本技術(shù)范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

【關(guān)鍵詞】計算機 視覺 圖像處理 技術(shù)
一、引言
隨著計算機技術(shù)的不斷發(fā)展,在20世紀60年底產(chǎn)生了計算機視覺學(xué)這一學(xué)科。計算機視覺是借助計算機以及各種設(shè)備,進行生物視覺模擬的一種技術(shù)。計算機視覺學(xué)的主要任務(wù),是借助已掌握的圖片、視頻等資料,進行計算與處理,和人類及其他生物的視覺過程一樣,
得到相應(yīng)形式的三維數(shù)據(jù)信息。計算機視覺學(xué)的發(fā)展,在工業(yè)、農(nóng)業(yè)的生產(chǎn)中,地質(zhì)勘探、天文、醫(yī)學(xué)觀察等領(lǐng)域也有著重要的應(yīng)用價值。因此,視覺學(xué)的研究和應(yīng)用轉(zhuǎn)化受到了越來越多的重視。
二、計算機視覺學(xué)的圖像分割研究
(一)數(shù)據(jù)驅(qū)動的分割研究
在計算機視覺學(xué)應(yīng)用過程中,經(jīng)常進行的數(shù)據(jù)驅(qū)動分割有下面幾項內(nèi)容:第一種是邊緣檢測的分割、第二種是區(qū)域分割、第三種是邊緣和區(qū)域相互結(jié)合的分割。第一種基于邊緣檢測的分割,這種分割的基本方法:首先對檢測圖像的邊緣點進行檢測,然后根據(jù)一定的法則進行輪廓的連接,獲得分割的區(qū)域?;谶吘墮z測的分割其難點是邊緣檢測時如何處理好抗噪聲性能、檢測的精度之間的矛盾。所以,在研究的過程中,提出了多種多尺度邊緣檢測的方法,按照實際問題進行多尺度邊緣信息設(shè)計等方案,以獲得更為合適的抗噪性能和檢測的精度。第二種基于區(qū)域的分割,它的基本思想是按照圖像數(shù)據(jù)的特點,將整個圖像的空間劃分成為幾個不同的區(qū)域進行圖像處理。
(二)計算機視覺學(xué)模型驅(qū)動的分割
經(jīng)常使用的模型驅(qū)動分割有下面三種,第一種模型是基于動態(tài)輪廓的模型、第二種模型是組合優(yōu)化模型、第三種模型是目標幾何與統(tǒng)計模型。第一種是基于動態(tài)輪廓的模型用在進行分割目標的動態(tài)輪廓,因為其能量函數(shù)使用的是積分運算,有著很好的抗噪性能,對于目標的局部模糊也不敏感,所以其適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實輪廓。通過組合優(yōu)化的方法進行分割問題的處理,是使用一目標函數(shù)綜合表示分割的相關(guān)要求以及約束,把分割變?yōu)槟繕撕瘮?shù)的優(yōu)化求解。因為目標函數(shù)多數(shù)情況下作為多變量函數(shù)存在的,因此可以通過使用隨機優(yōu)化的方法來實現(xiàn)。
(三)計算機視覺學(xué)圖像分割的半自動方法
通過對人工參與程度的分,我們可以得出圖像分割,主要有三種類型即:人工圖像分割、半自動圖像分割、自動圖像分割等。人工圖像分割指的是操作者使用鼠標,將分割區(qū)域的輪廓進行勾畫的方法,人工圖像分割的缺點是費時費力,而且很容易就會受到一些主觀因素的影響,并且人工圖像分割的可重復(fù)性較差。自動圖像分割不需要借助人機交互就能完成,但是也很難實現(xiàn)同一批圖像處理的滿意分割效果。半自動分割這種形式指的是將人機交互同自動分割結(jié)合在一起,半自動分割可以實現(xiàn)對不同圖像與處理需求的適應(yīng),并且可以大大降低計算過程的復(fù)雜性。在計算機技術(shù)不斷發(fā)展的背景下,計算速度和容量有了大幅度的提升,計算機圖像處理及視覺應(yīng)用取得了豐碩的成果。
三、計算機視覺技術(shù)的分析
(一)以模型為研究對象的處理方法
在以模型世界作為研究對象的視覺學(xué)研究過程中,以Roberts的開創(chuàng)性工作作為一種標志,在他的工作過程中,引進了三維物體與二維物體成像的關(guān)系,使用較為簡單的邊緣特征提取、組合線段等手段和方法。他對三維關(guān)系的分析只是按照簡單的邊緣線段的約束關(guān)系,缺乏對人類或其他動物視覺系統(tǒng)感知三維空間關(guān)系的充分考慮。但是早期的這些研究工作,對計算機視覺學(xué)的研究和發(fā)展發(fā)揮了良好的促進意義,但是對于較為復(fù)雜的景物就不能夠奏效。
(二)以計算理論為主體的視覺模型
隨著計算機視覺研究的不斷深入,在二十世紀七十年代,計算機視覺技術(shù)的研究,開始向著更為理性的階段發(fā)展,主要表現(xiàn)在:不同本征特性的恢復(fù),恢復(fù)的內(nèi)容有三維形狀恢復(fù)、運動恢復(fù)、光源恢復(fù)等等。研究的出發(fā)點是光學(xué)、生理學(xué)以及射影幾何的視角出發(fā),對成像及其逆等問題進行研究。在這個過程中,一些學(xué)者提出了以表示作為核心、通過算法作為中間轉(zhuǎn)換過程的視覺處理模型,例如:著名的計算機視覺學(xué)研究者Marr就提出了這些觀點,在他的理論里面,對表示的重要意義進行強調(diào),并且從不同層面上對信息處理問題進行了研究。
(三)計算機視覺的應(yīng)用研究
在現(xiàn)實生活和生產(chǎn)的過程中,計算機視覺主要應(yīng)用在照片資料、視頻資料處理上,例如:航空照片的處理、衛(wèi)星照片的編譯、醫(yī)學(xué)領(lǐng)域的輔診斷、移動機器人視覺導(dǎo)航等等。其中,工業(yè)機器人手眼系統(tǒng)的研發(fā),成為計算機視覺應(yīng)用最具代表性的成果之一。因為工業(yè)生產(chǎn)、施工等現(xiàn)場等因素具有一定的復(fù)雜性,這種環(huán)境下的光照、成像特點等等可以控制,這就使得計算機視覺的應(yīng)用更為簡單,對于系統(tǒng)的實際構(gòu)成有著很好的作用。移動機器人與工業(yè)機器人不同之處就是移動機器人具有一定的行為能力,這就需要研究者解決機器人的行為規(guī)劃問題。在移動機器人種類、智能化水平不斷提升的背景下,對視覺能力的要求也越來越高,這也使得計算機視覺有了更為廣闊的應(yīng)用前景。
四、結(jié)語
綜上所述,計算機視覺學(xué)作為人類科技發(fā)展和社會進步的一種學(xué)科體現(xiàn),在前進和發(fā)展的過程中,通過研究者和應(yīng)用者的不斷總結(jié)和探究,取得了豐碩的成果。在未來視覺技術(shù)發(fā)展的道路上,仍然有大量的工作需要進行研究。
參考文獻:
[1]韓祥波, 劉戰(zhàn)麗. 計算機圖像處理技術(shù)在農(nóng)產(chǎn)品檢測分級中的應(yīng)用[J]. 安徽農(nóng)業(yè)科學(xué) , 2013,(34)
[2]趙萍, 李永奎, 林靜, 白雪衛(wèi). 數(shù)字圖像處理技術(shù)在農(nóng)產(chǎn)品方面的應(yīng)用[J]. 農(nóng)機化研究 , 2012,(11)
【關(guān)鍵詞】計算機視覺;構(gòu)件;表面特征;檢測
表面缺陷檢測以及特征提取,所涉及的范圍是非常廣泛的,包括了鐵軌表面缺陷、帶鋼表面缺陷以及織物表面缺陷等。因此加強對產(chǎn)品的表面缺陷提取以及質(zhì)量檢測顯得尤為重要,目前基于計算機視覺的構(gòu)件缺陷檢測系統(tǒng)已經(jīng)受到國內(nèi)外研究人員的重視,如何更好地將計算機視覺技術(shù)引入到產(chǎn)品表面質(zhì)量缺陷檢測中去是未來發(fā)展的重點。筆者將在下文中就此展開詳細的闡述。
1.計算機視覺的基本工作原理
1.1系統(tǒng)結(jié)構(gòu)
計算機視覺是一項涉及范圍廣泛的技術(shù),他通過圖像采集裝置將檢測目標轉(zhuǎn)化為圖像信號,再經(jīng)過專門性的額圖像處理系統(tǒng)最終生成具體的表面特征。具體來講在圖像處理環(huán)節(jié)米旭濤根據(jù)圖像的具體像素以及圖像分布和顏色、亮度、飽和度等進行目標提取,再比照系統(tǒng)預(yù)設(shè)的參照值得出最終的檢測結(jié)果,例如尺寸大小、顏色等師傅偶合格。計算機視覺處理系統(tǒng)包括了光源、鏡頭、計算機以及圖像采集裝置和處理系統(tǒng)等,這些系統(tǒng)綜合組成共同推動了計算機視覺系統(tǒng)的正常穩(wěn)定運行。
1.2計算機視覺硬件設(shè)計
計算機視覺系統(tǒng)的硬件平臺包括了照明系統(tǒng)、鏡頭相機以及圖像采集裝置和工控機四個部分,這四個部分缺一不可,共同組成了整個計算機視覺系統(tǒng)。
1.2.1照明系統(tǒng)
照明系統(tǒng)是整個計算機視覺系統(tǒng)的關(guān)鍵,尤其是在光源和照明方案的配合上更是直接影響了整個系統(tǒng)運行的成敗。因此在照明方案的制定以及光源的選擇上應(yīng)該盡可能的突出物體特征參量,綜合考慮對比度以及亮度等因素,將計算機視覺系統(tǒng)的光源與照明方案相匹配,選擇需要的幾何形狀以及均勻度等,同時還需要結(jié)合被檢測物體的表面特征幾何形狀。針對構(gòu)件表面缺陷的照明方案,筆者認為應(yīng)該選擇功率相對較大的LED光源,用低角度的方式進行照明。
1.2.2相機鏡頭
相機系統(tǒng)是成像的關(guān)鍵,因此在相機鏡頭的選擇上應(yīng)該適用于具體的構(gòu)件。一般來說相機鏡頭包括了兩方面內(nèi)容,一是線掃,二是面掃。通過二者的綜合運用實現(xiàn)更好地成像效果。
1.2.3圖像采集卡
圖像采集卡主要是指在計算機視覺系統(tǒng)中位于圖像裁剪機設(shè)備和圖像處理設(shè)備之間的重要接口。是成像的中間環(huán)節(jié),發(fā)揮著不可或缺的作用。
2.基于計算機視覺的構(gòu)件表面缺陷特征提取
基于計算機視覺的構(gòu)件表面缺陷特征提取可以分為為三個重要部分,分別是圖像預(yù)處理部分:主要是指針對構(gòu)件進行區(qū)域的定位,將非構(gòu)件的部分移出計算機視覺的缺陷提取技術(shù)中去,從而降低了后續(xù)工作的工作難度;其次是進行缺陷定位,主要是指通過特定的技術(shù)和算法將缺陷從結(jié)果當(dāng)中直接分離出來。第三部分是缺陷特征的提取,也是系統(tǒng)處理的結(jié)果部分,是通過計算缺陷的程度以及缺陷大小,從而為后期的構(gòu)件維護提供參考依據(jù)。具體來說,這三個部分的操作主要體現(xiàn)在以下幾個方面:
2.1區(qū)域定位
區(qū)域定位是減少構(gòu)件處理和選擇時間的關(guān)鍵,能夠大大提高構(gòu)件缺陷提取的效率。構(gòu)件的表面的基本特征和大致集合框架提取是區(qū)域定位和的第一步,要將計算機區(qū)域定位和缺陷提取結(jié)合起來,更好地實現(xiàn)缺陷分析。要做好構(gòu)件的區(qū)域定位首先需要明確構(gòu)件的基本種類和特征:一是根據(jù)構(gòu)件的重用方式來說,可以分為白匣子、灰匣子、黑匣子從構(gòu)件的使用范圍來看又可以分為通用構(gòu)件和專用構(gòu)件;根據(jù)構(gòu)件的粒度的大小可以分為小。中大三種不同粒度的構(gòu)件;再次是從構(gòu)件的功能上來看可以分為系統(tǒng)構(gòu)件、支撐構(gòu)件以及領(lǐng)域構(gòu)件三個部分。四是從構(gòu)件的基本結(jié)構(gòu)特征來看可以分為原子構(gòu)件以及組合構(gòu)件。最后從構(gòu)件的狀態(tài)來說,又可以分為動態(tài)和靜態(tài)構(gòu)件。因此從不同種類的構(gòu)件進行區(qū)域定位為視覺系統(tǒng)正常運行創(chuàng)造了優(yōu)良的條件。
2.2缺陷提取
在進行缺陷提取的過程中,難免會受到客觀的環(huán)境影響,比如噪聲、溫度以及濕度等對圖像處理的結(jié)果產(chǎn)生影響,因此需要對區(qū)域定位中產(chǎn)生的區(qū)域進行濾波處理,然后再采用閾值分割的辦法進行缺陷提取。具體操作步驟如下所示:
(1)計算出成像中的最小最大灰度值,并且設(shè)置初始閾值。
(2)根據(jù)閾值,結(jié)合圖像的分割目標,將圖像分割成為目標和背景兩個部分,求導(dǎo)出平均灰度值。
(3)再根據(jù)新的平均灰度值計算出新的閾值。
(4)觀察閾值的初始值與新閾值之間的關(guān)系,如歌二者相等則整個計算過程就結(jié)束,如果不相等,則就需要進一步計算。
通過閾值計算得出啊的最佳閾值分割效果圖,能夠進行初步的缺陷預(yù)判,但是初步預(yù)判當(dāng)中還存在較多的不確定因素,主要包括兩類,一是在邊緣部分出現(xiàn)的細小毛刺,由于與缺陷的距離較近,因此在初步缺陷提取中容易形成誤判、再次是在構(gòu)件表面有一些非常細小的缺陷,這些缺陷的影響較小,不會對構(gòu)件的性能造成影響,因此在進行缺陷提取的過程中需要將這兩個因素排除在外,具體主要是指采用圖像形態(tài)學(xué)中開運算和閉運算,從而達到對構(gòu)件中的明了細節(jié)和暗色細節(jié)的過濾。具體來說缺陷的分割提取采用的是Sobel算子。主要是利用了圖像像素點的上下左右灰度加權(quán)算法,對構(gòu)件表面的缺陷進行檢測。再采用二值圖像邊界跟蹤法,將缺陷從構(gòu)件圖像中分離出來。
2.3缺陷特征提取
缺陷特征提取,又可以稱之為缺陷的定量計算和定性過程,是將前期所得的數(shù)據(jù)結(jié)果以更加直觀的形式展現(xiàn)出來,通過對比指標參數(shù)判斷構(gòu)件的表面質(zhì)量是否合格,符合基本的生產(chǎn)標準。一般來說常用的表示缺陷特征的標準有以下幾種:
(1)周長:周長是對缺陷的邊界長度的描述,在圖像特征上顯示則是指構(gòu)件成像上的缺陷區(qū)域的邊界像素數(shù)量。
(2)面積:面積相對于周長能夠更加直觀地反映整體缺陷的大小,它是缺陷區(qū)域中的像素的總數(shù),因此更高體現(xiàn)缺陷的影響規(guī)模。
(3)致密性:這是一個相對專業(yè)的缺陷指標概念主要是指每平方面積上的平方周倉,是一個雙單位描述指標。
(4)區(qū)域的質(zhì)心:區(qū)域質(zhì)心是描述缺陷的影響關(guān)鍵也就是缺陷區(qū)域內(nèi)的核心區(qū)域,是對整個區(qū)域的核心描述。
(5)最小外接矩形。
3.結(jié)語
綜上所述,構(gòu)件表面缺陷直接影響構(gòu)件的最終使用效果,構(gòu)件表面缺陷的檢測應(yīng)用領(lǐng)域也逐漸廣泛,而計算機視覺技術(shù)在檢測缺陷中的優(yōu)越性更體現(xiàn)了基于計算機視覺的構(gòu)件表面缺陷特征提取的研究價值。本文主要針對構(gòu)件表面缺陷的檢測,綜合計算機視覺技術(shù)提出了具體的檢測方法和檢測工作原理,通過對表面缺陷的檢測,力圖提高構(gòu)件的整體質(zhì)量。
【參考文獻】
[1]陳黎,黃心漢,王敏,何永輝,龔世強.帶鋼缺陷圖像的自動閾值分割研究[J].計算機工程與應(yīng)用,2002,(07).
[2]許豪,孔建益,湯勃,王興東,劉源泂.基于數(shù)學(xué)形態(tài)學(xué)的帶鋼表面缺陷邊緣提取[J].機械設(shè)計與制造,2012,(06).
關(guān)鍵詞:計算機視覺;地圖匹配;SLAM;機器人導(dǎo)航;路徑規(guī)劃
1概述
計算機視覺在人工智能學(xué)科占據(jù)重要地位,為自主移動機器人視覺導(dǎo)航做了深厚的理論鋪墊。目前,機器人導(dǎo)航技術(shù)有很多種,傳感器導(dǎo)航技術(shù)如里程計、激光雷達、超聲波、紅外線、微波雷達、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應(yīng)用,與上述非計算機視覺導(dǎo)航技術(shù)相比較,計算機視覺導(dǎo)航技術(shù)如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優(yōu)點。由于室內(nèi)相對室外空間比較狹小且內(nèi)部環(huán)境復(fù)雜,所以普通移動機器人在作業(yè)過程中,完成躲避眼前障礙物、自主導(dǎo)航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導(dǎo)航技術(shù)可利用本身的攝像頭獲得室內(nèi)周圍的環(huán)境信息,實時對其周身的場景進行快速反饋,對視野前方障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導(dǎo)航技術(shù)進行分類研究,主要分為3類:第一類是環(huán)境地圖事先已知,提前對外界環(huán)境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時候?qū)崟r進行地圖匹配;第二類是同時定位與地圖構(gòu)建,移動機器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實時定位和導(dǎo)航;第三類是不依賴環(huán)境地圖,自主移動機器人不需要依賴任何的環(huán)境地圖,其在作業(yè)活動時的可行區(qū)域主要取決于攝像頭實時識別和檢測的環(huán)境相對信息。
2環(huán)境地圖的表示方法
目前,計算機視覺導(dǎo)航技術(shù)多采用柵格地圖、幾何地圖、拓撲地圖和混合地圖構(gòu)建環(huán)境地圖信息。
2.1柵格地圖
柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內(nèi)部內(nèi)存障礙物的概率。構(gòu)建柵格地圖的優(yōu)點是其地圖表達形式直觀,創(chuàng)建和維護比較容易;但當(dāng)劃分的柵格單元數(shù)量不斷增多時,實時性就會慢慢變差;當(dāng)劃分的柵格單元越大時,環(huán)境地圖的分辨率越低。
2.2幾何地圖
幾何地圖利用幾何特征如點、直線、平面等來構(gòu)成環(huán)境主要框架,需要知道這些特征在環(huán)境中信息的具置,所以幾何地圖通常使用其對應(yīng)的三維空間坐標來表示。幾何地圖構(gòu)建過程相對簡單,保留了室內(nèi)環(huán)境的各種重要信息,是基于計算機視覺的定位與地圖構(gòu)建算法中最常用的一種表示方式。但是為了完成環(huán)境的建模需要標記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現(xiàn)與全局不一致的情況。
2.3拓撲地圖
拓撲地圖用許多節(jié)點和連接這些節(jié)點的曲線來表示環(huán)境信息。其中,每個節(jié)點相對應(yīng)真實環(huán)境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節(jié)點之間的曲線表示兩個節(jié)點對應(yīng)的地點是相聯(lián)通的。拓撲地圖把環(huán)境信息表上在一線圖上,不需要精確表示不同節(jié)點間的地理位置關(guān)系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節(jié)點進而根據(jù)識別的節(jié)點選擇節(jié)點與節(jié)點間的曲線作為可作業(yè)的路徑。
2.4混合地圖
混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓撲地圖以及柵格一拓撲地圖?;旌系貓D采用多種地圖表示,可結(jié)合多種地圖的優(yōu)勢,與單一的地圖表示相比更具有靈活性、準確性和魯棒性,但其不同類別的地圖結(jié)合起來管理會比較復(fù)雜,難以協(xié)調(diào),增加了地圖構(gòu)建的難度。文獻針對室內(nèi)環(huán)境所建立的模型分為全局拓撲和局部幾何表述部分,整體環(huán)境通過拓撲節(jié)點串連起來,維護了整體環(huán)境表述的全局一致性;而以每個拓撲節(jié)點為核心所采用的幾何表述則可確保局部精確定位的實現(xiàn),這樣建立的幾何一拓撲混合環(huán)境模型可將二者的優(yōu)勢都表現(xiàn)出來,使得移動機器人定位和地圖構(gòu)建同時進行,實現(xiàn)容易。
3基于計算機視覺的室內(nèi)導(dǎo)航
基于計算機視覺的室內(nèi)導(dǎo)航技術(shù)可利用攝像頭捕獲機器人周圍環(huán)境的全部信息,對其周身的場景進行反饋,對障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內(nèi)導(dǎo)航技術(shù)主要分為3類:第一類是環(huán)境地圖事先已知;第二類是定位與地圖構(gòu)建同時進行;第三類是不依賴環(huán)境地圖。
3.1環(huán)境地圖事先已知
提前對外界環(huán)境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內(nèi)存數(shù)據(jù)庫中,在導(dǎo)航的時候?qū)崟r進行地圖匹配,即預(yù)存環(huán)境地圖。在環(huán)境地圖事先已知的導(dǎo)航中,路標信息保存在計算機內(nèi)存的數(shù)據(jù)庫中,視覺系統(tǒng)中心利用圖像特征直接或間接向移動機器人提供一系列路標信息,一旦路標被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現(xiàn)自身精確定位和導(dǎo)航。該導(dǎo)航技術(shù)過程可分為以下步驟:
a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;
b)路標識別及檢測:利用相關(guān)圖像處理算法對圖像進行一系列預(yù)處理如進行邊緣檢測和提取、平滑、濾波、區(qū)域分割;
c)路標匹配標志:在觀察到的圖像和所期望圖像之間進行匹配,搜索現(xiàn)有的路標數(shù)據(jù)庫進行標志路標;
d)位置計算:當(dāng)有特征點進行匹配時,視覺系統(tǒng)會根據(jù)數(shù)據(jù)庫中的路標位置進行自身精確定位和導(dǎo)航。
在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。
①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導(dǎo)航技術(shù)研究得最多。
②不知起點,已知地圖。這種條件下的定位稱為全局定位。當(dāng)機器人需要重置時,通常使用這種定位方法來檢索機器人的當(dāng)前位置(即姿態(tài)初始化)。常用的輔助方法是在環(huán)境中添加一些人造信標,如無線收發(fā)器,幾何信標,條碼技術(shù),紅外或超聲波接收系統(tǒng)進行位置識別,利用視覺系統(tǒng)識別自然標志,自主定位。
3.2定位與地圖構(gòu)建同時進行
不知起點,不知地圖。SLAM技術(shù)最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據(jù)自身的攝像頭獲取周圍未知環(huán)境信息,在作業(yè)時逐步構(gòu)建周圍的環(huán)境地圖,根據(jù)構(gòu)建的增量式地圖自主實時定位和導(dǎo)航。在日后的導(dǎo)航研究中,混合地圖中的幾何一拓撲混合環(huán)境模型被得到廣泛應(yīng)用,主要用來解決SLAM問題。
2003年,在解決SLAM技術(shù)難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創(chuàng)建方法。下面是該算法步驟:
a)數(shù)據(jù)采集:首先初始化系統(tǒng),從攝像頭傳感器采集距離數(shù)據(jù);
b)狀態(tài)預(yù)測:視覺系統(tǒng)預(yù)測機器人運動狀態(tài),實時返回新位姿信息和協(xié)方差矩陣,預(yù)測地圖;
c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;
d)測量預(yù)測:預(yù)測機器人當(dāng)前位姿的全局地圖;
e)位置匹配:應(yīng)用最鄰近濾波器匹配局部地圖中的觀測點和預(yù)測點;
f)估計:使用擴展Kalman濾波器更新地圖;
g)創(chuàng)建:將非相關(guān)的觀測點加入地圖,對機器人返回增量式地圖;
h)輸出地圖。
制約機器人視覺系統(tǒng)性能的重要因素是信息實時處理的計算復(fù)雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權(quán)衡。
3.3無環(huán)境地圖
在這類系統(tǒng)中,機器人不需要依賴任何的環(huán)境地圖信息,機器人的活動取決于其當(dāng)時識別和提取出來的環(huán)境信息,這些環(huán)境信息可能是桌子、椅子和門等,不需要知道這些環(huán)境元素的絕對位置。無環(huán)境地圖的導(dǎo)航技術(shù)典型的技術(shù)有3大類:基于光流的導(dǎo)航技術(shù)、基于外觀信息的導(dǎo)航技術(shù)、基于目標識別的導(dǎo)航技術(shù)和基于目標跟蹤的導(dǎo)航技術(shù)。
3.3.1基于光流的導(dǎo)航技術(shù)
光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學(xué)特性提出了2個假設(shè):①運動物體的灰度在很短的間隔時間內(nèi)保持不變;②給定鄰域內(nèi)的速度向量場變化是緩慢的。如Santos-Victor等人研發(fā)了一種基于光流的robee視覺系統(tǒng),該系統(tǒng)模擬了蜜蜂的視覺行為。在robee視覺系統(tǒng)中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當(dāng)機器人移動到走廊兩側(cè)的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側(cè)的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導(dǎo)航的實現(xiàn)中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導(dǎo)航技術(shù)只能用于室內(nèi)單通道直走道導(dǎo)航,不能引導(dǎo)機器人改變方向,具有一定的局限性。
3.3.2基于外觀信息的導(dǎo)航技術(shù)
基于外觀的機器人導(dǎo)航方法,不需要構(gòu)建真實的地圖導(dǎo)航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標的外觀信息進行自主定位和導(dǎo)航。其中,所述的外觀信息多為目標信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導(dǎo)航時存儲連續(xù)視頻幀的環(huán)境圖像信息,并將連續(xù)視頻幀與控制指令相關(guān)聯(lián),從而再執(zhí)行指令規(guī)劃有效路徑到達目的地。
3.3.3基于目標識別導(dǎo)航技術(shù)
為了達到目標點或是識別目標,機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導(dǎo)航各個位置的賦值方法。該賦值方法中,機器人執(zhí)行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關(guān)的符號命令,機器人自動識別并建立路標,通過符號指令到達目標點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標是椅子、路徑向后。該導(dǎo)航技術(shù)的難點在于目標是否可以準確實時識別路標。第一,識別大量不同類別的物體,室內(nèi)環(huán)境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數(shù)據(jù)結(jié)構(gòu)中去,起到容易識別是用什么度量來區(qū)分物體;第二,識別大量不同背景下的物體,一個合適的物體表達式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關(guān)的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關(guān)程序能夠類似的物體進行識別和區(qū)分。
3.3.4基于目標跟蹤的導(dǎo)航技術(shù)
基于目標跟蹤的導(dǎo)航技術(shù),為機器人構(gòu)造一個虛擬地圖,機器人通過攝像頭獲取連續(xù)的視頻序定一個跟蹤的目標,為了達到對目標的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標進行建模。基于粒子濾波的目標跟蹤主要包含四個階段,分別是初始化目標區(qū)域,概率轉(zhuǎn)移,目標區(qū)域權(quán)重計算,目標區(qū)域重采樣。在機器人導(dǎo)航之前,通過視頻序列的當(dāng)前幾幀標注機器人所需要跟蹤的目標,在導(dǎo)航時,機器人通過連續(xù)的視頻幀感知周圍的待跟蹤目標,同時對所需要跟蹤的目標散播粒子,當(dāng)獲取的視頻幀對目標區(qū)域重采樣后足以讓機器人確定所需要跟蹤的目標時,機器人通過確定的目標為自己規(guī)劃最有效的路徑到達目的地。獲取視頻序列目標跟蹤是算機視覺領(lǐng)域中的重要分支,它在工業(yè)生產(chǎn)、交通導(dǎo)航、國防建設(shè)、航空導(dǎo)航等各個領(lǐng)域有著廣泛的應(yīng)用。
關(guān)鍵詞OpenCV;科學(xué)教育;推廣價值
1、OpenCV庫簡介
OpenCV是由Intel微處理器研究實驗室的視覺交互組開發(fā)的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經(jīng)過非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導(dǎo)入到合適的環(huán)境中使用。它可以實現(xiàn)有關(guān)圖像識別與處理和計算機視覺技術(shù)方面的很多通用算法。它的優(yōu)勢是可以運行在當(dāng)代社會使用熱門的各大操作系統(tǒng)上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經(jīng)過優(yōu)化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數(shù)就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經(jīng)被社會各界廣泛使用。現(xiàn)已應(yīng)用于人機互動、圖像識別、圖像分割、目標追蹤、3D重建、機器視覺、結(jié)構(gòu)分析等數(shù)個領(lǐng)域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運用于各種數(shù)據(jù)類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學(xué)習(xí)模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實驗性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持攝像頭的讀取和轉(zhuǎn)換。
2、OpenCV處理圖像的功能
OpenCV中有很多的函數(shù),可以實現(xiàn)很多不同的功能,其中最具有學(xué)習(xí)價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。
2.1加載圖像
不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過程。2.2顯示圖像加載圖像后需要通過函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫提供,它可以在屏幕上創(chuàng)建一個窗口,將圖像顯示出來。cvShowImage()函數(shù)的作用是在這個創(chuàng)建的窗口中顯示出加載過后的圖像。觀察圖像時經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數(shù),就可以輕松的實現(xiàn)觀察圖像的功能。
2.3處理圖像
OpenCV中包含的多種函數(shù),可以達到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當(dāng)選用合適的函數(shù)并加以運用即可達到目標所需。
3、OpenCV的推廣價值體現(xiàn)
OpenCV可以應(yīng)用在社會的各個領(lǐng)域,價值就體現(xiàn)在每個科學(xué)的產(chǎn)物當(dāng)中。舉個近在身邊的例子,隨著社會的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ摺1M管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當(dāng)我們在學(xué)校的教學(xué)樓內(nèi)等電梯時發(fā)現(xiàn)了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置。可是此時這一臺電梯只能容納有限數(shù)量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導(dǎo)致了有部分人無法及時地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設(shè)備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數(shù),然后運用語言編程來確定調(diào)動電梯的個數(shù),從而來達到實現(xiàn)自動控制每個電梯的運行的目的,使所有人都能在第一時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務(wù)。我們將OpenCV導(dǎo)入編程環(huán)境,其次修改電梯工作系統(tǒng)的運行程序,將軟件與硬件設(shè)備相連通,這樣通過調(diào)度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節(jié)約人們的候梯時間,方便學(xué)生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價值得到最大化。見微知著,OpenCV可以應(yīng)用在每個領(lǐng)域,對各界的發(fā)展起到推動作用,造福社會的科技發(fā)展,方便人們的生活。
4、科學(xué)教育存在的問題
在歷年的教學(xué)模式中,老師們往往會強調(diào)理論知識的重要性,但卻忽略了對學(xué)生使用動手能力的培養(yǎng),學(xué)生不能獨立完成實踐性的技術(shù)操作,也就是說教學(xué)模式缺乏實踐性。只有將理論與實踐相結(jié)合,才能實現(xiàn)知識價值的最大化,因此,應(yīng)當(dāng)在教學(xué)中配合著實踐課程,舉一反三,讓學(xué)生們更加深刻地學(xué)習(xí)和了解所學(xué)到的知識。而如今雖然一部分學(xué)校也開設(shè)了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術(shù)實踐方面的知識,學(xué)生們也沒有真正擁有動手實踐能力,這使學(xué)生們的技術(shù)知識十分受限。雖然現(xiàn)在多數(shù)學(xué)生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對自己所學(xué)過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學(xué)生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學(xué)習(xí)更多的技能,這對青少年的發(fā)展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應(yīng)該改變現(xiàn)有的教學(xué)模式,一邊教授理論知識,一邊配合指導(dǎo)學(xué)生動手操作,將理論與實踐相結(jié)合,也能讓學(xué)生更好地消化和吸收所學(xué)到的知識,并且引導(dǎo)學(xué)生正確使用計算機,發(fā)揮計算機的價值,讓學(xué)生們都能夠在計算機中獲得更多的知識。
5OpenCV開源算法庫在各個領(lǐng)域的實例化體現(xiàn)
OpenCV在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、安全防護領(lǐng)域等都有很大的重要意義。在醫(yī)學(xué)領(lǐng)域中,由于有了這個開源算法庫,我們可以盡可能地調(diào)用它,從而來進行圖像處理、對象檢測,讓醫(yī)生更好更快速觀測人體結(jié)構(gòu),及時發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領(lǐng)域中,我們現(xiàn)實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監(jiān)視報警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的?,F(xiàn)如今,國家的科學(xué)技術(shù)飛速發(fā)展,日益強盛,OpenCV的成績有目共睹,未來的發(fā)展需要科學(xué)技術(shù)的不斷推進,才能為祖國未來的其他事業(yè)提供強有力的后盾。
6OpenCV在科學(xué)教育中的作用
在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經(jīng)越來越廣泛,計算機已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計算機控制動力系統(tǒng)的運行、人造衛(wèi)星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發(fā)展和人類文明的進步,由此可見,計算機技術(shù)知識的掌握對現(xiàn)代人來說是十分重要的。如果想要成為一個真正有技術(shù)、有能力的人才,就務(wù)必要熟練掌握計算機技術(shù)的使用。但是目前當(dāng)代社會的教育在計算機技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術(shù)知識的傳輸也相應(yīng)減少,學(xué)生們的能力也因此日益下降。而科學(xué)教育,顧名思義,是使科學(xué)技術(shù)在教育過程中得以傳承。想要科學(xué)地教育學(xué)生,就必須要多多講授科學(xué)技術(shù)方面有關(guān)的知識。說到科學(xué)技術(shù),它的重點自然是計算機技術(shù),而OpenCV作為計算機視覺技術(shù)的核心,可以說也是計算機技術(shù)甚至科學(xué)教育中的一個重要部分。在教育中普及并傳承這個技術(shù)無疑可以提高學(xué)生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說過計算機視覺技術(shù),也并不了解OpenCV庫,更加不會學(xué)習(xí)到與之有關(guān)的技術(shù)知識。在這樣嚴峻的形勢下,我們更應(yīng)該將類似OpenCV方面技術(shù)有關(guān)的知識通過教育傳遞下去。各大高校應(yīng)積極開展有關(guān)計算機的活動,開設(shè)與計算機技術(shù)有關(guān)的課程。這樣才能根據(jù)社會的需求來培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當(dāng)中,定會使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國的未來更加璀璨。
參考文獻
[1]于仕琪,劉瑞禎.學(xué)習(xí)OpenCV(中文版)[M].北京:清華大學(xué)出版社,2009.
[2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.
[3]賈小軍,喻擎蒼.基于開源計算機視覺庫OpenCV的圖像處理[J].計算機應(yīng)用與軟件,2008,25(4):276-278.
[4]陳勝勇.基于OpenCV的計算機視覺技術(shù)實現(xiàn)[M].北京:科學(xué)出版社,2008.
[5]劉潔,馮貴玉,張汗靈.一種圖像處理和計算機視覺的開發(fā)工具[J].計算機仿真,2006(11).
關(guān)鍵詞: 計算機視覺; 手指特征識別; 動態(tài)閾值算法; 矩形模版
中圖分類號: TN911?34; TP37 文獻標識碼: A 文章編號: 1004?373X(2017)12?0113?04
Abstract: In order to improve the accuracy and speed of the finger feature recognition in video image, a dynamic threshold algorithm based on rectangle template is proposed. The rectangle template is used in the algorithm to smooth the image, and the gray threshold method is used to extract the edge of the target to recognize the finger feature accurately. The Matlab simulation results show that the algorithm is lightly influenced by environmental noise, and can segment the edge of the finger clearly and accurately. A finger feature recognition system based on computer vision was designed on FPGA platform. Its real?time performance, finger recognition accuracy and other performances were tested. The test results show that the running speed of the system is synchronous with the speed of capturing the image by camera, which can meet the real?time requirement of the system. The coordinates deviation of the finger position recognized by the system is about 3 pixels, which can basically meets the accuracy requirement of the system.
Keywords: computer vision; finger feature recognition; dynamic threshold algorithm; rectangle template
S著科學(xué)技術(shù)的飛速發(fā)展,人與計算機之間的交互活動越來越密切,并逐漸成為人們?nèi)粘I畹闹匾M成部分。傳統(tǒng)觸摸屏是現(xiàn)階段一種最常見,也是最重要的人機交互方式,其是通過一種附加在顯示器表面的透明介質(zhì),依賴使用者的手指觸摸該介質(zhì)來實現(xiàn)對計算機的輸入控制[1?2]。目前,這種觸摸屏技術(shù)已經(jīng)相當(dāng)成熟,但是,技術(shù)上不容易做到大尺寸,且成本相對較高,也易于破損。為了突破傳統(tǒng)觸摸屏這種人機交互方式的局限,把任何成像平面變成可用手指進行交互的系統(tǒng),本文提出了一種基于計算機視覺的手指特征識別算法,并在FPGA平臺上建立了一套基于計算機視覺的手指特征識別硬件系統(tǒng)。這種基于計算機視覺的手指特征識別方法可為基于視覺的人機互動提供一種新的技術(shù)解決途徑。其與傳統(tǒng)觸摸屏的區(qū)別在于,不需要在成像屏幕上安裝任何特殊介質(zhì),使用壽命得到大幅延長,應(yīng)用范圍有了很大擴展。
1 圖像采集平臺
本文所采用的圖像采集平臺如圖1所示,在任何與計算機連接的顯示設(shè)備(如投影屏幕、等離子電視等)的左上角、右上角安裝兩個攝像頭,通過這兩個攝像頭便可確定手指在屏幕上的二維坐標信息(x1,x2)。然后,將此坐標點傳至計算機,并與Windows系統(tǒng)的鼠標程序關(guān)聯(lián)即可實現(xiàn)人機交互功能。圖2是圖像采集平臺的側(cè)視圖。其中虛線框表示攝像頭視野中系統(tǒng)需要處理的區(qū)域,即手指出現(xiàn)的區(qū)域。
2 手指特征識別算法及仿真
在系統(tǒng)實現(xiàn)過程中,如何從攝像頭所拍攝的畫面中準確地識別并提取出手指信息是其難點之一。在目前的圖像處理技術(shù)中,用于識別背景圖案中目標物體的算法很多,本文在分析基于色彩聚類的膚色識別算法的基礎(chǔ)上,結(jié)合課題特殊需求,提出一種基于矩形模板的動態(tài)閾值算法,并在Matlab中對上述算法的處理效果進行了仿真。
從圖像采集平臺可以看出,本系統(tǒng)只關(guān)心距屏幕很近的小視野內(nèi)是否出現(xiàn)區(qū)別于背景的目標物體。因此,只需從攝像頭拍攝的圖像當(dāng)中截取一部分,如圖3中的小矩形框所示。
2.1 基于色彩聚類的膚色識別算法
膚色是人體區(qū)別于其他物體的一個重要特征,人體膚色特征不受位置、角度、大小等因素影響,具有較強的穩(wěn)定性。因此,本文首先選定基于色彩聚類的膚色提取識別算法進行研究。在色彩聚類方法中,Anil K.Jain的Cb,Cr橢圓聚類方法最為典型[3?4]。采用非線性分段膚色分割得到的膚色區(qū)域在Cb,Cr空間中近似于橢圓,如下:
由圖5可知,利用該算法分割手指信息的效果尚可,能從比較友好的環(huán)境中迅速準確地識別出手指信息。圖6為利用橢圓聚類膚色分割算法對從圖像采集平臺讀取圖像的手指識別效果??梢姡撍惴ㄔ谄胀ōh(huán)境下對手指的識別效果良好。但當(dāng)屏幕上的顏色影響手指膚色時,該算法的識別能力就會有所降低。可見,該算法對皮膚顏色的純度要求較高,適用范圍受限。圖7為屏幕出現(xiàn)大面積藍色時對手指識別造成的影響效果。
2.2 基于正方形模板的動態(tài)閾值算法
基于正方形模板的動態(tài)閾值算法,即采用灰度閾值法,用正方形模板平滑圖像[5?6]。圖8(a)是3×3模板動態(tài)閾值算法平滑圖像的過程。
應(yīng)用基于3×3模板的動態(tài)閾值算法對原圖4進行邊緣提取的仿真效果如圖9(a)所示??梢?,應(yīng)用3×3模板可以提取出目標物體的邊緣,但不夠清晰。雖然可以通過增大模板取得比較理想的效果(圖9(b)為采用基于101×101模板的動態(tài)閾值算法的處理效果),但會使計算量劇增,同時也縮小了模板所能完全覆蓋的范圍,使圖像邊緣產(chǎn)生無效的白色區(qū)域。
2.3 基于矩形模板的動態(tài)閾值算法
根據(jù)課題實際需要,即所要處理的目標區(qū)域為長方形窄條區(qū)域(如圖3所示),本文提出一種基于矩形模板的動態(tài)閾值算法。該算法與基于正方形模板算法的區(qū)別在于,平滑圖像時所用的模板為窄條形,如3×5模板,3×15模板,3×41模板等。圖8(b)是3×9模板動態(tài)閾值算法平滑圖像的過程。
圖10給出了采用基于3×9模板、3×14模板、3×81模板、3×101模板動態(tài)閾值算法對原圖4進行手部邊緣提取的仿真效果。由仿真效果可知,基于矩形模板的動態(tài)閾值算法在模板取值為3×9的情況下,便能夠清晰提取出目標物體的邊緣。而且,隨著模板取值的增加,目標物體邊緣的提取效果更加清晰準確。與基于正方形模板的動態(tài)閾值算法相比,基于矩形模板的動態(tài)閾值算法計算量較小,節(jié)約了系統(tǒng)的計算資源。
3 基于FPGA的手指特征識別算法的系統(tǒng)測試
為了驗證本文所提出的基于矩形模板的動態(tài)閾值算法能否滿足屏幕交互系統(tǒng)的整體要求,本文通過編寫軟件程序在FPGA開發(fā)板上對這種算法進行了硬件實現(xiàn)和系統(tǒng)測試。
3.1 硬件實現(xiàn)
本文所采用的硬件實現(xiàn)系統(tǒng)主要是基于美國Altera公司生產(chǎn)的型號為EFA?CY1C12的“紅色颶風(fēng)”(Red Cyclone)系列FPGA開發(fā)板,并另外集成了用Ommvison公司的型號為OV9655的CMOS數(shù)字攝像頭,以及ISSI公司的型號為IS61LV25616AL的SRAM存儲器[7?10]。最終搭建的硬件系統(tǒng)如圖11所示。
3.2 系統(tǒng)測試
本文主要對系統(tǒng)的實時性、手指提取精度、資源占用情況等影響系統(tǒng)運行的重要技術(shù)指標進行了測試。
(1) 實時性
OV9655攝像頭在1 280×1 024分辨率下,能提供15 f/s的圖像采集速率,課題所設(shè)計的軟件程序可以在一幀圖像的處理時間內(nèi)完成了數(shù)據(jù)的采集、手指邊緣的識別等運算,實現(xiàn)了系統(tǒng)執(zhí)行速度與攝像頭拍攝速度的同步,達到了系統(tǒng)對實時性要求。
(2) 手指識別精度
由于課題在軟件設(shè)計過程中編入了圖像采集防抖動處理程序,提高了圖像采集的穩(wěn)定性,也提高了手指識別的精度。經(jīng)過測試,本系統(tǒng)得到的手指位置信息的坐標偏差為3個像素,基本滿足大屏幕交互系統(tǒng)對識別精度的需求。
(3) 資源占用情況
從Quartus Ⅱ的編譯報告中可以看出,本系統(tǒng)的軟件運行已占用FPGA的9 702個邏輯單元,占邏輯單元總數(shù)的80%??梢?,該硬件系統(tǒng)的FPGA運算資源基本能滿足系統(tǒng)的實際需要。
4 結(jié) 語
本文通過對基于矩形模板的動態(tài)閾值算法的研究和基于FPGA的手指特征識別硬件系統(tǒng)的實現(xiàn),建立了一套基于計算機視覺的手指特征識別系統(tǒng)。該算法受環(huán)境噪聲影響較小,能清晰準確地分割出手指邊緣,且隨著矩形模版取值的增大,算法的識別效果會更加良好。該系統(tǒng)的實時性、手指識別精度及資源占用情況均可滿足系統(tǒng)要求。這種基于計算機視覺的手指識別方法成本低、靈活性好,為基于視覺的人機交互提供了一種新的技術(shù)途徑。
參考文獻
[1] 呂明,呂延.觸摸屏的技術(shù)現(xiàn)狀、發(fā)展趨勢及市場前景[J].機床電器,2012,39(3):4?7.
[2] 陳康才,李春茂.電阻式觸摸屏兩點觸摸原理[J].科學(xué)技術(shù)與工程,2012,12(18):4525?4529.
[3] MAITRE H.現(xiàn)代數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2006:79.
[4] 帕科爾,景麗.圖像處理與計算機視覺算法及應(yīng)用[M].2版.北京:清華大學(xué)出版社,2014:104.
[5] GONZALEZ R C,WOODS R E,EDDINS S L.數(shù)字圖像處理的Matlab實現(xiàn)[M].2版.北京:清華大學(xué)出版社,2013:301.
[6] RUSS J C.數(shù)字圖像處理[M].6版.北京:清華大學(xué)出版社,2014:216.
[7] 于楓.Altera可編程輯器件應(yīng)用技術(shù)[M].北京:科學(xué)出版社,2014:68.
[8] 姚智剛,付強.基于低成本CMOS攝像頭智能監(jiān)控系統(tǒng)的設(shè)計[J].現(xiàn)代電子技術(shù),2006,29(3):126?128.