前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺基本原理范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
1對以下出現(xiàn)的名詞的說明
餐飲庫房是本平臺新開發(fā)的一個庫房,體檢系統(tǒng)是地方公司開發(fā)的一個系統(tǒng),藥庫管理系統(tǒng)是軍隊療養(yǎng)院信息系統(tǒng)的一個模塊,物資管理系統(tǒng)是總后配發(fā)的物資系統(tǒng)。
2存在的問題及解決辦法
2.1餐飲庫房庫存出現(xiàn)負數(shù)原因是餐飲庫房管理員沒有正確維護餐飲分類設置模塊。本院有兩個餐飲中心,他們各自管理自己的庫房,這樣就產(chǎn)生了兩個餐飲庫房。在沒有本平臺之前,餐飲庫房一直是手工管理,所以我們就設計了一個簡單的餐飲庫房管理功能。先把餐飲中心的購入材料作一個分類,每個分類有三種庫存管理標記,出入庫管理標記、全進全出標記、消費出庫標記,通過對三種標記的不同組合就達到了管理庫房的目的。在出入庫管理標記上打勾,表明此分類材料納入庫存管理。在全進全出標記上打勾,表明此分類材料一入庫,系統(tǒng)就自動全出庫,此分類材料的庫存始終為零。此庫存管理標記適合單價較低、量較大、品種較多、幾乎每天都要入庫、難以管理出庫的分類,如蔬菜肉類。在消費出庫標記上打勾,表明當有餐飲消費賬單產(chǎn)生時,系統(tǒng)自動扣該分類材料庫存。
2.2體檢、客房賬單結(jié)算時出錯原因是沒有設置體檢項目和客房的合作比、提成比。合作比指的是本院跟外單位合作的體檢項目,需要付給外單位的分成比,合作比分非合作(本院項目,不跟外單位合作)、比率提(按百分比分成)和金額提(按固定某一個金額分成)三種。提成比是給介紹人的一種勞動報酬,分不提成、比率提和金額提三種。當增加了新的體檢項目和客房房間后,一定要及時、準確地設置好合作比和分成比,否則收費室收取不了費用并且會影響科室的收入分攤。
2.3藥品、物資單據(jù)報賬出錯藥品、物資入庫報賬出錯有兩個原因,一是未進行藥品、物資分類對照,二是財務會計人員未為藥品、物資的廠商設立核算賬戶。
2.4藥品、物資單據(jù)報賬時不提示錯誤,但單據(jù)明細為空原因是該入庫單據(jù)有新的品名,需要報賬人員進入藥品、物資分類定義模塊進行手工提取,把新的品名從藥品系統(tǒng)和物資系統(tǒng)里提取過來。
2.5藥品、物資報賬單據(jù)明細中出現(xiàn)重復的明細藥庫管理系統(tǒng)的價表中存在兩條或兩條以上藥品編碼相同終止時間為空的記錄,所以就導致了藥品報賬單據(jù)明細中出現(xiàn)重復明細。物資報賬單據(jù)中出現(xiàn)重復明細是由表與表之間的一對多對應引起的。
2.6因價格原因入錯庫而作了退庫處理的單據(jù),在本平臺中怎么處理因為入錯庫而作了退貨處理的單據(jù),實際上不是真正意義上的退貨,在本平臺中不能對此類單據(jù)進行退貨報賬。所以我們就設計了一個小模塊來處理此類退貨單據(jù),實現(xiàn)辦法如下:找出該退貨單的入庫單,把這兩條單據(jù)都選中,做作廢處理。
2.7同一掛賬單位的多個掛賬賬單可以分批次結(jié)算在模塊的設計初期,只能對同一掛賬單位的所有掛賬賬單進行一次結(jié)算,這種設計思想不符合實際,后面就重新編寫了程序,做到可以自由選定某幾個掛賬賬單進行結(jié)算。
2.8 體檢賬單生成模塊中的“追加校驗”功能本平臺首先是從體檢系統(tǒng)中取體檢人員的體檢單號、姓名、體檢日期、體檢項目、項目價格等字段。舉個例子,有個體檢人員叫張三,預定是2008年8月10日來體檢,體檢項目已確定,但是那天他沒有來體檢,那本平臺指定提取2008年8月10日的體檢人員信息,就會把張三的體檢信息提取過來并保存在全成本的數(shù)據(jù)庫中。2008年8月12日,張三參加體檢了,他重新選定了體檢項目,我們就在體檢系統(tǒng)中指定他的體檢日期是2008年8月12日,重新登記了他的體檢項目,在沒有“追加校驗”功能時,主鍵只有一個,是體檢單號,那指定提取2008年8月12日的體檢人員信息,因為張三的體檢單號存在于數(shù)據(jù)庫中,所以系統(tǒng)不會再重復提取。增加了“追加校驗”功能后,主鍵是體檢單號和體檢日期,先搜索有無重復的體檢單號和體檢日期,如存在,刪除此條記錄,然后插入一條新的記錄。
3討論
【關鍵詞】株高 HALCON 雙目視覺 誤差修正
1 引言
計算機視覺技術是近幾年來發(fā)展較快的信息處理技術,隨著圖像處理技術的專業(yè)化、計算機硬件成本的降低和速度的提高,計算機視覺的應用已變得越來越廣泛,其中不乏在農(nóng)業(yè)中的應用。
株高是植物生長指標的重要參數(shù),是一個物種爭奪陽光的能力的主要決定因素[1]。對于作物來講,株高參數(shù)是作物產(chǎn)量預估不可或缺的參數(shù)。
然而對于具體的利用機器視覺方法直接測量株高的研究還是比較少的,本文就是利用HALCON軟件,采用雙目計算機視覺方法來實現(xiàn)株高的測量。
2 雙目視覺原理
雙目視覺的基本原理是從兩個視點觀察同一景物,獲取不同視角下的兩幅圖像,然后根據(jù)三角測量原理計算不同圖像對應像素間的視差(disparity ),獲取景物的三維信息,從而實現(xiàn)場景三維重構(gòu)。
根據(jù)兩個攝像機位姿的不同,雙目視覺有多種模式,常用的有雙目橫向模式,雙目橫向會聚模式以及雙目縱向模式(也稱雙目軸向模式)。
為了增加測量精度,基線一般不能太小,但基線長度也不可太長,否則,由于物體各部分相互遮擋,兩個攝像機可能不能同時觀察到目標點。
圖1是會聚雙目成像中的視差原理圖。圖中給出兩鏡頭連線所在平面(XZ平面),兩鏡頭中心間的距離(即基線)是B,兩光軸在XZ平面相交于(0,0,Z)點,交角為(未知)?,F(xiàn)在來看如果已知像平面坐標點(x1, y1)和(x2, y2 ),如何求取世界點W的坐標(X,Y,Z)。
根據(jù)相似三角形的關系可以很明顯得出: (2.1)
(2.2)
(2.3)
其中r為從(任一)鏡頭中心到兩系統(tǒng)會聚點的距離(未知)。將式(2.2)和(2.3)聯(lián)立, 可得:
(2.4)
上式把物體和像平面的距離Z與視差d直接聯(lián)系起來,若想求解式(2.4),除視差d外,還需要知道x1和x2本身。另外,由圖1可以得到:
(2.5)
代入式(2.2)或(2.3)可得:
代入式(2.2)或(2.3)可得:
(2.6)
現(xiàn)實測量中,兩相機的光軸與世界坐標Z軸的夾角不可能相等,不過即便如此,也只會引入幾個待確定的三角函數(shù),而這些三角函數(shù)在相機標定時即可確定。
3 測量過程
實現(xiàn)該測量過程包括如下幾個功能模塊:圖像獲取、攝像機標定、特征提取、立體匹配與三維信息恢復、后處理。本實驗采用是分比率為960×720的雙攝像頭。被測區(qū)域大小約為56cm×42cm,所以采用的標定板應為被測區(qū)域1/3大小的HALCON專用的200mm標定板。標定數(shù)為24×2張圖片。利用HALCON自帶的標定助手,可以輕松實現(xiàn)單目標定。
雙目標定時,需要有15張以上左右相機相同時刻拍攝的標定板的圖片。再利用for循環(huán),find_caltab函數(shù),find_marks_and_pose函數(shù)以及binocular_calibration函數(shù),可以實現(xiàn)雙目標定。將標定過程中,獲得的攝像機的內(nèi)參以及兩個攝像機相對位置關系作參數(shù)傳遞給函數(shù)gen_binocular_rectification_map,可以很好地實現(xiàn)雙目視覺校正的目的,得到兩幅校正后的圖像,還能得到校正后虛擬立體視覺系統(tǒng)中兩個攝像機的內(nèi)參和外參。
不同種類的植物其株高定義不同,測量方式也不盡相同。本文研究的株高只針對直立型的,是指從植株根部露出土壤部分到植株最高處的株高。
先利用gen_binocular_rectification_map函數(shù)為map_image函數(shù)提供控制參數(shù),再通過map_image函數(shù)對采集到的圖像做校正處理,利用threshold函數(shù),fill_up_shape函數(shù)以及select等函數(shù)找出校正后圖像中植株的最低和最高點,利用intersect_lines_of_sight函數(shù),可獲得植株最低點和最高點的真實三維坐標,最后通過幾何運算得到雙目測量結(jié)果。
我們在圖像采集時就應該考慮到,攝像頭應該稍微帶一點俯拍的角度,保證左右兩幅圖像上最高處均為現(xiàn)實坐標中的最高處。切忌俯拍角度不可太大,否則由于拍攝角度而引起的像差會很大,對結(jié)果將會有很大的影響。
經(jīng)過以上幾步驟得到的三維坐標,常因各種原因而存在一定的誤差,需要進行誤差校正。我們對已知高度的對象進行了測量,得出結(jié)果如表1:
通過上述數(shù)據(jù)得出的修正關系如下:
y=-0.0002x2+1.0699x (3.1)
其相關系數(shù)R2=0.9993
4 實驗結(jié)果
我們對三種植物進行了測量得出的結(jié)果如下:
從測量結(jié)果中可以看出,修正后相對誤差控制在2%之內(nèi),可以接受。誤差引入的原因可能如下:
1、標定板的選擇決定了標定精度。一定要選用高精度的標定板,且標定板的大小應約為測量范圍1/3大小。
2、相機是圖像獲取的根本,高質(zhì)量的圖像離不開高分辨率相機,但是高分比率,高解析度的相機又會帶來成本上的提升。本文中,對于390.0mm左右的對象,1個像素的誤差可以帶入約0.4mm的實際誤差。
3、本文所采用的算法只能針對比較理想,比較直的植株,算法的不斷優(yōu)化,才能不斷減少誤差,提高精度。
5 結(jié)語
本文介紹了一種基于HALCON的,利用雙目視覺測量株高的方法。對于直立型植物,通過對立體匹配與三維信息恢復結(jié)果的誤差修正,其株高測量相對誤差不超過2%,方法具有一定的可借鑒性。
參考文獻
[1]章毓晉.計算機視覺教程 [M].北京: 人民郵電出版社,2011.
作者簡介
郝慧鵬(1988-),男,內(nèi)蒙古烏蘭察布人,碩士研究生,主要研究方向為計算機視覺技術在農(nóng)作物檢測上的應用。
指導老師
田躍(1956-),男,北京人,北京科技大學數(shù)理學院物理系教授,北京市弱磁檢測及應用工程技術研究中心副主任。
作者單位
關鍵詞:手伸及界面;定標;最小二乘法
一、引言
汽車已逐漸走進普通百姓家,“以人為本”的設計思想在汽車設計上日益受到重視。車輛駕駛室的品質(zhì)對于減輕駛乘人員的疲勞、預防職業(yè)病、提高人車系統(tǒng)的工作效率和行車安全有著重要作用,因而需要測量駕駛室內(nèi)駕駛員手伸及界面參數(shù)。普通的數(shù)碼相機對于量測用攝相機的測量缺陷(如物鏡畸變大等)已有較好的克服,一些新的算法的應用,也使測量精度有較大的提高;且數(shù)碼相機可以和計算機直接進行數(shù)據(jù)交換,進行數(shù)字圖像處理,所以普通數(shù)碼相機已常用于進行測量工作。
傳統(tǒng)的駕駛員手伸及界面參數(shù)的測量方法為手工測量,且占用駕駛員比較多的時間,本文提出了汽車駕駛員手伸及界面測量新方法,通過使用普通數(shù)碼相機來對駕駛室進行圖像信息采集,利用計算機視覺基本原理求取駕駛員手伸及界面相關參數(shù)。
二、基本原理
(一)線性模型攝像機定標
計算機視覺的研究目標是使計算機具有通過一幅或多幅圖像認知周圍環(huán)境信息的能力。利用數(shù)碼相機能較好地采集三維數(shù)字圖像,通過單個或多個數(shù)碼相機從不同方向拍攝的兩幅或兩幅以上二維圖像,從二維圖像中萃取出物體的三維信息。測量系統(tǒng)中大都采用小孔成像模型,其中數(shù)碼相機定標是實現(xiàn)三維測量的重要環(huán)節(jié)。
圖1為數(shù)碼相機定標模型。設空間坐標系為(X,Y,Z),數(shù)碼相機像平面的圖像坐標系為(u,v)。P為空間任一點,其三維物坐標為(x,y,z),在圖像平面上的像坐標為p1(u1,v1),p2(u2,v2)。數(shù)碼相機的物相關系如下:
XYZ10 0 0 0-u■X-u■Y-u■Z0 0 0 0XY Z 1-v■X-v■Y-v■Z?
M=u■m■v■m■①
式中i=1,2,實際計算中取mi34=1。 M=[millmi12...mi33]為系統(tǒng)變換矩陣中的元素,即11個線性定標參數(shù)。對每張圖片來說,有11個未知數(shù),而一對物體與圖像的對應點只能有4個方程組,因此至少需要6個控制點參與定標解算。
完成系統(tǒng)定標后根據(jù)②式,用系統(tǒng)變換矩陣M和被測點P在數(shù)碼相機像面上的坐標p1(u1,v1),p2(u2,v2),求P點的三維空間坐標(X,Y,Z)。
m■ -m■ u■ m■ -m■u■ m■-m■u■m■ -m■v■ m■ -m■v■ m■ -m■v■XYZ=u■ -m■v■ -m■②
(二)非線性模型攝像機定標
在實際工作時,當計算精度要求較高,且攝像機是使用數(shù)碼相機而非量測用攝像機時,在遠離圖像中心處會有較大的鏡頭畸變,線性模型不能準確地描述攝像機的成像幾何關系,因此采用非線性模型來描述。對于系統(tǒng)的畸變,已經(jīng)提出很多求取攝像機參數(shù)補償畸變的方法,Tsai提出攝像機兩步定標算法,使用一個直接的線性變換并且考慮了系統(tǒng)的徑向畸變,并指出:主點位置的細微變化不會對三維測量造成很大的影響。由于只考慮徑向畸變差,且只用到3次項,因而攝像機定標方程得到很大簡化。即:
Δu=(u-u0)(k1r2+k2r4+k4r6)
Δv=(v-v0)(k1r2+k2r4+k3r6)③
Weng考慮了含有徑向畸變和切向畸變補償模型,如④式所示
Δu=(u-u■)(k■r■+k■r■+k■r■)+t■(r■+2(u-u■)■)+2t■(u-u■)(v-v■)Δv=(v-v■)(k■r■+k■r■+k■r■)+t■(r■+2(v-v■)■)+2t■(u-u■)(v-v■)④
其中,r2=(u-u0)2+(v-v0)2,u0=-(m11m31+m12m32+m13m33)/(m231+m232+m233),v0=-(m21m31+m22m32+m23m33)/(m231+m232+m233),(u,v)是實際的圖像點坐標,Δu與Δv是非線性畸變值,它與圖像點在圖中的位置有關,(u0,v0)為像主點坐標,原點為CCD數(shù)字影像中心像元。由①式和④式可得兩個非線性方程組,對每張圖片來說,有16個未知數(shù),一對物體與圖像的對應點只能有4個方程組,因此至少需要8個控制點參與定標解算,可使用最小二乘原理平差。
(三)基于最小二乘法的攝像機定標
本實驗采用DLT(直接線性變換)定標算法直接求取定標矩陣的11個線性定標參數(shù),由于在采用Tsai和Weng方法后所得到的實驗解算結(jié)果差別不大,所以本文采用解算含有徑向畸變參數(shù)的Tsai方法,以11個線性定標參數(shù)作為初始值,其余補0,共14個初始值來解算,用迭代的方法來解算非線性模型攝像機定標的14個參數(shù)。
在測量汽車駕駛員手伸及界面參數(shù)時,對于部分距離較長線段的測量,其誤差總是比較大,無法達到測量精度要求。本文基于上面所述的方法,在得到含徑向畸變的14個定標參數(shù)后,用另一些未曾參與解算、分布均勻的控制點殘差和原本參與解算的控制點殘差進行誤差擬合,并內(nèi)插出控制點的像坐標改正值,用改正后像坐標重新進行解算,重復執(zhí)行,直到達到限值;以此來提高定標矩陣參數(shù)的精確度。
三、實驗結(jié)果和分析
實驗采用310萬相素精度的OLYMPUS數(shù)碼相機,定標物為三維黑白格子,大小為150mm*150mm*150mm,其中每個網(wǎng)格大小均為25mm*25mm。
采用單數(shù)碼相機,保持靶標和被測對象的相對位置不變,在兩個或兩個以上位置分別拍攝兩幅或兩幅以上二維圖像(本文解算使用兩幅圖像)。拍攝時,應盡量使相機繞以靶標為圓心的弧線上移動,即保持相機和靶標的距離相同;兩幅圖像間的拍攝角度應在20-50°,拍攝角度過低則二維圖像所含物體深度信息少,定標解算精度差,拍攝角度過高則兩幅圖像的場景差別大,空間點難匹配。
拍攝圖像時應盡可能選取光亮的場景,減少圖像的噪音;在選取圖像上點坐標前應對圖像進行數(shù)字圖像預處理,求取其邊緣圖像;選取圖像上測量點時,應盡量選在物體外形變化或物體的邊緣,手工選取圖像上的點坐標,簡單方便,可減少圖像點匹配誤差。
拍攝駕駛室內(nèi)圖片,處理后得到其邊緣圖像如圖2所示。選取“AB、CD、EF、GI”這4段線段來進行測量,包括其中一塊擋板的相對高度“AB”,擋板和座位中間的距離“CD”,方向盤的直徑“EF”,兩塊擋板間的距離“GI”(其他參數(shù)由于編幅關系沒有列出),如圖3所示。
求解數(shù)定標參數(shù)時,選取的定標物控制點應采用較強的分布圖形,即控制點均勻且充分覆蓋定標物圖像。
在實驗中采用Tsai方法(含有徑向畸變參數(shù))比采用DLT直接解算的測量結(jié)果有明顯改善,另外實驗還采用了Weng方法,解算含有徑向畸變和切向畸變的補償模型,解非線性方程組后對于距離較長線段的測量結(jié)果的誤差和采用Tsai方法所測量的誤差相差不大,而采用本文算法,對于較長距離線段有較好的實驗結(jié)果。實驗數(shù)據(jù)見表1。
實驗誤差分析:
定標物的誤差:定標物的制作不夠精細,打印的紙張無法精準達到預設的數(shù)值,則物點三維坐標值產(chǎn)生誤差。
圖像邊緣的誤差:邊緣檢測產(chǎn)生誤差,如方向盤由于拍攝角度的不同,使邊緣圖像的提取在兩張圖像產(chǎn)生差別。
測量的誤差:在量取擋板到座位之距離時,由于座位上是軟質(zhì)材料而產(chǎn)生變形,實際量取值產(chǎn)生誤差,但兩塊擋板間的距離由于邊緣提取準確,所以誤差較小。
算法的誤差:計算過程中計算機有舍入誤差,使得結(jié)果有偏差;用廣義逆矩陣解定標矩陣時,本身有誤差;優(yōu)化算法及最小二乘法都是取計算結(jié)果誤差最小的解,同樣存在誤差。
四、結(jié)論
采用數(shù)碼相機,不需專業(yè)的量測用攝影相機;利用已知尺寸的定標物對視覺系統(tǒng)定標,不需事先精確測定系統(tǒng)參數(shù)。該技術適合于測量時間緊拉、參數(shù)多的非接觸測量。
證明本文所提出的測量方法簡單、方便、快速,實用性強。
參考文獻:
1、馬頌德,張正友.計算機視覺-計算機理論與算法基礎[M].科學出版社,1997.
2、張靖瑜,董明得,呂乃光,鄧文怡.用廣義逆法解決攝影測量系統(tǒng)的非線性問題[J].北京機械工業(yè)學院學報,2001(1).
3、伍雪冬.計算機視覺中攝像機定標及位姿和運動估計方法的研究[D].湖南大學,2004.
4、龍興明.三維測量中的圖像處理技術研究[D].重慶師范大學,2005.
5、苗紅杰,趙文吉,劉先林.數(shù)碼相機檢校和攝像測量的部分問題探討[J].首都師范大學學報,2005(1).
6、蔡祥鵬,林建,張翔.基于數(shù)字圖像處理方法的三維測量[D].福建農(nóng)林大學,2007.
Discussion and practice on "image processing technology"
Zhang Yongmei, Ma Li, He Li
(School of Information Engineering, North China University of Technology, Beijing 100144, China)
Abstract: The disadvantages, the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning, application of modern teaching models and methods, strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects, improved the students' interest in learning and motivation to participate in scientific research, as well as the ability to solve practical problems.
Key words: teaching content; teaching method; assessment way; teaching practice
0 引言
圖像信息是獲取信息的重要來源,圖像處理研究對于科學理論研究和工程應用有重要影響。研究圖像處理和通信是導向智能計算機、智能機器人或多媒體通信系統(tǒng)的必由之路?,F(xiàn)有的圖像處理技術在很多方面給人們生活、學習、工作帶來極大的便利,如:視頻廣播、遙感圖像、醫(yī)學圖像(計算機X射線斷層掃描技術CT,以及核磁共振成像MRI)等,計算機的發(fā)展使處理更復雜的圖像成為可能。
圖像處理是計算機應用領域中的一個重要方面,是模式識別、計算機視覺、圖像通訊、多媒體技術等學科的基礎,是一門涉及多領域的交叉學科。在圖像處理技術課程的教學中,不但要讓學生掌握其基本概念和原理,還要讓不同層次的學生能夠理解和掌握圖像處理在其應用領域的最新發(fā)展,故傳統(tǒng)的常規(guī)教學已經(jīng)不能滿足課程的發(fā)展要求。目前的教學不足之處主要體現(xiàn)在:傳統(tǒng)的圖像處理技術教學大多數(shù)偏重于理論,缺乏圖像處理技術與實踐相結(jié)合的環(huán)節(jié)。本文結(jié)合計算機學科的特點和多年的教學經(jīng)驗,對圖像處理技術課程的教學模式與實踐進行了探討。
1 課程特點和教學內(nèi)容分析
人類通過眼、耳、鼻、舌、身接受信息,感知世界。約有75%的信息是通過視覺系統(tǒng)獲取的。圖像處理是利用計算機處理所獲取視覺信息的技術[1]。圖像處理技術的理論基礎涉及了眾多學科,包括數(shù)學、物理、信號處理和計算機科學等多個學科的知識,其內(nèi)容廣泛,理論抽象,不易理解。圖像處理技術還有很強的實用性,因此理論和實踐的結(jié)合是本課程的關鍵,注重基礎理論和技術的教學,以及加強學生實踐能力和課題研究能力的培養(yǎng)是本課程的主要教學目的。
圖像處理技術已經(jīng)成為眾多高校的一門重要課程,該課程主要介紹圖像的數(shù)學描述、圖像的數(shù)字化、圖像變換、圖像增強、圖像恢復、圖像編碼、圖像重建、圖像分割與邊緣提取、圖像的分析和識別等基本的圖像處理方法,使學生能熟練地掌握圖像處理的基本過程,并能應用這些基本方法開發(fā)圖像處理系統(tǒng)。通過這樣的內(nèi)容設置,使學生能夠真正掌握圖像處理技術的基本思想和技術,為深入學習打下堅實基礎[2]。
2 教學環(huán)節(jié)的探討和實踐
2.1 教材的選用和自主學習擴充性資料的選用
圖像處理技術發(fā)展日新月異,雖然該課程已經(jīng)有很多可選教材,但大部分教材內(nèi)容比較陳舊,許多新的算法,新的思想都沒有提到,學生無法從這些教材中獲取圖像處理最新的技術和發(fā)展趨勢,因此我們選擇了章毓晉編著、清華大學出版社的《圖像工程》系列教材。該教材全面介紹了圖像工程的第一層次――圖像處理,圖像工程的第二層次――圖像分析,圖像工程的第三層次――圖像理解的基本概念、基本原理、典型方法、實用技術以及國際上相關研究的最新成果。同時我們要求學生將國外的經(jīng)典圖像處理的書籍作為參考書目,如:Rafael C Gonzalez主編的《Digital Image Processing》,并建議學生關注圖像處理的一些重要期刊和國際會議,如:IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、電子學報、CT理論與應用研究、模式識別與人工智能等。這樣學生能熟悉一些專業(yè)術語,了解最新的前沿動態(tài),并具備一定的英文文獻閱讀能力,為今后的科研和工作打下了堅實基礎。
要求學生自主學習一些最新方法和技術,例如,深入分析中華人民共和國設計制造的玉兔號月球車的結(jié)構(gòu),給出玉兔號月球車如何通過全景相機、測月雷達、粒子激發(fā)X射線譜儀、紅外光譜儀等儀器,對月表進行三維光學成像、紅外光譜分析,開展月壤厚度和結(jié)構(gòu)科學探測,對月表物質(zhì)主要元素進行現(xiàn)場分析等探測的原理和方法。又例如,探討將遙感圖像應用于5.12汶川大地震的方法,2008年5月14日上午,中國科學院的兩架高性能遙感飛機飛赴汶川,對地震災區(qū)開展遙感監(jiān)測和災情評估工作,這兩架飛機可分別提供高分辨率光學和雷達圖像,具有全天候快速獲取大面積災情數(shù)據(jù)的能力,探討如何根據(jù)汶川地震前、后圖像,給出建筑物、河流、山體等關鍵區(qū)域的變化檢測結(jié)果,為國務院和相關部門的抗震救災工作提供咨詢服務和決策依據(jù)。
2.2 采用現(xiàn)代化教學模式與方法
為了使復雜的算法和抽象的知識更加形象化,便于學生理解和提高學習興趣,我們充分運用現(xiàn)代電子技術、工具和方法,采用多媒體形式進行課堂教學,利用VC、MATLAB編寫一些典型的圖像處理程序,并在課堂上演示這些程序,增加了課堂的信息量,提高了學生的學習興趣,激發(fā)了學生自主學習,同時也為實驗環(huán)節(jié)的開展奠定了一定的編程基礎[3]。
此外,我們深入分析MOOCs、SPOCs以及“翻轉(zhuǎn)課堂”教學模式等國際流行教育新概念,嘗試開展圖像處理技術的MOOCs,包括從課堂教學、學生學習進程、學生的學習體驗、師生互動過程等教與學過程的完整系統(tǒng)在線實現(xiàn)。MOOCs是一個改變學習方式的時代產(chǎn)物,受到全球各地的重視。國內(nèi)教育部三個教指委(計算機類專業(yè)、軟件工程專業(yè)、計算機課程)2013年底專門召開會議研討MOOCs。我們建立了校內(nèi)MOOCs平臺并對學生開放,將其作為課堂外學習的有效補充,這樣可以方便學生隨時隨地學習,或者進行預習和復習。我們嘗試了結(jié)合圖像處理技術的MOOCs,探索創(chuàng)新教學模式與方法,穩(wěn)步提高教學質(zhì)量。
2.3 加強實踐教學
圖像處理技術可以廣泛應用于數(shù)字電視、視頻通話、宇宙探測、自然災害預測、環(huán)境污染的監(jiān)測、氣象云圖等應用領域,而教材一般只涉及到理論知識和算法,或者是對應用的簡單介紹,對其設計實現(xiàn)介紹得很少,所以必須加強實踐教學,將理論與實踐結(jié)合起來,使理論指導實踐,實踐加強理論[4-5]。要求學生利用VC或者MATLAB進行實際程序設計,培養(yǎng)學生分析問題、解決問題的能力,具備圖像處理系統(tǒng)的開發(fā)能力。
根據(jù)課程的教學要求設置了四個課外實驗。①圖像變換實驗。要求對輸入的圖像,分別采用傅里葉變換、離散余弦變換、小波變換進行圖像變換,分別給出變換前后的圖像,并分析圖像變換前后的視覺效果。②圖像增強實驗。將給定的圖像進行增強處理,要求至少使用線性變換增強、對數(shù)變換增強、指數(shù)變換增強以及偽彩色增強處理,分析增強后的視覺效果。③圖像編碼實驗。將給定的圖像進行壓縮處理,要求采用 Huffman編碼方法,并計算壓縮比。分析圖像壓縮后的視覺效果,并對圖像壓縮效果進行客觀評價。④圖像分割與邊緣提取實驗。分別利用邊緣檢測法、閾值分割法進行圖像分割;分析圖像分割后的視覺效果。學生完成所有實驗后,我們安排了實驗指導課,解決學生在實驗中遇到的問題,進一步提高學生的算法設計能力和編程能力。
在課程教學中,我們還安排了三次專題討論課,由教師指定具體題目,學生通過查閱相關文獻,深入分析基本原理和方法,設計相應的算法,編程實現(xiàn),并給出實驗結(jié)果及分析,充分調(diào)動學生學習的積極性,提高學生利用理論知識解決實際問題的能力。三次專題討論課分別是:
⑴ 數(shù)字圖像表示及其處理專題討論課。題目為:用VC或者Matlab實現(xiàn)常見圖像文件格式的顯示;常見的圖像文件格式,以及用VC或者Matlab實現(xiàn)圖像格式轉(zhuǎn)換;給出國內(nèi)外先進的圖像處理系統(tǒng)軟、硬件,名稱、作用,以及先進性的體現(xiàn)。
⑵ 圖像變換專題討論課。題目為:給出小波變換常用的小波基的基本原理、具體應用,以及用VC或者Matlab的具體實現(xiàn);給出小波變換、脊波變換、子波變換的基本原理、具體應用,用VC或者Matlab的具體實現(xiàn);給出小波變換以及小波變換在圖像處理中的具體應用,以及用VC或者Matlab的具體實現(xiàn);給出快速傅里葉變換算法的具體內(nèi)容,以及時間復雜度或者運行時間的分析。
⑶ 圖像編碼專題討論課。題目為:給出小波變換圖像編碼的基本思想與特點,編碼中需要解決的問題,實驗結(jié)果及分析;給出基于感興趣區(qū)域的小波圖像編碼方法的基本思想,具體步驟,實驗結(jié)果及分析;給出幾種圖像編碼質(zhì)量評價方法,具體實現(xiàn),實驗結(jié)果及分析;給出基于子波變換的圖像編碼基本思想與特點,具體步驟,實驗結(jié)果及分析。
此外,鼓勵學生積極參與本校教師主持的科研項目,如國家自然科學基金、863項目、科技支撐計劃,以及北京市自然科學基金等項目。這些項目涉及到視音頻檢索、視音頻理解、視音頻處理、網(wǎng)絡信息分析、文字處理、信息檢索、網(wǎng)絡行為分析、圖像識別等研究方向。通過參與項目,系統(tǒng)地鍛煉了學生的科研能力和思維創(chuàng)新能力,也為今后的科研工作打下了堅實基礎。
2.4 改革考核評價方式
考核是對學生學習成果的檢驗,考核目標不僅要檢驗學生對課堂教學內(nèi)容的掌握程度,而且要對提高學生發(fā)現(xiàn)問題、思考問題、解決問題的能力起到作用。為了避免出現(xiàn)平時不努力,考前突擊的情況,我們對傳統(tǒng)的考核方式進行了改革。本課程的考核由兩部分組成:平時成績(占30%)和期末考試成績(70%)。將平時的上課出勤、作業(yè)、實驗和專題討論成績列入平時成績。在整個教學過程中,嚴格要求學生,使學生重視教學的各個環(huán)節(jié)。
關鍵詞:刑事模糊圖像 Retinex算法 增強
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9416(2012)11-0133-01
數(shù)字圖像技術的發(fā)展給刑事科學技術工作帶來了極大的方便,刑事圖像技術也由傳統(tǒng)的刑事照相技術發(fā)展為成熟的數(shù)字刑事圖像技術。新時期的刑事圖像技術學致力于刑事科學技術的光學成像研究和刑事圖像處理研究,模糊圖像的處理是刑事圖像處理工作中極具挑戰(zhàn)性的難題。
1、刑事模糊圖像形成因素
模糊圖像處理是對由于介質(zhì)、客觀環(huán)境等因素造成的模糊圖像和退化圖像進行校正處理,使其清晰化,以利于圖像研判。刑事圖像的模糊有多種因素造成:一是非正確曝光退化,如非線性退化等;二是離(散)焦模糊,對焦不實使物體不能清晰的成像于焦平面上;三是運動模糊,運動模糊是指在曝光瞬間,照相機與被攝物體間有相對運動;四是噪聲干擾致使圖像模糊不清;五是監(jiān)控視頻模糊,如安裝位置不合適、光線太暗或太亮、目標運動過快、攝像鏡頭對焦不實等,往往使影響資料變得模糊不清。
2、Retinex算法原理及應用特性
2.1 Retinex理論概述
Retinex(視網(wǎng)膜“Retina”和大腦皮層“Cortex”的縮寫)理論是一種建立在科學實驗和科學分析基礎上的基于人類視覺系統(tǒng)(Human Visual System)的圖像增強理論。該算法的基本原理模型最早是由Edwin Land(埃德溫·蘭德)于19世紀70年代提出的一種被稱為具有顏色恒常性的色彩理論,并在顏色恒常性的基礎上提出的一種基于此理論的圖像增強方法。Retinex 理論的基本內(nèi)容包括物體的顏色是由物體對長波(紅)、中波(綠)和短波(藍)光線的反射能力決定的,而不是由反射光強度的絕對值決定的;物體的色彩具有一致性,不受光照非均性的影響,即Retinex 理論是以色感一致性(顏色恒常性)為基礎的。鑒于Retinex原理,對于觀察圖像S中的每個點(x,y),用公式可以表示為:
S(x,y)=R(x,y).L(x,y)
其中,S(x,y)為所觀察的圖像,R(x,y)是反射物體圖像,L(x,y)為入射光圖像。
2.2 Retinex算法的應用特點
Retinex理論的基本思想就是將原始圖像看成是由照射圖像和物體反射屬性組成,照射光圖像直接決定一幅圖像中像素能夠達到的動態(tài)范圍,物體反射屬性決定了圖像的內(nèi)在性質(zhì),因此,在原始圖像中去除或降低照射圖像的影響從而保留本質(zhì)的反射屬性是Retinex理論的基本思想。Retinex算法具有銳化、顏色恒常性、動態(tài)范圍壓縮大、色彩逼真度高等特點。
傳統(tǒng)的圖像增強算法,如線性變換、非線性變換、圖像銳化等只能增強圖像的某一類特征,如壓縮圖像的動態(tài)范圍,或增強圖像的邊緣等。Retinex算法可以在動態(tài)范圍壓縮、邊緣增強和顏色恒常三方面達到平衡,因此可以對各種不同類型的圖像進行自適應性地增強。
3、Retinex算法對數(shù)字模糊圖像處理的適用
3.1 Retinex算法對圖像的預處理
在多種以Retinex為核心的算法中,單尺度(Single-Scale Retinex,SSR)算法和多尺度(Multi-Scale Retinex, MSR)算法是最具有代表性和最成熟的算法。利用多尺度Retinex灰度圖像增強算法對灰度圖像進行增強,在圖像的預處理階段對噪聲進行濾除,做到改善圖像顏色恒常性,壓縮圖像動態(tài)范圍,提高對比度,有效顯示淹沒在陰影、光照等區(qū)域中的細節(jié),為下一步的特征提取提供必要的條件。
3.2 Retinex算法對場景模糊圖像的增強
場景的干擾常常致使物體成像模糊,如雨霧天條件下,戶外景物的對比度和顏色發(fā)生退化,計算機視覺系統(tǒng)無法正確檢測與跟蹤場景中目標,這就需要對雨霧天圖像或視頻作清晰化處理。Retinex 理論及相關算法是圖像增強的新思路,其理論基礎是色彩的恒常性,它通過模擬人眼觀察場景的方式,恢復因圖像采集設備限制而丟失的場景細節(jié),達到增強圖像對比度,還原物體真實色彩的目的。
3.3 Retinex算法對圖像細節(jié)特征的增強
在圖像處理和計算機視覺領域,特征提取被廣泛運用,其效果很大程度上取決于圖像的質(zhì)量。圖像在采集的過程中,多變的光照條件、物體間相互遮擋、采集設備自身限制等因素都會影響圖像質(zhì)量,要想對質(zhì)量差的圖像進行特征提取非常困難?;赗etinex理論的圖像增強算法能減少計算時間,將多種計算函數(shù)相結(jié)合,能夠有效地重建圖像細節(jié)達到增強圖像的目的,使增強后的圖像更適合于細節(jié)特征的提取。
Retinex算法是數(shù)字圖像處理的新算法,與其他傳統(tǒng)圖像處理算法相比,具有很大的優(yōu)勢,能大量保留提取圖像的細節(jié)特征。在刑事圖像處理工作中,技術人員所感興趣的就是對偵破案件有用的細節(jié)特征。刑事圖像工作遇到的問題及其產(chǎn)生原因都是其他領域圖像處理所共有的,因此,Retinex理論同樣適用于刑事圖像處理研究,將基于Retinex理論的各種改進的Retinex算法直接應用到刑事模糊圖像處理工作中,勢必會給當前的刑事模糊圖像處理工作打開新的局面。
參考文獻
[1]李權(quán)合,畢篤彥,時平,何宜寶.基于Retinex和視覺適應性的圖像增強[J].中國圖形圖像學報,2010,15(12):1728-1732.
[2]喬小燕,姬光榮,陳霧.一種改進的全局Re tinex圖像增強算法及其仿真研究[J].系統(tǒng)仿真學報,2009,21(4):1185- 1197.