前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇計算機視覺傳達技術(shù)范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

自從機場服務(wù)機器人投入展覽后,一直是該展區(qū)的熱門展項,駐足圍觀的游客絡(luò)繹不絕。對機器人的表現(xiàn),游客也是褒貶不一。有些游客對機器人的精彩表演連連稱贊;有些則認為機器人反應(yīng)遲緩、顯得笨重,相比人類的表現(xiàn),令人失望。
識別這些行李對于機器人來說是不是很困難?機器人在視覺方面能否做得更好,能否識別更復雜的對象?它們的目力能否超過人類?它們究竟能看到什么?
這些問題將我們引向了一個新興的熱門領(lǐng)域:計算機視覺。計算機視覺是人工智能的子學科,而人工智能則是仿生學的一種。人工智能旨在模仿人(有時也包括其他動物)的行為和思維,而計算機視覺將模仿的對象集中在了人眼上,即模仿人“看”的行為。換言之,計算機視覺是一門利用攝影機和計算機代替人眼進行圖像獲取、目標識別、跟蹤、測量、理解和處理的學科。作為一門交叉學科,計算機視覺與許多學科有重要聯(lián)系:機器學習、神經(jīng)生物學、認知科學、信號處理(圖像處理)等。在后面的介紹中,這些學科間的聯(lián)系將變得更加清晰。
眼睛是人體獲取外界信息最重要的傳感器。它高速、準確、信息量大,為人的決策和行為提供了豐富的信息。同樣,計算機視覺系統(tǒng)作為人工智能體的一個感知器,也常常為決策提供了最重要的信息。那么,一個理想的計算機視覺系統(tǒng)究竟完成了什么任務(wù),又給智能體提供了怎樣的信息呢?
讓我們來舉一個簡單的例子。你走進一家咖啡店,發(fā)現(xiàn)你的好友彼得坐在角落里,雙手托著下巴,一臉的不愉快。于是,你決定走過去安慰一下。假如完成該任務(wù)的不是人類而是機器人,則要由其計算機視覺系統(tǒng)獲取圖像,然后對該圖像進行處理,并得到以下信息:1.這是好友彼得;2.他看上去很沮喪。這兩條信息被傳遞給決策器,后者隨即做出了走過去安慰的計劃,計劃則最終被四肢等效應(yīng)器執(zhí)行。
對人來說,這個過程再簡單、自然不過,但對于計算機視覺系統(tǒng)來說,卻是個相當復雜的過程。對該圖像進行處理的過程中,計算機分別完成了三個層次的任務(wù):初級視覺、中級視覺和高級視覺。這樣的分類方式不僅和視覺任務(wù)的復雜程度有關(guān),也和人類在完成這些任務(wù)時所涉及到的視神經(jīng)和腦神經(jīng)部位有關(guān)。在以下的篇幅中我們將介紹一些分別屬于這三個層次的典型的計算機視覺任務(wù)。
初級視覺
現(xiàn)代數(shù)字成像技術(shù)使計算機視覺成為可能。利用CCD或CMOS等感光原件,可獲得數(shù)字化的圖像。一般來說,對像素進行處理的任務(wù)即屬于初級視覺。在挖掘出圖像中包含的信息時,首先需要對圖像進行一些處理,以便能夠執(zhí)行更高級的任務(wù)。圖像的主體和背景之間、同一表面上不同的材質(zhì)和顏色之間等都會形成邊界,從圖像中提取出邊、角、點等特征能幫助計算機理解圖像,并利用濾波的方式進行邊界特征提取。像濾波這樣的信號處理方法在初級視覺中被廣泛應(yīng)用,除了特征提取外,還有降噪、平滑等。
圖像上各種顏色的像素并不是隨機分布的,它們一般都在圖像上形成一定含義的組合。比如,草地是由綠色的像素拼合成的,而天空是由大量的藍色像素組成的。找到這樣的具有相同屬性的像素形成的像素塊稱為分割。當然,提取邊界可以幫助分割圖像,但是簡單地把所有的邊界分割出的區(qū)域都作為具有相同屬性的像素塊是否正確呢?這正是圖像分割最具有挑戰(zhàn)性的。比如一副斑馬圖片,計算機如何知道斑馬的嘴不是背景的一部分呢?這就涉及到了圖像的語義。在給圖像進行初級分割后,更精確的分割任務(wù)就要交給中級或高級視覺了。
人類有兩只眼睛,同樣,機器人也可以通過安裝兩個經(jīng)過標定的攝像頭來實現(xiàn)雙目視覺,從而實現(xiàn)測距,即分辨物體在三維空間中的位置。上文的例子中,雙目視覺可以依據(jù)透視原則和遮擋的關(guān)系來幫助視覺系統(tǒng)確定彼得所坐的位置,比如在第二張桌子和第三張桌子之間。
中級視覺
中級視覺是建立在初級視覺的計算結(jié)果上的。在執(zhí)行中級視覺任務(wù)時,不僅使用了實時的初級視覺計算結(jié)果,還結(jié)合了一定的視覺經(jīng)驗。舉個簡單的例子,平時生活中我們所看到的,被桌上的杯子遮擋的部分也是桌子的一部分;上文斑馬深色的口鼻部并非背景的一部分,而是斑馬的一部分。事實上,這些結(jié)合經(jīng)驗的視覺任務(wù)可以首先被應(yīng)用到分割任務(wù)中。中級視覺中的分割不再是僅僅依靠顏色將圖像分為若干個像素塊,而是產(chǎn)生更有意義、更精確的分割,這樣的分割不是僅靠邊界提取就能夠?qū)崿F(xiàn)的。分割算法不計其數(shù),常用的有類聚的方法、基于特征向量的方法、基于圖論的方法、期望最大化、概率的方法(貝葉斯方法)等。
在經(jīng)驗的幫助下,視覺系統(tǒng)可以通過擬合的方式來解釋甚至糾正圖像中的變形或缺失。比如,根據(jù)經(jīng)驗桌子的邊一般是直的,則視覺系統(tǒng)在提取到桌子的部分邊緣或拐點后,就可以用直線來擬合被遮擋而缺失的部分,或因攝像頭的棱鏡引起的失真。這樣,機器人在走向彼得時就能避免撞到桌子。
經(jīng)驗也并非是絕對正確的,此刻看到的也許是經(jīng)驗中所缺失的。通過一個加權(quán)的概率模型,視覺系統(tǒng)可以將目前觀察到的圖像和經(jīng)驗中的數(shù)據(jù)結(jié)合起來,從而對未來的狀態(tài)做一個預測。這樣的方法常常被用于跟蹤,也就是在一幀幀連續(xù)播放的畫面中,根據(jù)目標在以前和目前圖像中的位置來預測目標在未來圖像中的位置。比如高速公路上的車輛跟蹤系統(tǒng),系統(tǒng)用從對象上提取出的特征點(紅色)來定位目標。視覺跟蹤常用的算法有卡爾曼濾波器、非線性動態(tài)模型等。
目前的中級計算機視覺研究受到了心理學和認知科學的影響。比如格式塔心理學對基于經(jīng)驗和認知整體的中級視覺有較大貢獻。
高級視覺
也許高級視覺才是計算機視覺中最有趣的一部分,因為它是人類視覺中至今還無法被完全解密的部分(也許連部分解密都談不上)。當你站在雜亂、昏暗的酒桌前,從看到的圖像中識別出沮喪的彼得時,整個過程只需要0.3秒。事實上,現(xiàn)代處理器的運算速度遠遠高于人類視神經(jīng)和大腦中神經(jīng)突觸的信息傳遞速度。但人類視覺的功能是如此的強大,以至于計算機視覺系統(tǒng)遠遠不能達到人類的水平。較新的研究表明,人類發(fā)達的視覺系統(tǒng)得益于一套大規(guī)模并行計算系統(tǒng)──不計其數(shù)的神經(jīng)元形成的視覺通路,它就像一張有無數(shù)節(jié)點的計算網(wǎng)絡(luò),信息在其中往返傳遞。
高級視覺任務(wù)幾乎都圍繞著兩個字展開:識別。識別是給對象貼上標簽的過程,即給對象附上含有語義的名稱或描述。這是一種高級的視覺活動,需要學習、聯(lián)想等更高級的大腦活動的參與。拿圖像的分割任務(wù)來說,圖像不僅被分割成獨立的像素塊,視覺系統(tǒng)還為每個像素塊貼上“標簽”,比如“窗子”、“桌子”、“酒瓶”、“彼得的臉”等。通過模板比對,視覺系統(tǒng)將彼得的臉和經(jīng)驗中的圖像聯(lián)系了起來,從而引起了系統(tǒng)的興趣。從彼得的臉上提取的特征中,視覺系統(tǒng)還解讀出了彼得的沮喪。于是在隨后的圖像中,視覺系統(tǒng)都將注意力放在了彼得的臉上,試圖跟蹤該對象。視覺系統(tǒng)在繼續(xù)跟蹤的同時,將從圖像中得到的信息發(fā)送給決策器。
即使是當代最成功的算法和視覺系統(tǒng)都無法像人類一般高效地識別物體。對我們來說,識別 “一個瓷杯”處于不同狀態(tài)似乎并不怎么困難,但對計算機視覺系統(tǒng)來說卻不容易。杯子可以有不同的擺放姿勢、不同的光照強度和顏色、出現(xiàn)在畫面中的不同位置、可能有的部分被遮擋,如果按不同狀態(tài)就是不同的杯子這一點來判斷,那就可能誤判為存在不計其數(shù)的各式各樣的杯子(即外觀的區(qū)別)。在絕大多數(shù)計算機視覺系統(tǒng)中,目標都被要求符合一些限制條件,否則,計算機視覺將成為不可能的任務(wù)。由此可見,在雜亂、昏暗的酒桌一角發(fā)現(xiàn)彼得對計算機視覺系統(tǒng)來說是多不容易的一件事情。
對人類來說,識別并非與生俱來的本領(lǐng)。嬰兒睜大眼睛看著陌生的世界,他們的視覺實踐是從測距、分割開始的。幼兒幾乎每時每刻都在努力學習如何給圖片貼標簽。他們學習得很快,低齡兒童不僅可以成功地識別物品,還可以在一定程度上察言觀色,感受到由表情傳達的情緒。通過獎勵和帶教,可以加速兒童的學習過程。
通過這樣的啟發(fā),高級視覺還將依賴機器學習這門學科。機器學習是研究如何通過算法讓計算機實現(xiàn)人類的學習過程,從而讓計算機不僅能夠?qū)崿F(xiàn)簡單枯燥的任務(wù),還能夠向智能邁進一步。作為人工智能領(lǐng)域的核心學科,機器學習如百家爭鳴,不斷取得著新的成績。當今重要的機器學習算法有人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、支持向量機、貝葉斯網(wǎng)絡(luò)、強化學習等。
至今,計算機視覺系統(tǒng)最為成功的案例,莫過于手寫數(shù)字識別。MNIST是使用最廣泛的手寫數(shù)字庫,為各類識別算法提供了一比高下的平臺。MNIST中含有七萬幅邊長為28個像素的圖像。目前最出色的識別算法一般都可以達到1%以內(nèi)的錯誤率。然而,MNIST只是對目標的外觀做了有限多的變化,并沒有涉及到有如杯子在不同狀態(tài)下的各種變化。而且,28×28=784個像素的圖片實在很小,如果處理普通大小的照片,視覺系統(tǒng)的運算量就會呈指數(shù)級增長,甚至讓超級計算機都無能為力。
對此,麻省理工學院媒體實驗室的科學家埃爾?卡利歐比認為,無法回應(yīng)人的感情,是計算機的一大硬傷,因為這樣一來,用戶有許多需求將無法得到滿足,要想讓計算機做出有效的回應(yīng),用戶不得不費一番工夫輸入相關(guān)指令。
為了消弭人與計算機之間的這道鴻溝,埃爾?卡利歐比發(fā)明了一系列技術(shù),使計算機能夠識別人們發(fā)自內(nèi)心的各種肢體語言,包括面部表情等等。有了這些技術(shù),計算機有朝一日將成為人們更加得力的左膀右臂。
表情識別
埃爾?卡利歐比并不是第一個試圖建立面部表情數(shù)據(jù)庫的研究人員,但她不像其他人那樣,僅僅止步于讓計算機識別實驗室里記錄在案的那六種頗為夸張的基本表情,而是讓它“琢磨”人們在日常生活中不經(jīng)意間流露出來的種種不易察覺的細微表情?!耙牍タ诉@個難關(guān),我們必須推動計算機視覺和機器學習領(lǐng)域的尖端研究?!卑?卡利歐比表示。
為了將這個難題化整為零,各個擊破,她在人的臉上做了24處標記,然后訓練了一臺計算機,讓它識別人們在做不同的表情(比如皺眉)時,這24塊臉部肌肉發(fā)生的變化。埃爾?卡利歐比在六大洲征集了成千上萬名志愿者,這些志愿者用電腦自帶的攝像頭拍下了他們觀看視頻時的面部表情,然后將拍下來的照片發(fā)給埃爾?卡利歐比。這些照片匯集起來,共同組成了她所說的世界上最大的面部表情數(shù)據(jù)庫。
眼鏡和腕帶
在這項技術(shù)投入試驗應(yīng)用的早期階段,研究人員發(fā)明了一款內(nèi)置攝像頭的眼鏡,這款眼鏡能夠幫助那些有情緒識別障礙的患者讀懂別人的心情。比方說當你戴著眼鏡同別人交談時,如果對方感到無聊,鏡片上的小燈管就會發(fā)出某種顏色的燈光,將這個信息傳達給你。
據(jù)說埃爾?卡利歐比自己就在把玩一款頭戴式攝像機,無論是在實驗室里還是在日常生活中,她都與之形影不離,每次都會把這款攝像機藏在她的頭巾里。
埃爾?卡利歐比還開發(fā)了一款腕帶,這款腕帶能夠測量皮膚電傳導性,這項指標與情緒激發(fā)有關(guān),因此可用于實時監(jiān)測腕帶佩戴者的焦慮程度。
應(yīng)用現(xiàn)狀
到目前為止,面部識別技術(shù)主要用于幫助廣告商家更好地了解廣告對于觀眾產(chǎn)生的影響。研究人員在網(wǎng)上召集了數(shù)量龐大的志愿小組,這些小組的成員允許研究人員跟蹤記錄他們在觀看廣告時的面部表情,并對得到的數(shù)據(jù)進行分析。但是從長遠上講,埃爾?卡利歐比還是希望自己的技術(shù)能夠走進課堂,幫助老師們判斷什么樣的教學材料在學生當中反響最好。
國內(nèi)外網(wǎng)站設(shè)計差距
國外用戶在網(wǎng)站風格上不習慣艷麗、花哨的色彩和網(wǎng)站建設(shè)風格,他們比較鐘情于簡潔、平淡而嚴謹?shù)娘L格,即使許多大型網(wǎng)站建設(shè)也是這種風格。國外網(wǎng)站在首頁頁面上通常不會放置太多內(nèi)容,也很少放置廣告,他們傾向于將首頁做成各類功能、板塊的引導界面,即使有內(nèi)容表現(xiàn),也是比較簡潔的,不超過2屏,完全不像國內(nèi)網(wǎng)站喜歡堆積大量廣告和內(nèi)容。國外傳統(tǒng)網(wǎng)站比較講究網(wǎng)站的實用性和便利性,他們會花很多時間去制作很多周到實用的細節(jié),功能雖然大多平實但很有效。國外網(wǎng)站對安全性的要求非常高,許多服務(wù)和功能都需要進行安全連接,而國內(nèi)只有交易、銀行等網(wǎng)站才會注意到。
國內(nèi)網(wǎng)絡(luò)文化建設(shè)相對滯后,目前國內(nèi)網(wǎng)頁設(shè)計中最突出的問題就是用色。把國內(nèi)網(wǎng)站和國外網(wǎng)站放在一起做比較,我們不得不承認國外網(wǎng)站的結(jié)構(gòu)設(shè)計以及用色的水平!國外網(wǎng)站很講究用色的度,決不胡亂用色,而整體配色的協(xié)調(diào)性與風格的一致性都恰到好處,相比之下,國內(nèi)站點在設(shè)計中都將這些因素忽略掉了,網(wǎng)頁顏色數(shù)量過多、互不相干的兩種色彩放在一起、搭配不協(xié)調(diào),缺乏統(tǒng)一的風格,而網(wǎng)站的設(shè)計人員,設(shè)計思路受到上司和客戶的制約,尤其在專業(yè)公司更存在這種現(xiàn)象,既要有優(yōu)秀的設(shè)計,又要符合客戶的口味,實際工作中也有一定的難度。網(wǎng)絡(luò)產(chǎn)生的根本在于經(jīng)濟的推動,但只有能產(chǎn)生美感的設(shè)計才能吸引用戶的注意,并且必須同時注重形式和內(nèi)容。部分網(wǎng)頁的設(shè)計確實很注重形式上的美,使得觀賞者能夠被其第一外表吸引,但細細品味卻味如嚼蠟,毫無滋味。再有一些設(shè)計者使用統(tǒng)一的規(guī)格要求的空間模板,使得制作和內(nèi)容的排布能更加規(guī)范。但是這樣的方式會使得整個網(wǎng)頁設(shè)計缺乏創(chuàng)造性和獨立性。清一色的版式不會給用戶帶來任何視覺上的美感,反而會使人產(chǎn)生厭煩情緒,從而使網(wǎng)頁的宣傳性起到適得其反的效果。
多媒體技術(shù)在網(wǎng)站設(shè)計應(yīng)用中面臨的問題
多媒體藝術(shù)與技術(shù)的結(jié)合還處于發(fā)展階段。目前的多媒體藝術(shù)已經(jīng)有了一定的技術(shù)支持,不僅結(jié)合了聲音、圖像、視頻、文字的超級文本,可以鏈接到無窮無盡的其他文本之中,還可以由多種路徑進入,展示給人們的是它無處不在的交互性。多媒體藝術(shù)的主要特征體現(xiàn)在如下幾點:第一,具有很強的虛擬性。通過多媒體藝術(shù)可以進行虛擬性表現(xiàn)或構(gòu)建一些非真實的幻想。盡管這種幻想是虛構(gòu)且不真實的。第二,具有深刻的觀念性。藝術(shù)家通過聲音藝術(shù)、錄像藝術(shù)、互動裝置以及攝影藝術(shù)來傳達的視聽藝術(shù)或者說用視聽語言來表詞達意,增加觀者的感官意識;第三,具有廣泛的公共性。多媒體藝術(shù)利用電影、電視、錄像、互聯(lián)網(wǎng)等多種手段積極地投入到大眾文化與消費文化之中,對公共文化具有極強的影響力;其四,具有很強的時效性與流行性。多媒體藝術(shù)多善于抓住某些大眾比較感興趣的娛樂性新聞、文化熱點等比較時髦的話題來進行及時的快捷性的報道與傳播,它的藝術(shù)符號極易與流行文化接軌,從而成為一種非常具有先鋒性與前衛(wèi)感的藝術(shù)樣式。但目前一些藝術(shù)家在創(chuàng)作過程中受到多種因素的限制,有的是因為趕不上多媒體技術(shù)發(fā)展的步伐,也有的是因藝術(shù)家自身學科性的問題,對于一些創(chuàng)意構(gòu)思不能通過網(wǎng)絡(luò)編程或軟件編程的技術(shù)實現(xiàn),因而并不能將多媒體藝術(shù)的特點發(fā)揮到極致,因而要想使多媒體藝術(shù)這一新興的藝術(shù)形式與現(xiàn)有的藝術(shù)形式更好的結(jié)合,只有通過不斷的探索和實踐。
我國多媒體藝術(shù)經(jīng)歷了從局部到整體、從單一到多元化、從模仿到原創(chuàng)的發(fā)展過程,正在步入全面快速發(fā)展的新階段?,F(xiàn)代多媒體藝術(shù)是當代信息科學技術(shù)與藝術(shù)相結(jié)合的產(chǎn)物,多媒體技術(shù)對于多媒體藝術(shù)來說是非常重要的,不但增加了藝術(shù)表現(xiàn)形式,而且實現(xiàn)了很多傳統(tǒng)方法無法實現(xiàn)的特效,更重要的是它提高了創(chuàng)作的實效??稍僭趺粗匾募夹g(shù)也只是手段,僅僅是創(chuàng)作者手中的工具,它可以建構(gòu)出多媒體藝術(shù)的“形”,但是多媒體藝術(shù)獨特的“神”則需要探索和創(chuàng)新。如果沒有藝術(shù)工作者的大腦,那么這個“神”是再發(fā)達的電腦技術(shù),再精端的設(shè)備也創(chuàng)作不出來的。多媒體藝術(shù)在今后的發(fā)展中將更加貼近我們的學習、工作和生活,它將是我們以后信息交流的重要手段。隨著現(xiàn)代科技的飛速發(fā)展,多媒體技術(shù)將融入更多新的技術(shù),以后的發(fā)展前景將更加廣闊,內(nèi)容將更加豐富?,F(xiàn)在它的技術(shù)改進、創(chuàng)新都跟計算機技術(shù)的發(fā)展密切相關(guān)。多媒體藝術(shù)依附于多媒體技術(shù)的發(fā)展,具有無限的生命力。今天的多媒體藝術(shù)還處在一個雛形階段,有待我們更具創(chuàng)造性的去思考和塑造。
多媒體應(yīng)用于網(wǎng)站制作一直是多媒體應(yīng)用的一個重要方面。由于多媒體的傳輸涉及到聲音、圖像、視頻以及數(shù)據(jù)等多個方面,由于多媒體網(wǎng)絡(luò)的視頻傳輸主要有兩種形式:一是采用MPEG-1和MPEG-2壓縮(也就是VCD和DVD)的傳輸方式,另一種是視頻會議的形式,因而多媒體寬帶傳輸網(wǎng)絡(luò)的應(yīng)用還是很多的,主要包括遠程教學、視頻點播、以及各種多媒體信息在網(wǎng)絡(luò)上的傳輸。因此需要寬頻帶,但目前國內(nèi)條件的限制網(wǎng)絡(luò)傳輸頻帶還不能適應(yīng)多媒體的發(fā)展要求,因此,在這方面的多媒體應(yīng)用發(fā)展受到了一定的限制。目前網(wǎng)絡(luò)發(fā)展的目標是盡可能的使多媒體用戶可以通過現(xiàn)有的電話網(wǎng)、有線電視網(wǎng)絡(luò)實現(xiàn)交互式寬帶傳輸網(wǎng)絡(luò)。
多媒體技術(shù)的發(fā)展方向
多媒體技術(shù)的應(yīng)用可以從高端研究型應(yīng)用和普及型應(yīng)用兩個方面來分析。高端研究型應(yīng)用:指的是新一代信息系統(tǒng)的建立。這一新的信息系統(tǒng)是以互聯(lián)網(wǎng)為基礎(chǔ)的,是一種第二代的高速互聯(lián)網(wǎng),它既可以集合各種媒體全方位信息,又具有高性能計算的能力,能夠?qū)崿F(xiàn)機器與人的實時交互功能等等。最具代表性的便是美國宇航局聯(lián)合26個國家的研究人員所進行的國際合作空間站的研究、計算機集成制造系統(tǒng)應(yīng)用等。普及型應(yīng)用:主要是網(wǎng)絡(luò)、計算機與一些家用電器的結(jié)合??赡軙鄳?yīng)出現(xiàn)兩個方向來實現(xiàn)這種結(jié)合。一是計算機向音頻、視頻的應(yīng)用方向來推進,例如微軟總裁比爾.蓋茨提出的“維納斯”計劃;另一個是音頻、視頻向計算機方面的推進,具有代表性的就是Sony公司在多媒體游戲方面的創(chuàng)新。
關(guān)鍵詞:遠程監(jiān)控;安全管理;橋梁工程
1項目簡介
長山大橋是遼寧省、大連市重點交通工程項目之一,東北地區(qū)第一座真正意義的跨海大橋。項目全長3.38公里,建設(shè)特大橋1座1.79公里,采用雙向四車道一級公路標準,主橋采用雙塔雙索面三跨預應(yīng)力混凝土矮塔斜拉橋,主跨260米為國內(nèi)目前同類型結(jié)構(gòu)最大跨徑,引橋跨徑布置為25×50米,現(xiàn)澆預應(yīng)力混凝土連續(xù)箱梁。
2遠程監(jiān)控技術(shù)的提出
由于大橋施工受地理位置、氣候條件等各種因素影響,施工安全風險很大。為向各界參觀人士展示施工情況,實時監(jiān)控并記錄特殊工序施工過程,確保施工安全,實施音視頻監(jiān)控系統(tǒng)集成工程,將計算機網(wǎng)絡(luò)和通信技術(shù)、視頻壓縮技術(shù)、決策支持系統(tǒng)等現(xiàn)代高技術(shù)融為一體,以對施工全過程進行跟蹤、監(jiān)測,實現(xiàn)信息化的施工管理。
3關(guān)鍵技術(shù)
(1)激光夜視技術(shù):激光照明角度要求大小可變,可以單獨遠程控制,也可以與變焦攝像機同步變化,保持照明角度與成像視場角一致。(2)遠程視頻監(jiān)控技術(shù):圖像信號可在局域網(wǎng)、互聯(lián)網(wǎng)上傳送,在每臺授權(quán)終端上都可直接觀看施工現(xiàn)場情況,某些特定終端可對各監(jiān)控前端進行攝像機云臺控制(具有較高權(quán)限的用戶)。(3)橋墩防撞預警:結(jié)合大橋的實際情況,利用全球領(lǐng)先的計算機視覺技術(shù)支持的智能化行為分析來實現(xiàn)對橋墩防撞預警。(4)指揮對講及廣播:項目辦、總監(jiān)辦、項目部在各自辦公室實現(xiàn)三方對講,并可對施工現(xiàn)場進行廣播,指導工作。
4解決方案
4.1視頻監(jiān)控
結(jié)合項目辦、總監(jiān)辦、項目部的具體管理需求,以全覆蓋、無死角為原則,設(shè)置監(jiān)控點,監(jiān)控點的設(shè)置數(shù)量可根據(jù)大橋建設(shè)進展情況及相關(guān)管理部門要求進行擴展和調(diào)整。將所有監(jiān)控信號,傳送到施工單位監(jiān)控中心,使施工單位在辦公室就能了解監(jiān)控點現(xiàn)場施工的情況。通過互聯(lián)網(wǎng)專線將監(jiān)控信號傳輸?shù)酱髽蝽椖哭k、總監(jiān)辦等監(jiān)督管理部門,這樣大橋項目辦、總監(jiān)辦等就可以在施工現(xiàn)場之外了解大橋監(jiān)控點的情況。
4.2橋墩防撞預警
用視頻攝像機獲取當前海面視頻圖像,設(shè)定船只過界報警區(qū)域,利用設(shè)備內(nèi)嵌的智能分析功能模塊,采用圖像智能分析識別技術(shù),全天候?qū)ΡO(jiān)控區(qū)域海面進行異常事件檢測,當發(fā)現(xiàn)過界行駛船舶立即發(fā)出聲光報警,提醒其離開報警區(qū)域,并將報警信息(時間、照片等)上傳到監(jiān)控中心。當有異常事件發(fā)生時,監(jiān)控中心的智能管理軟件會發(fā)出語音報警,提示當前發(fā)生異常事件的地點及事件類型。同時客戶端上自動全屏彈出報警視頻畫面,便于監(jiān)控中心人員進行報警確認和事件應(yīng)急處理。
4.3指揮對講及廣播
在項目辦、總監(jiān)辦、項目部監(jiān)控中心分別設(shè)置對講設(shè)備,根據(jù)施工管理需要,在大橋施工相關(guān)區(qū)域共安裝7只室外防水音柱。
4.4網(wǎng)絡(luò)連接
為了解決信息遠程傳輸?shù)膯栴},需要向當?shù)仉娦胚\營商租用專線,根據(jù)每路圖像占用0.5M的帶寬計算,同時訪問全部八路視頻需要帶寬4M,月租費為2400元左右。
5投資結(jié)算
硬件系統(tǒng)建設(shè)費用33.4萬元,光纖接入費用6萬元,其他費用0.6萬元,共計40萬元。
6經(jīng)濟效益分析
公路橋梁施工項目在高峰時期,線路長,作業(yè)點多,如果不采用遠程監(jiān)控系統(tǒng),而是全部用安全員來進行安全管理的話,基本上每個作業(yè)點都要有安全員巡視。對于長山大橋施工單位來說,在南北岸引橋施工各1名、兩個主墩各1名、后場加工區(qū)1名,再加上安全工作負責人和內(nèi)業(yè)員的話,至少需要7名安全管理人員,這7名安全管理人員的費用每年大約50萬元(保守估計),工期4年,總共需要花費200萬元。而現(xiàn)實情況更加殘酷,目前行業(yè)內(nèi)專業(yè)安全管理人員的數(shù)量遠遠滿足不了實際需要和政策的要求(每5000萬元造價配備一名安全員,長山大橋投資5.79億)。應(yīng)用遠程監(jiān)控技術(shù),施工單位只需要在現(xiàn)場配置2名巡視安全員即可,安全部長在辦公室全面觀察現(xiàn)場,發(fā)現(xiàn)問題直接聯(lián)系安全員去處理,甚至可以直接通過廣播喊話來解決問題。項目辦和總監(jiān)辦也可以這樣做。遠程監(jiān)控系統(tǒng)一次性投資40萬元,施工單位4名安全管理人員(安全部長1人,現(xiàn)場巡視員2人,內(nèi)業(yè)員1人)4年的費用大約為112萬元,相比之下節(jié)約了四分之一的費用,更是解決了安全管理人員不足的問題。
7技術(shù)特點總結(jié)
(1)監(jiān)管更具實效性與針對性。工程管理人員可隨時掌握施工現(xiàn)場的安全狀況,及時發(fā)現(xiàn)事故苗頭,消除安全隱患,甚至直接通過廣播進行指揮,擬補了現(xiàn)場監(jiān)督管理的一些缺陷和不足。隨著無線寬帶技術(shù)的推廣與應(yīng)用,更可使高層管理者們出差途中隨時了解工地進展情況。(2)降低安全管理成本,提高管理效率。為了安全管理不留死角,必須有足夠數(shù)量的安全管理人員來分擔安全管理任務(wù),由于遠程監(jiān)控系統(tǒng)一個人就可以宏觀監(jiān)控全局,并及時傳達信息,這樣就可以適當減少現(xiàn)場安全員的數(shù)量,提高管理效率。(3)便于對已發(fā)生的事故進行調(diào)查、分析、處理。施工過程被錄像存儲備份,可隨時查看監(jiān)控信息,對已發(fā)生的事故進行調(diào)查分析。
8結(jié)語
關(guān)鍵詞:ROS;機器人;Ubuntu
20世紀以來隨著電子技術(shù)的不斷發(fā)展及人類對于自身的不斷了解,機器人的研究也在不斷深入?,F(xiàn)階段雖能做出外表、走路等接近人類的機器人,但這些都屬于前沿領(lǐng)域,研究門檻高,實際的商業(yè)用途不是很廣,所以大多還停留在樣品階段,走進市場的很少。借助互聯(lián)網(wǎng)和智能手機的大潮,嵌入式處理器正在完成以前臺式處理器做不到的事情,于是現(xiàn)階段機器人又被重新定義。在目前的消費領(lǐng)域,某些配備智能處理器和具有互聯(lián)網(wǎng)功能的產(chǎn)品也被認為是機器人,如圖1所示的兩款國內(nèi)廠家生產(chǎn)的機器人產(chǎn)品。圖1所示的機器人屬于生活工具類,一般放置在家中,無法自行移動,采用嵌入式處理器,帶有攝像頭、無線網(wǎng)絡(luò)模塊、顯示模塊,可以連接手機,通過手機App對機器人進行相關(guān)設(shè)置,同時機器人攝像頭采集到的圖像也能實時傳給手機,和手機進行語音對講。機器人還帶有語音識別模塊,若向它詢問“明天天氣如何”,他會從網(wǎng)絡(luò)獲取天氣信息然后作出回答。這些放置在家中的機器人也可以實現(xiàn)安全監(jiān)測的功能,通過手機實時查看家中的監(jiān)控影像或通過適配各種傳感器以實時洞悉,比如貼在門窗后面的加速度傳感器,當門窗被動作時傳感器給機器人發(fā)出信號,機器人隨即通過設(shè)定的方式進行報警。
圖2所示為兩款國外生產(chǎn)的機器人,其最主要的特點是可以運動,屬于智能玩具的范疇。這些機器人可以連接智能手機,通過手機對機器人進行設(shè)置,然后把手機當做機器人的操作桿,操作其做出各種運動,達到娛樂的目的。同時,機器上裝有攝像頭,可以在手機上同步看到機器人攝像頭拍攝到的視頻畫面。但也有一些創(chuàng)新,如左邊的機器人在星戰(zhàn)電影里有原形,用手機攝像頭對準該機器人,通過手機端的AR技術(shù),在手機屏幕里可以給機器人加上各種效果,增加娛樂性。
還有一些具有特殊用途的機器人,如掃地機器人,其根據(jù)內(nèi)部的路徑算法清潔地面,同時能自動避開障礙物,并于電量即將耗盡時自動返回充電樁充電。
今后服務(wù)機器人的趨勢會是以上列舉的這些機器人的集大成者,即在軟件智能和C械運動方面不斷發(fā)展。軟件智能通過高性能的嵌入式處理器實現(xiàn)視頻處理、網(wǎng)絡(luò)連接和語音識別等技術(shù)。機械運動則先搭配單片機和步進電機,通過輪子的滾動實現(xiàn)移動,通過增加機械零件和改進算法來逐步實現(xiàn)動物甚至人體的肢體行走。圖3所示框圖列出了實現(xiàn)具有該功能機器人需要采用的技術(shù)。
高性能嵌入式處理器上運行著機器人的核心系統(tǒng)。攝像頭采集視頻圖像,并對圖像中的事物進行一些簡單判別,如識別人臉,對靜態(tài)事物的圖像采集也能讓機器人辨別障礙物,或計算出靜態(tài)事物的大致幾何圖形甚至尺寸。對動態(tài)事物的圖像采集,機器人可以計算出動態(tài)事物的運動軌跡甚至速度。4G和WiFi&BT模塊屬于無線通信模塊,有了無線通信機器人才能得到自身之外的更多信號,并將自身的信息傳達給別人。語音識別模塊能讓機器人識別聲音,顯示&觸摸屏只是機器人與外界交互的一種方式,GPS模塊能讓機器人知道自己的位置信息,存儲模塊除了存儲機器人的系統(tǒng)和各類軟件外,也能讓機器人具有記憶功能。攝像頭采集視頻圖像并計算,計算結(jié)果可以存儲在存儲模塊中,當遇到類似的計算時就可以判別事物,通過網(wǎng)絡(luò)模塊將這類信息傳遞出去分享給更多的機器人。單片機管理著機器人各類基礎(chǔ)模塊,步進電機控制機器人的運動,各類傳感器讓機器人有了感知外界環(huán)境的能力。紅外模塊可以實現(xiàn)對一些外部電器的操控,電池和電池管理模塊為整個機器人的運轉(zhuǎn)提供能量。
硬件結(jié)構(gòu)是實現(xiàn)服務(wù)機器人運算和控制的基礎(chǔ),在高性能嵌入式處理器上運行的操作系統(tǒng)進行服務(wù)機器人具體的運算和控制,相當于機器人的靈魂。目前主流的三大機器人操作系統(tǒng)有Ubuntu,Android和ROS。Android軟件平臺使用較廣泛,ROS為專用的機器人軟件平臺。要實現(xiàn)對服務(wù)機器人的運算和控制,軟件平臺需要解決以下問題:
(1)分布式計算現(xiàn)代機器人系統(tǒng)往往需要多個計算機同時運行多個進程,當多個機器人需要協(xié)同完成一個任務(wù)時,需要互相通信來支撐任務(wù)完成;用戶通過臺式機、筆記本或者移動設(shè)備發(fā)送指令控制機器人,而人機交互接口可以認為是機器人軟件的一部分。
(2)軟件復用隨著機器人研究的快速推進,誕生了一批應(yīng)對導航、路徑規(guī)劃、建圖等通用任務(wù)的算法。當然,任何一個算法實用的前提是其能夠應(yīng)用于新的領(lǐng)域,且不必重復實現(xiàn)。
(3)快速測試為機器人開發(fā)軟件比其他軟件開發(fā)更具有挑戰(zhàn)性,主要是因為調(diào)試準備時間長,且調(diào)試過程復雜。何況受硬件維修、經(jīng)費有限等條件限制,未必隨時有機器人可供使用。
ROS作為機器人專用的軟件平臺,可在ARM搭配Ubuntu的環(huán)境下運行,對服務(wù)機器人的運算和控制進行了諸多優(yōu)化,大大增強了其實用性。
(1)點對點設(shè)計
一個使用ROS的系統(tǒng)包括一系列進程,這些進程存在于多個不同的主機并且在運行過程中通過端對端的拓撲結(jié)構(gòu)進行聯(lián)系。雖然基于中心服務(wù)器的那些軟件框架也可以實現(xiàn)多進程和多主機的優(yōu)勢,但在這些框架中,當各電腦通過不同的網(wǎng)絡(luò)進行連接時,中心數(shù)據(jù)服務(wù)器就會出現(xiàn)問題。
ROS的點對點設(shè)計以及服務(wù)和節(jié)點管理器等機制可以分散由計算機視覺和語音識別等功能帶來的實時計算壓力,適應(yīng)多機器人遇到的挑戰(zhàn)。點對點設(shè)計示意如圖4所示。
(2)多語言支持
在寫代碼時,許多編程者會比較偏向某一些編程語言。這些偏好是個人在每種語言的編程時間、調(diào)試效果、語法、執(zhí)行效率以及各種技術(shù)和文化的原因?qū)е碌摹榻鉀Q這些問題,我們將ROS設(shè)計成語言中立性框架結(jié)構(gòu)。ROS現(xiàn)在支持許多種不同的語言,如C++、Python、Octave和LISP,同時還包含其他語言的多種接口實現(xiàn)。
(3)精簡與集成
大多數(shù)已經(jīng)存在的機器人軟件工程包含了可以在工程外重復使用的驅(qū)動和算法,不幸的是,由于多方面的原因,大部分代碼的中間層都過于混亂,以至于很難提取出它的功能,也很難把它們從原型中提取出來應(yīng)用到其他方面。
為了應(yīng)對這種趨勢,我們鼓勵將所有的驅(qū)動和算法逐漸發(fā)展成為和ROS沒有依賴性單獨的庫。ROS建立的系統(tǒng)具有模塊化的特點,各模塊中的代碼可以單獨編譯,而且編譯使用的CMake工具使它很容易的就實現(xiàn)精簡的理念。ROS將復雜的代碼封裝在庫里,只創(chuàng)建一些小的應(yīng)用程序為ROS顯示庫的功能,允許對簡單代碼超越原型進行移植和重新使用。作為一種新加入的優(yōu)勢,當代碼在庫中分散后單元測試也變得非常容易,一個單獨的測試程序可以測試庫中很多的特點。
(4)工具包豐富
為了管理復雜的ROS軟件框架,利用大量小工具來編譯和運行多種多樣的ROS組建,從而設(shè)計成了內(nèi)核,而非構(gòu)建一個龐大的開發(fā)和運行環(huán)境,示意圖如圖5所示。
(5)免費并且開源
計算機技術(shù) 計算機安全 計算機維護 計算機理論 計算機軟件 計算機網(wǎng)絡(luò) 計算機畢業(yè)論 計算機英語 計算機畢業(yè) 計算機病毒 紀律教育問題 新時代教育價值觀