視覺技術(shù)在人工智能體系中有很重要的地位,人工智能落地應(yīng)用主要有圖像識(shí)別、語音合成、機(jī)器翻譯等感知類任務(wù)上的應(yīng)用和產(chǎn)業(yè)應(yīng)用場(chǎng)景。
視覺技術(shù)又可分計(jì)算機(jī)視覺和機(jī)器視覺,應(yīng)用場(chǎng)景的不同是計(jì)算機(jī)視覺和機(jī)器視覺的最根本差別。
計(jì)算機(jī)視覺模擬人眼的功能,而且更重要的是使計(jì)算機(jī)完成人眼所不能勝任的工作。而機(jī)器視覺則是建立在計(jì)算機(jī)視覺理論基礎(chǔ)之上,偏重于計(jì)算機(jī)視覺技術(shù)的工程化,能夠自動(dòng)獲取和分析特定的圖像,以控制相應(yīng)的行為。
與計(jì)算機(jī)視覺所研究的視覺模式識(shí)別、視覺理解等內(nèi)容不同,機(jī)器視覺技術(shù)重點(diǎn)在于感知環(huán)境中物體的形狀、位置 、姿態(tài) 、運(yùn)動(dòng)等幾何信息 。兩者基本理論框架、底層理論、算法相似,只是研究的最終目的不同。所以計(jì)算機(jī)視覺一般情形普遍適用,而機(jī)器視覺更多用于工業(yè)上。
計(jì)算機(jī)視覺在落地場(chǎng)景上應(yīng)用較多,現(xiàn)在已擴(kuò)展到新興領(lǐng)域,例如汽車、醫(yī)療保健、零售、機(jī)器人、農(nóng)業(yè)、無人機(jī)和制造業(yè)等。
一個(gè)典型的視覺應(yīng)用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊。
視覺技術(shù)通過機(jī)器代替人眼進(jìn)行測(cè)量和判斷,其精準(zhǔn)識(shí)別比人眼更具準(zhǔn)確性,尤其隨著深度學(xué)習(xí)、3D視覺技術(shù)、高精度成像技術(shù)和機(jī)器視覺互聯(lián)互通技術(shù)的持續(xù)發(fā)展,機(jī)器視覺的性能優(yōu)勢(shì)將進(jìn)一步加大,發(fā)展前景可期。
而在企業(yè)領(lǐng)域則更多應(yīng)用于考勤打卡,但眼考勤云通過計(jì)算機(jī)視覺SDC/SDK技術(shù),賦能攝像頭,精準(zhǔn)捕捉人像,與數(shù)據(jù)庫(kù)圖像進(jìn)行特征比對(duì)計(jì)算,識(shí)別身份打卡。
其次,通過機(jī)器視覺變身智慧前臺(tái),使攝像頭能自動(dòng)識(shí)別訪客登記,通知來訪人員,實(shí)現(xiàn)無人值守智慧前臺(tái),企業(yè)更加智能化!
無論是計(jì)算視覺還是機(jī)器視覺,都是視覺技術(shù)的發(fā)展和延伸,也是人工智能范疇重要的前沿分支之一,隨著我國(guó)各行各業(yè)對(duì)采用圖像和視覺技術(shù)的工業(yè)自動(dòng)化、智能需求開始廣泛出現(xiàn),視覺技術(shù)逐步開始了工業(yè)現(xiàn)場(chǎng)的應(yīng)用,市場(chǎng)規(guī)模將會(huì)進(jìn)一步擴(kuò)大,迎來快速增長(zhǎng)期。
未來,視覺技術(shù)將進(jìn)一步發(fā)展,有望落地更多的行業(yè)和產(chǎn)業(yè),帶來產(chǎn)業(yè)的升級(jí)轉(zhuǎn)型,促進(jìn)企業(yè)的智能化發(fā)展。
機(jī)器視覺。
視覺技術(shù)在人工智能體系中有很重要的地位,人工智能落地應(yīng)用主要有圖像識(shí)別、語音合成、機(jī)器翻譯等感知類任務(wù)上的應(yīng)用和產(chǎn)業(yè)應(yīng)用場(chǎng)景。
視覺技術(shù)又可分計(jì)算機(jī)視覺和機(jī)器視覺,應(yīng)用場(chǎng)景的不同是計(jì)算機(jī)視覺和機(jī)器視覺的最根本差別。
學(xué)習(xí)計(jì)算機(jī)視覺需要具備的知識(shí)儲(chǔ)備有:
1、圖像處理的知識(shí)。圖像處理大致包括的內(nèi)容:光學(xué)成像基礎(chǔ)、顏色、濾波器、局部圖像特征、圖像紋理、圖像配等。
2、立體視覺的知識(shí)。立體視覺大致包括的內(nèi)容:相機(jī)幾何模型、雙目視覺、從運(yùn)動(dòng)中恢復(fù)物體結(jié)構(gòu)、三維重建技術(shù)等。
3、人工智能的知識(shí)。人工智能大致包括的內(nèi)容:場(chǎng)景理解與分析、模式識(shí)別、圖像搜索、數(shù)據(jù)挖掘、深度學(xué)習(xí)等。
4、與計(jì)算機(jī)視覺相關(guān)的學(xué)科還有:機(jī)器視覺、數(shù)字圖像處理、醫(yī)學(xué)成像、攝影測(cè)量、傳感器等。
1、博士學(xué)歷,計(jì)算機(jī)、電子信息、軟件或自動(dòng)化等相關(guān)專業(yè);
2、計(jì)算機(jī)視覺領(lǐng)域內(nèi)的領(lǐng)軍人才,在行業(yè)內(nèi)有較大影響力,對(duì)專業(yè)技術(shù)有深入的研究和見解,有戰(zhàn)略性的思維和能力;
3、 有很強(qiáng)的研究、工程落地能力;
4、5年以上計(jì)算機(jī)視覺相關(guān)領(lǐng)域工作經(jīng)驗(yàn),具備主導(dǎo)計(jì)算機(jī)視覺項(xiàng)目研發(fā)的實(shí)踐經(jīng)驗(yàn);
5、 具備強(qiáng)烈的創(chuàng)新精神和能力,具備較強(qiáng)的抗壓能力,具備優(yōu)秀的溝通能力和豐富的團(tuán)隊(duì)管理經(jīng)驗(yàn)。
「計(jì)算機(jī)視覺」(也叫「機(jī)器視覺」),就是在機(jī)器眼睛的后面安上大腦。這是一個(gè)讓計(jì)算機(jī)能看懂圖像的過程。任務(wù)分為:采集圖像(攝像頭、數(shù)字相機(jī))→圖像處理(計(jì)算機(jī))→*控制設(shè)備(機(jī)械手臂、警報(bào)器或者反饋到下一個(gè)處理單元)當(dāng)然,控制設(shè)備不總是必要的,取決于我們?cè)趺词褂糜?jì)算機(jī)告訴我們的信息。我們不再滿足能用更舒適的角度看到汽車周圍的來往車輛,還希望汽車告訴我們,前方有障礙,需要減速。不再滿足于能在監(jiān)控后面看著各個(gè)路口擁擠的車輛,還希望計(jì)算機(jī)告訴我們,這個(gè)路口已達(dá)到紅色級(jí)別擁堵,預(yù)計(jì)通過時(shí)間一個(gè)小時(shí)。不再滿足于攝像頭能幫我們?cè)谇Ю镏饪粗依锏膵雰汉屠先?,還希望能在他們遇到困惱的時(shí)候,計(jì)算機(jī)第一時(shí)間向相關(guān)的人和機(jī)構(gòu)發(fā)出警報(bào)。讓機(jī)器能真正「看見」,這就是「計(jì)算機(jī)視覺」研究的目的。
就業(yè)前景很好。
隨著人工智能產(chǎn)業(yè)升溫,計(jì)算機(jī)視覺行業(yè)有望邁向新的發(fā)展階段,市場(chǎng)規(guī)模將加速擴(kuò)張。樂觀預(yù)計(jì),未來幾年,計(jì)算機(jī)視覺行業(yè)年均增長(zhǎng)率可維持在30%左右,前景廣闊。
計(jì)算機(jī)視覺是指研究使機(jī)器具有“看”的能力的一門技術(shù)。計(jì)算機(jī)視覺在未來的行業(yè)發(fā)展中屬于前景行業(yè),但并不意味著畢業(yè)后就一定可以找到工作,除了在學(xué)校好好學(xué)習(xí)外,還要及時(shí)了解企業(yè)的崗位需求,以及對(duì)企業(yè)招聘要求也應(yīng)了如指掌,成為滿足企業(yè)要求的人才,要先人一步。
講計(jì)算機(jī)視覺之前,先和大家簡(jiǎn)單區(qū)分一下兩個(gè)概念“機(jī)器視覺”和“計(jì)算機(jī)視覺”,這兩個(gè)技術(shù)都是通過對(duì)圖像的獲取、處理、結(jié)合人工智能算法,實(shí)現(xiàn)機(jī)器/計(jì)算機(jī)的“看到”、“看懂”之目的,都可以劃分到人工智能行業(yè)。機(jī)器視覺通過CMOS和CCD攝取圖像,主要用于工業(yè),包括物體定位、特征檢測(cè)、缺陷判斷、目標(biāo)識(shí)別、計(jì)數(shù)和運(yùn)動(dòng)跟蹤。計(jì)算機(jī)視覺比機(jī)器視覺更加復(fù)雜,通過各種成像系統(tǒng)(包括視頻)獲取圖像信息,由計(jì)算機(jī)代替人腦觀察理解,做出判斷和決策。
接下來,重點(diǎn)講解計(jì)算機(jī)視覺(ComputerVision,CV)。CV是AI細(xì)分領(lǐng)域目前最大的一個(gè)分支,2017年國(guó)內(nèi)市場(chǎng)規(guī)模約為15.45億元,2019年約60億元,2022年有望達(dá)到146億元(數(shù)據(jù)來源:網(wǎng)絡(luò)資料整理)。在CV領(lǐng)域,我國(guó)無論在市場(chǎng)空間,還是在技術(shù)上都處于領(lǐng)先地位。目前CV應(yīng)用最大的領(lǐng)域是安防,其次是金融和手機(jī),也正在逐漸滲透到娛樂、家居、交通(包括自動(dòng)駕駛)、醫(yī)療等領(lǐng)域。計(jì)算機(jī)視覺行業(yè)根據(jù)技術(shù)層級(jí)從上到下,分為基礎(chǔ)層、技術(shù)層和應(yīng)用層?;A(chǔ)層最靠近“云”,應(yīng)用層最靠近“端”。借用下圖吧。
注:圖片來源網(wǎng)絡(luò),侵刪
CV界(算法)四大獨(dú)角獸分別是曠視科技、依圖科技、商湯科技、云從科技,這四家公司分別成立于2012/2013/2014/2015年。女孩子們最熟悉的美圖秀秀技術(shù)就來源于曠視科技。在安防領(lǐng)域落地項(xiàng)目較多的是云從和依圖,都分別和20-30個(gè)省份的城市有合作。在手機(jī)領(lǐng)域,商湯和曠世的落地項(xiàng)目更多,都和oppo、vivo、小米等手機(jī)品牌有合作。
從技術(shù)流程上看,CV識(shí)別分為六個(gè)過程:圖像獲取、預(yù)處理、圖片分割、特征提取、機(jī)器判別、建模、應(yīng)用。
注:圖片來源網(wǎng)絡(luò),侵刪
第一步鏡頭獲取圖像后的一系列的動(dòng)作都是由計(jì)算機(jī)完成,其中數(shù)據(jù)量、運(yùn)算力和算法模型是決定CV最終輸出結(jié)果速度、準(zhǔn)確率等的關(guān)鍵因素;這三者也是各CV公司之間競(jìng)爭(zhēng)的核心。
之后會(huì)發(fā)文分享CV細(xì)節(jié)。
計(jì)算機(jī)視覺(Computer vision)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指用攝影機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,用計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀式。計(jì)算機(jī)視覺,圖像處理,圖像分析,機(jī)器人視覺和機(jī)器視覺是彼此緊密關(guān)聯(lián)的學(xué)科,在很大程度上針對(duì)圖像的內(nèi)容。
數(shù)位繪圖板是必備工具,另外掃描儀也是常用工具。軟件有很多種,如果是3D效果的,常會(huì)用到3DMax和MAYA,但要結(jié)合Photoshop、painter等軟件做貼圖和最終效果,如果是平面手繪風(fēng)格,??捎玫降能浖衟ainter、Photoshop,矢量圖效果可用illustrator或coreldraw等。這些軟件都可結(jié)合數(shù)位繪圖板進(jìn)行創(chuàng)作。
如果是做3D效果,需要的繪圖板精讀更高,更貴一些。
鼠標(biāo)還是算了,除非是專門追求稚拙的鼠繪效果,要想做出很細(xì)膩很漂亮的CG作品,還是買個(gè)繪圖板吧。
先學(xué)好基礎(chǔ)的再玩高級(jí)的吧,這些做起來都不簡(jiǎn)單的
屬于計(jì)算機(jī)專業(yè)。
計(jì)算機(jī)視覺是用機(jī)器人代替人眼進(jìn)行測(cè)量和判斷,是模式識(shí)別研究的一個(gè)重要方面。計(jì)算機(jī)視覺通常分為低層視覺與高層視覺兩類,低層視覺主要執(zhí)行預(yù)處理功能,如邊緣檢測(cè)、移動(dòng)目標(biāo)檢測(cè)、紋理分析,以及立體造型、曲面色彩等,主要目的是使得看見的對(duì)象更突出。這時(shí)還不是理解階段。高層視覺主要是理解對(duì)象,需要掌握與對(duì)象相關(guān)的知識(shí)。