在工業(yè)應(yīng)用領(lǐng)域當(dāng)中,機(jī)器視覺(jué)技術(shù)不僅提升生產(chǎn)效率,還能夠改善產(chǎn)品品質(zhì),為制造業(yè)提供全新的應(yīng)用機(jī)會(huì)。本文探討機(jī)器視覺(jué)與電腦視覺(jué)技術(shù)的差異,以及其應(yīng)用如何驅(qū)動(dòng)工業(yè)領(lǐng)域邁向新格局。
@文/
根據(jù)市場(chǎng)研究機(jī)構(gòu)的數(shù)據(jù),全球機(jī)器視覺(jué)市場(chǎng)預(yù)計(jì)將以每年7.4%的復(fù)合年增長(zhǎng)率(CAGR)增長(zhǎng),到2030年市場(chǎng)規(guī)模將達(dá)到172億美元。隨著工業(yè)4.0的推動(dòng),機(jī)器視覺(jué)市場(chǎng)呈現(xiàn)出強(qiáng)勁的增長(zhǎng)態(tài)勢(shì)。
隨著消費(fèi)者對(duì)產(chǎn)品質(zhì)量的要求不斷提升,制造商對(duì)精確且快速的品質(zhì)檢驗(yàn)需求也隨之增加。機(jī)器視覺(jué)技術(shù)能夠在生產(chǎn)過(guò)程中自動(dòng)檢測(cè)產(chǎn)品缺陷,避免瑕疵品進(jìn)入市場(chǎng),從而提升產(chǎn)品品質(zhì)并降低召回風(fēng)險(xiǎn)。
機(jī)器視覺(jué)與電腦視覺(jué)的差異
在當(dāng)今科技迅速發(fā)展的背景下,機(jī)器視覺(jué)(Machine Vision;MV)與電腦視覺(jué)(Computer Vision;CV)這兩個(gè)技術(shù)概念經(jīng)常被提及。盡管兩者在技術(shù)層面有許多相似之處,均涉及影像處理與分析技術(shù),但它們?cè)趹?yīng)用范疇和目的上其實(shí)有顯著的差異。
電腦視覺(jué):模擬人類視覺(jué)的技術(shù)
從電腦視覺(jué)的核心目標(biāo)是如何讓電腦模擬人類的視覺(jué)系統(tǒng),理解并處理數(shù)位影像資料,包括即時(shí)偵測(cè)、追蹤及辨識(shí)模組的設(shè)計(jì)、3D立體視覺(jué)、增擬實(shí)境等,它涵蓋人工智慧(AI)、機(jī)器學(xué)習(xí)(ML)、統(tǒng)計(jì)方法及其他工程和電腦科學(xué)等多領(lǐng)域。這項(xiàng)技術(shù)廣泛應(yīng)用於自動(dòng)駕駛、醫(yī)學(xué)影像處理、監(jiān)控系統(tǒng)等許多領(lǐng)域。電腦視覺(jué)的應(yīng)用場(chǎng)景包括即時(shí)偵測(cè)、追蹤及辨識(shí)模組的設(shè)計(jì)、3D立體視覺(jué)、增擬實(shí)境等,這些技術(shù)幫助系統(tǒng)理解和解讀復(fù)雜的視覺(jué)數(shù)據(jù)。

圖一 : 電腦視覺(jué)技術(shù)與機(jī)器視覺(jué)技術(shù)的關(guān)系(source:維基百科;SmartAuto繪圖) |
|
從技術(shù)層面來(lái)看,電腦視覺(jué)建立能夠從圖像或多維資料中取得「資訊」的人工智慧系統(tǒng)。以O(shè)penCV為例,這個(gè)功能強(qiáng)大的程式庫(kù)與Python語(yǔ)言兼容,更容易與AI技術(shù)整合,適用於物件偵測(cè)、車牌辨識(shí)、工業(yè)自動(dòng)光學(xué)檢測(cè)(AOI)、醫(yī)學(xué)影像處理和視頻監(jiān)控等多種領(lǐng)域。藉由Python套件實(shí)現(xiàn)許多醫(yī)學(xué)影像的讀取與寫(xiě)入,以及與搭配OpenCV使用實(shí)現(xiàn)相關(guān)的影像分割等算法,進(jìn)一步提高了影像辨識(shí)的準(zhǔn)確性。
電腦系統(tǒng)可以存取大量源自智慧型手機(jī)、交通攝影機(jī)、安全系統(tǒng)和其他裝置或由其建立的影像和影片資料。電腦視覺(jué)應(yīng)用程式可使用人工智慧和機(jī)器學(xué)習(xí)(AI / ML) 精確地處理這些資料,以進(jìn)行物件識(shí)別和臉部辨識(shí),以及分類、建議、監(jiān)控和偵測(cè)。圖形化設(shè)計(jì)工具與便利的部署實(shí)現(xiàn)流程幫你減輕開(kāi)發(fā)智慧電腦視覺(jué)應(yīng)用的負(fù)擔(dān)。
此外,電腦視覺(jué)技術(shù)還結(jié)合了深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),如卷積神經(jīng)網(wǎng)路(Convolutional Neural Networks;CNN),CNN應(yīng)該可說(shuō)在是機(jī)器視覺(jué)系統(tǒng)中應(yīng)用最廣泛的神經(jīng)網(wǎng)路,這種網(wǎng)絡(luò)架構(gòu)通過(guò)AI類神經(jīng)網(wǎng)絡(luò)來(lái)強(qiáng)化功能,架構(gòu)上更能緊密地模仿人類視覺(jué)皮層和模式識(shí)別機(jī)制。應(yīng)用於臉部偵測(cè)、辨識(shí)及表情分析、云端智慧型監(jiān)控服務(wù)等領(lǐng)域。這些技術(shù)不僅促進(jìn)了智慧制造與智慧型機(jī)器人的發(fā)展,還在臨床醫(yī)學(xué)影像與精準(zhǔn)運(yùn)動(dòng)科技等方面得到了廣泛應(yīng)用。
舉例來(lái)說(shuō),宸曜科技以強(qiáng)固型邊緣AI運(yùn)算平臺(tái)搭載NVIDIA GPU與Jetson Orin模組,能在邊緣端提供伺服器級(jí)別的推論性能,滿足各種視覺(jué)AI應(yīng)用需求,加速自動(dòng)化轉(zhuǎn)型與智慧升級(jí)。而NVIDIA近期宣布采用通用3D資料交換框架的全新服務(wù),可加速執(zhí)行以通用場(chǎng)景描述(OpenUSD)為基礎(chǔ)的工作流程,以及工業(yè)數(shù)位分身與機(jī)器人的開(kāi)發(fā)。NVIDIA與工業(yè)自動(dòng)化及軟體廠商西門子擴(kuò)大合作,以使用OpenUSD促進(jìn)處理更多工業(yè)工作負(fù)載。西門子把OpenUSD管道與其Simcenter模擬技術(shù)產(chǎn)品組合加以整合,能夠即時(shí)以逼真畫(huà)面呈現(xiàn)復(fù)雜的模擬資料,讓使用者更深入明白產(chǎn)品在真實(shí)作業(yè)環(huán)境的表現(xiàn)。

圖二 : 采用OpenUSD的USD Search NIM可以執(zhí)行3D資產(chǎn)的文字提示搜尋。(source:NVIDIA) |
|
機(jī)器視覺(jué):工業(yè)自動(dòng)化的利器
相比之下,機(jī)器視覺(jué)是一個(gè)多學(xué)科的工程領(lǐng)域,側(cè)重於將影像處理技術(shù)應(yīng)用於工業(yè)自動(dòng)化。其主要目的在於通過(guò)影像分析實(shí)現(xiàn)產(chǎn)品的檢測(cè)、分揀、引導(dǎo)等工業(yè)任務(wù)。機(jī)器視覺(jué)強(qiáng)調(diào)的是可靠性、精確度和高效率,通常在嚴(yán)苛條件下的工業(yè)環(huán)境中運(yùn)行,注重解決實(shí)際產(chǎn)生的問(wèn)題。
「效能」為機(jī)器視覺(jué)及工業(yè)應(yīng)用首重的關(guān)鍵。機(jī)器視覺(jué)主要應(yīng)用於自主機(jī)器人的視覺(jué)系統(tǒng)、檢測(cè)與測(cè)量技術(shù)等領(lǐng)域。這一技術(shù)領(lǐng)域往往通過(guò)軟體與硬體的緊密結(jié)合,實(shí)現(xiàn)高效的機(jī)器人控制或各種即時(shí)操作。相比電腦視覺(jué),機(jī)器視覺(jué)更側(cè)重於硬體元件的整合和系統(tǒng)應(yīng)用的實(shí)時(shí)性,這使得它在工業(yè)自動(dòng)化中具有不可替代的地位。例如Cincoze德承強(qiáng)固型嵌入式電腦DS-1402可搭載Intel 13/12代(Raptor Lake-S / Alder Lake-S平臺(tái))65W處理器,高達(dá)24核心(8P + 16E)和32線程的配置,是Comet Lake-S平臺(tái)處理效能的1.35倍以上。并且支援64GB 4800MHz DDR5 ECC記憶體,滿足需要高度可靠性與資料完整的應(yīng)用需求,而多樣的儲(chǔ)存選擇讓使用者,可以依據(jù)需求自由配置。
另外,透過(guò)MATLAB工具箱提供開(kāi)發(fā)瑕疵偵測(cè)、語(yǔ)義分割、目標(biāo)偵測(cè)、影像和影片分類等各種深度學(xué)習(xí)應(yīng)用場(chǎng)景,藉此可以開(kāi)發(fā)以深度學(xué)習(xí)為基礎(chǔ)的方法來(lái)檢測(cè)和定位不同類型的異常,提高生產(chǎn)系統(tǒng)中的高通量品質(zhì)控制,自動(dòng)檢查和瑕疵偵測(cè)效益。

圖三 : Cincoze德承強(qiáng)固型嵌入式電腦DS-1402以高效能及高可靠性因應(yīng)智慧工廠、機(jī)器視覺(jué)等應(yīng)用。(source:Cincoze) |
|
主要系統(tǒng)及構(gòu)成元件
機(jī)器視覺(jué)系統(tǒng)由多個(gè)組件構(gòu)成,包括成像鏡頭、照明光源、工業(yè)相機(jī)、影像擷取卡以及處理軟體等。這些元件共同運(yùn)作,以達(dá)到精確的影像捕捉、處理和分析。其中的組合要件,包括:
成像鏡頭與工業(yè)相機(jī):成像鏡頭與工業(yè)相機(jī)是機(jī)器視覺(jué)系統(tǒng)的核心元件。鏡頭的選擇決定了影像的清晰度和解析度,而相機(jī)則負(fù)責(zé)將光學(xué)影像轉(zhuǎn)換為數(shù)位訊號(hào)。工業(yè)相機(jī)通常具備高靈敏度和高速影像捕捉能力,能在惡劣的工業(yè)環(huán)境下穩(wěn)定運(yùn)行。
照明光源:照明是影像質(zhì)量的重要因素之一。不同的照明方式,如環(huán)形燈、背光燈、同軸光源等,可根據(jù)檢測(cè)對(duì)象的特性來(lái)選擇,以確保影像的均勻性和對(duì)比度。
影像擷取卡與處理軟體:影像擷取卡負(fù)責(zé)將工業(yè)相機(jī)捕捉到的影像數(shù)據(jù)傳輸至處理單元。處理軟體則通過(guò)復(fù)雜的演算法對(duì)影像進(jìn)行分析,提取有用信息并作出決策,如判定產(chǎn)品是否合格。
另外,機(jī)器視覺(jué)在許多工業(yè)領(lǐng)域都有廣泛應(yīng)用,例如自動(dòng)光學(xué)檢測(cè)(AOI)系統(tǒng)能夠在電子元件生產(chǎn)過(guò)程中實(shí)現(xiàn)高速高精度的瑕疵檢測(cè);在汽車制造業(yè)中,機(jī)器視覺(jué)可用於零件的定位和組裝,引導(dǎo)機(jī)械手臂完成復(fù)雜操作。
應(yīng)用焦點(diǎn)各異
不論是電腦視覺(jué)或機(jī)器視覺(jué),其實(shí)都是為了增進(jìn)圖像技術(shù)更適合人眼觀察或傳送給儀器檢測(cè)的效能,兩者雖然在技術(shù)上有許多共通點(diǎn),但差異在於電腦視覺(jué)強(qiáng)調(diào)的是多元應(yīng)用與AI整合,更注重模擬和理解人類視覺(jué),應(yīng)用於多種場(chǎng)景,適用在不同情境下的智能化需求;而機(jī)器視覺(jué)重視工業(yè)應(yīng)用中的高效性與實(shí)時(shí)性,強(qiáng)調(diào)硬體與系統(tǒng)的整合,多使用於檢測(cè)和測(cè)量,專注於解決實(shí)際的生產(chǎn)問(wèn)題。
預(yù)計(jì)電腦視覺(jué)不僅將繼續(xù)在人類生活中發(fā)揮重要作用,還將在工業(yè)自動(dòng)化中找到更多的應(yīng)用場(chǎng)景。另一方面,機(jī)器視覺(jué)技術(shù)作為工業(yè)自動(dòng)化的重要推動(dòng)力,正以多種方式推動(dòng)著制造業(yè)轉(zhuǎn)型,機(jī)器視覺(jué)的高可靠性和高效能將使其在工業(yè)領(lǐng)域中繼續(xù)保持關(guān)鍵地位。隨著技術(shù)的不斷演進(jìn),這兩個(gè)領(lǐng)域的界限或?qū)⒃絹?lái)越模糊,甚至相輔相成的促進(jìn)自動(dòng)化和智慧化發(fā)展,最終實(shí)現(xiàn)更強(qiáng)大的智能系統(tǒng),為各行各業(yè)帶來(lái)革命性的變革。
結(jié)語(yǔ)

圖四 : 隨著自動(dòng)化需求的增加,機(jī)器視覺(jué)在物流、醫(yī)療和智慧城市等新興領(lǐng)域中的應(yīng)用也將不斷擴(kuò)展。(source:Basler AG) |
|
機(jī)器視覺(jué)技術(shù)的發(fā)展為制造業(yè)帶來(lái)許多的優(yōu)勢(shì),從預(yù)防性維護(hù)到提高可持續(xù)性,再到增強(qiáng)客戶滿意度,以及工作場(chǎng)所安全性。未來(lái)幾年內(nèi),機(jī)器視覺(jué)技術(shù)將持續(xù)進(jìn)展,特別是在邊緣運(yùn)算、3D視覺(jué)技術(shù)以及AI整合方面。這些技術(shù)發(fā)展將進(jìn)一步提升機(jī)器視覺(jué)系統(tǒng)的智能化水平,擴(kuò)大其應(yīng)用范圍。
隨著機(jī)器視覺(jué)技術(shù)的日益普及,市場(chǎng)競(jìng)爭(zhēng)會(huì)更趨於白熱化。但盡管機(jī)器視覺(jué)技術(shù)的潛力巨大,市場(chǎng)仍面臨一些挑戰(zhàn)。隨著品質(zhì)檢驗(yàn)的需求不斷增加,對(duì)視覺(jué)引導(dǎo)機(jī)器人系統(tǒng)的需求增長(zhǎng),當(dāng)前市場(chǎng)上卻缺乏靈活且高效的機(jī)器視覺(jué)解決方案,致使市場(chǎng)擴(kuò)展速度受限於技術(shù)的適應(yīng)性和成本問(wèn)題。再加上技術(shù)熟練人員的短缺,這些因素都限制了市場(chǎng)的快速擴(kuò)張。
技術(shù)創(chuàng)新是供應(yīng)商的核心競(jìng)爭(zhēng)力之一。供應(yīng)商需要不斷研發(fā)新技術(shù),如整合AI和深度學(xué)習(xí)的視覺(jué)系統(tǒng),來(lái)提升影像分析的精度和速度。而產(chǎn)品的穩(wěn)定性和可靠性是工業(yè)應(yīng)用中的關(guān)鍵。供應(yīng)商應(yīng)確保其機(jī)器視覺(jué)設(shè)備能夠在嚴(yán)苛的工業(yè)環(huán)境中長(zhǎng)時(shí)間穩(wěn)定運(yùn)行,并能夠提供高品質(zhì)的影像分析結(jié)果。
除了產(chǎn)品本身,供應(yīng)商還需要提供全面的售後服務(wù),包括技術(shù)支持、培訓(xùn)以及維護(hù)服務(wù),以確保用戶能夠充分利用機(jī)器視覺(jué)技術(shù),提高生產(chǎn)效率。此外,隨著自動(dòng)化需求的增加,機(jī)器視覺(jué)在物流、醫(yī)療和智慧城市等新興領(lǐng)域中的應(yīng)用也將不斷擴(kuò)展。如今機(jī)器視覺(jué)技術(shù)在工業(yè)自動(dòng)化中不可或缺,未來(lái)將為制造業(yè)發(fā)展提供更多的可能性,以及在更多領(lǐng)域發(fā)揮其價(jià)值。
**刊頭圖(source:Onsemi)