COMPUTEX 2024期間,已明顯可見(jiàn)到人工智慧(AI)正逐步落實(shí)於各行各業(yè),從製造業(yè)到醫(yī)療保健、交通管理到消費(fèi)電子的應(yīng)用範(fàn)圍廣泛,對(duì)於許多產(chǎn)業(yè)來(lái)說(shuō)都是一場(chǎng)革命,其中導(dǎo)入AOI與機(jī)器視覺(jué)等邊緣AI相關(guān)技術(shù)應(yīng)用更為關(guān)鍵。
自從1980年代的機(jī)器學(xué)習(xí)(Machine Learning)時(shí)期,開(kāi)始讓電腦具備自主學(xué)習(xí)、改善能力,並延伸至特定領(lǐng)域,便率先導(dǎo)入語(yǔ)音辨識(shí)、翻譯,或是醫(yī)療影像病變、產(chǎn)品瑕疵檢測(cè)等。到了2016年AlphaGo橫空出世,擊敗圍棋界棋王,更被視為近期AI發(fā)展最大突破。
待2022年生成式AI問(wèn)世,持續(xù)推動(dòng)跨界投入商業(yè)化等更有生產(chǎn)力效益的場(chǎng)域。根據(jù)研調(diào)機(jī)構(gòu)Statista Research預(yù)估,受惠於AI技術(shù)的持續(xù)突破,全球電腦視覺(jué)市場(chǎng)在理解圖片與臉部驗(yàn)證領(lǐng)域應(yīng)用將於2024年再創(chuàng)新高,並以每年約11%的速度成長(zhǎng)。

圖一 : 當(dāng)人工智慧(AI)正逐步落實(shí)於各行各業(yè)形成一場(chǎng)革命,其中導(dǎo)入AOI與機(jī)器視覺(jué)等邊緣AI相關(guān)技術(shù)應(yīng)用更為關(guān)鍵。(攝影:陳念舜) |
|
目前針對(duì)機(jī)器視覺(jué)由取像、分析,到結(jié)果的輸出,大致可分為「影像擷取」、「影像處理」、「影像分析」3步驟。應(yīng)用在工業(yè)自動(dòng)化與機(jī)器人,例如視覺(jué)瑕疵檢測(cè)、3D視覺(jué)定位、分類(lèi)計(jì)數(shù),甚至影像監(jiān)控/辨識(shí)等應(yīng)用,成為AI視覺(jué)系統(tǒng)的技術(shù)核心。
研華布局AI規(guī)模化 促四角平穩(wěn)落地
其中依研華產(chǎn)業(yè)雲(yún)暨影像科技副總經(jīng)理鮑志偉指出,邊緣(Edge AI)將是下一波AI的發(fā)展趨勢(shì),如同過(guò)往的產(chǎn)業(yè)電腦(Industrial PC;IPC)發(fā)展,須先達(dá)到規(guī)模化經(jīng)濟(jì),才能加速產(chǎn)業(yè)AI化落地,建構(gòu)起立足的優(yōu)勢(shì)。目前已在先進(jìn)大國(guó)部署,預(yù)估將會(huì)在2025~2026年間大量複製及爆發(fā)式成長(zhǎng);生成式AI產(chǎn)品則還需要約3~4年驗(yàn)證時(shí)間,2029年始顯著成長(zhǎng)。
至於躍升規(guī)模化落地的首要方程式,則包含:場(chǎng)域、平臺(tái)、協(xié)作與AI加速等4大關(guān)鍵要素,產(chǎn)業(yè)生態(tài)系的構(gòu)建與協(xié)作,更是至關(guān)重要!鮑志偉進(jìn)一步分析,邊緣AI首先須經(jīng)由各國(guó)政府補(bǔ)助開(kāi)發(fā),逐步導(dǎo)入智慧城市場(chǎng)域,以利規(guī)模化發(fā)展;其次是在影像、醫(yī)療等領(lǐng)域,通過(guò)認(rèn)證並獲採(cǎi)用,利用各種AMR自主移動(dòng)機(jī)器人來(lái)填補(bǔ)產(chǎn)業(yè)人力不足的問(wèn)題;最後則是整體應(yīng)用更臻成熟之後,預(yù)料將出現(xiàn)產(chǎn)品創(chuàng)新期。

圖二 : 研華公司推出最新AI邊緣運(yùn)算系統(tǒng)與伺服器系列產(chǎn)品,整合AI軟體和預(yù)先訓(xùn)練的模型,將能大幅縮短開(kāi)發(fā)與部署時(shí)間。(souce:研華) |
|
目前在產(chǎn)業(yè)所使用的AI-based檢測(cè)設(shè)備,已能透過(guò)深度學(xué)習(xí)(Deep learning)模型提升比傳統(tǒng)型檢測(cè)設(shè)備還高的良率,將在下半年逐漸成長(zhǎng);導(dǎo)入AI技術(shù)的AMR/AGV配送機(jī)器人,更廣泛應(yīng)用在物流場(chǎng)域,未來(lái)在成功案例不斷獲得複製之下,預(yù)估明、後年將進(jìn)入邊緣AI的高速成長(zhǎng)期,研華已在IPC客戶(hù)端看見(jiàn)各種應(yīng)用百花齊放。
但此類(lèi)產(chǎn)品欲走向AI化,在硬體規(guī)格化、AI模型的部署與管理,以及能夠驅(qū)動(dòng)邊緣AI運(yùn)作的高強(qiáng)度運(yùn)算力方面,仍存在須克服的難題。其中,相較於目前消費(fèi)市場(chǎng)上AI PC裝置約達(dá)到40TP以上算力,IPC AI化則至少須1200TP,還應(yīng)考慮使用算力的規(guī)模、情境和方向不同,可能比起前者多出上萬(wàn)倍;並持續(xù)創(chuàng)造出過(guò)去IPC未曾接觸到的不同場(chǎng)景、領(lǐng)域,如工業(yè)用有持續(xù)自動(dòng)化、省人力需求。
且基於Edge AI伺服器須因應(yīng)防水、防塵不同環(huán)境等級(jí)挑戰(zhàn),不像在Data Center的環(huán)境較單純,必須克服如下挑戰(zhàn):硬體規(guī)格選擇、AI模型大量部署管理的需求,有必要更新時(shí)系統(tǒng)不能停機(jī)。邊緣生成式AI比起雲(yún)端須提供更即時(shí)的反應(yīng)、更低的資安風(fēng)險(xiǎn)及網(wǎng)路傳輸成本,更適用於需要即時(shí)反應(yīng)的智慧城市與安全控制應(yīng)用,並已成功導(dǎo)入運(yùn)用在研華自家產(chǎn)線(xiàn)。
目前已經(jīng)初步釋出邊緣AI產(chǎn)品,並應(yīng)用NVIDIA方案的全系列產(chǎn)業(yè)AI平臺(tái),分別從邊緣到雲(yún)端展示最新且完整的AI邊緣運(yùn)算系統(tǒng)與伺服器,整合AI軟體和預(yù)先訓(xùn)練的模型,將能大幅縮短開(kāi)發(fā)與部署時(shí)間。
偕同偲倢打造了AI光學(xué)字元辨識(shí)(OCR)與AI光學(xué)瑕疵檢測(cè)(AOI)等硬軟體與服務(wù)的整合方案,適用安裝於空間限制的設(shè)備中;或於高速流水產(chǎn)線(xiàn)上,執(zhí)行高速包裝噴印檢查或是出貨檢查。
此AI OCR解決方案使用研華ICAM-520智能相機(jī),並內(nèi)建NVIDIA Jetson運(yùn)算模組,整合光源、鏡頭與多種語(yǔ)言模型,並以其輕巧體積且便利安裝之特性,適用安裝於空間限制的設(shè)備中,或於高速流水產(chǎn)線(xiàn)上,執(zhí)行高速包裝噴印檢查或是出貨檢查。
可應(yīng)用在高速自動(dòng)化檢測(cè)設(shè)備,透過(guò)AI抓出難以定義之瑕疵或非預(yù)期的瑕疵,此將大幅降低人力成本並同時(shí)提高生產(chǎn)良率與檢測(cè)速度,包括臺(tái)灣半導(dǎo)體代工廠(chǎng)正誠(chéng)電子,已導(dǎo)入AI AOI方案檢測(cè),打造半導(dǎo)體封裝檢測(cè)生產(chǎn)線(xiàn)。
除了參與智慧城市專(zhuān)案,也與韓系客戶(hù)深化智慧交通合作,更持續(xù)強(qiáng)化人臉辨識(shí)技術(shù)能量。至於未來(lái)生成式AI導(dǎo)入邊緣端,將可望延展邊緣AI的功能性,如原本經(jīng)過(guò)CNN形成的辨識(shí)和判斷模式,如今則可由生成式AI在邊緣統(tǒng)籌、分析及判斷整個(gè)場(chǎng)域並產(chǎn)出報(bào)告;農(nóng)業(yè)機(jī)器人則是負(fù)責(zé)辨識(shí)農(nóng)作物的成熟度與採(cǎi)集工業(yè),進(jìn)一步能推算成熟時(shí)間與評(píng)估種植策略。
宸曜緊隨NVIDIA腳步 垂直整合硬軟體資源
宸曜科技資深售前工程師李冠毅也預(yù)測(cè)全球邊緣AI市場(chǎng)潛力的驅(qū)動(dòng)因子包含:IoT裝置增加,因產(chǎn)品製造品質(zhì)提高,供應(yīng)鏈管理增強(qiáng)需求;5G技術(shù)整合,提供更高的資料傳輸效率並減少延遲,加強(qiáng)邊緣AI能力;AI與機(jī)器學(xué)習(xí)的進(jìn)步,經(jīng)由演算法提升了邊緣AI系統(tǒng)的效率與能力;政府與產(chǎn)業(yè)支援,來(lái)自智慧城市專(zhuān)案與AI驅(qū)動(dòng)的計(jì)劃,促進(jìn)了Edge AI成長(zhǎng)。
然而,如果要在嚴(yán)苛環(huán)境條件下部署新興領(lǐng)域應(yīng)用考驗(yàn),邊緣運(yùn)算中的電腦設(shè)計(jì)和穩(wěn)定性會(huì)是關(guān)鍵。該公司於2010年成立之初,便專(zhuān)注打造搭載X-86晶片的寬溫?zé)o風(fēng)扇系列強(qiáng)固電腦,以滿(mǎn)足各種嚴(yán)苛環(huán)境條件下使用。
適逢2013年業(yè)界開(kāi)始發(fā)現(xiàn)機(jī)器在圖像識(shí)別上更為精準(zhǔn)、快速,從而導(dǎo)入工業(yè)智動(dòng)化、智慧交通,也發(fā)表自家車(chē)載無(wú)風(fēng)扇寬溫電腦;加上2015年Aphgo問(wèn)世後,開(kāi)始思考該如何藉強(qiáng)化學(xué)習(xí)技術(shù)、環(huán)境,反饋?zhàn)择{車(chē)定位。
並順應(yīng)在2015~2016年間自駕技術(shù)興起,需要克服車(chē)上電壓、溫度、震動(dòng)等問(wèn)題,宸曜最終在2016年打造出首臺(tái)整合自駕技術(shù)的GPU/GUDA運(yùn)算的Nuvo系列工業(yè)電腦,在百度阿波羅自駕車(chē)技術(shù)平臺(tái)上擔(dān)任AI大腦;且具備專(zhuān)利散熱技術(shù),可支援250W GPU Card運(yùn)行。
至今,宸曜的Edge AI產(chǎn)品線(xiàn)越發(fā)完整,到了2020年正式加入NVIDIA合作夥伴網(wǎng)路,而能提早參與前期討論和測(cè)試驗(yàn)證階段、更快推出邊緣運(yùn)算平臺(tái)產(chǎn)品,並利用生成式AI來(lái)刺激應(yīng)用創(chuàng)新,帶動(dòng)軟硬體新商機(jī)。
同時(shí)推出世界首款兼具工業(yè)電腦和車(chē)載應(yīng)用設(shè)計(jì)、支援雙GPU的AI電腦,甚至因應(yīng)目前各國(guó)皆看好Edge AI在製造業(yè)的發(fā)展,占比約3~4成,尤其是在製程中對(duì)品質(zhì)要求越來(lái)越高,而須加強(qiáng)供應(yīng)鏈管理,如AOI+AMR需求的功能。

圖三 : 目前任何LLMs的創(chuàng)新突破,都有賴(lài)於巨量資料累積與龐雜強(qiáng)大的神經(jīng)網(wǎng)路,加以訓(xùn)練,也讓AIoT貼近感測(cè)器,更快速做出最好決策、同時(shí)確保資安。(攝影:陳念舜) |
|
適逢2023年Chat GPT問(wèn)世,包含智慧城市、物流與運(yùn)輸、工業(yè)製造、農(nóng)業(yè)、零售、食品加工業(yè)等,也盼藉此提高生產(chǎn)力,對(duì)Edge Computing裝置、Data Center AI Platform硬軟體需求大增,從雲(yún)端到邊緣重新思考AI所面臨的挑戰(zhàn),須支援多種擴(kuò)充以滿(mǎn)足嚴(yán)苛環(huán)境,效能又不打折,
宸耀也成為受NVIDIA肯定的Edge Computing供應(yīng)商,鎖定垂直市場(chǎng)、強(qiáng)固型產(chǎn)品設(shè)計(jì),容易部署等優(yōu)點(diǎn),提供最優(yōu)效能功耗比。透過(guò)無(wú)風(fēng)扇/平頭哥等強(qiáng)固散熱良好的設(shè)計(jì)、有效散熱的PCBA,具備-25~70℃寬溫適應(yīng)能力,確保GPU/CPU運(yùn)行100%效能時(shí)不會(huì)降頻;衝擊和震動(dòng)專(zhuān)利設(shè)計(jì),可調(diào)節(jié)GPU固定支架和阻尼減震支架;滿(mǎn)足工業(yè)及車(chē)載環(huán)境的8V to 48V寬電壓輸入設(shè)計(jì),可承受車(chē)載環(huán)境電壓波動(dòng);支援多種GPU(RTX、Quadro、Tesla、Jetson)及彈性擴(kuò)充介面,符合IP66防水及防塵、防鹽規(guī)範(fàn),滿(mǎn)足客戶(hù)端預(yù)算的需求。
李冠毅認(rèn)為,其實(shí)任何LLMs的創(chuàng)新突破,都有賴(lài)於巨量資料累積與龐雜強(qiáng)大的神經(jīng)網(wǎng)路,加以訓(xùn)練,布署到從雲(yún)端到地端服務(wù)應(yīng)用。另有業(yè)者會(huì)希望,將之布署到更接近邊緣場(chǎng)域,藉以攤提節(jié)省硬體成本、更快Fine tune訓(xùn)練模型,也讓AIoT貼近感測(cè)器,更快速做出最好決策、同時(shí)確保資安。
生成式AI當(dāng)?shù)?非監(jiān)督式學(xué)習(xí)成主流
肯定資訊工程部經(jīng)理曹志宇進(jìn)一步表示,該公司身為專(zhuān)業(yè)機(jī)器視覺(jué)設(shè)備Zebra代理商,產(chǎn)品包括相機(jī)鏡頭、光源、系統(tǒng)等,與宸曜合作多年來(lái),協(xié)助解決客戶(hù)在電腦處理、高速存取資訊等相關(guān)課題。隨著Zebra在2~3年前併購(gòu)AI軟硬體公司Matrox及其圖像資料庫(kù)之後,納入旗下Zebra Aurora軟體產(chǎn)品,打造Code-based開(kāi)發(fā)環(huán)境,並經(jīng)由Aurora image library SDK提供完整的影像開(kāi)發(fā)環(huán)境,依序進(jìn)入影像前處理等工作流程,包括可行性評(píng)估、原型設(shè)計(jì),配合使用者開(kāi)發(fā)API部署到電腦,具備互動(dòng)式、直觀便利的使用環(huán)境,加速評(píng)估使用流程;進(jìn)而監(jiān)控各API執(zhí)行時(shí)間、次數(shù)等效能,建立4大Deep learning功能模組。

圖四 : 肯定資訊工程部經(jīng)理曹志宇(攝影:陳念舜) |
|
其中前3項(xiàng)屬於進(jìn)行監(jiān)督訓(xùn)練者,包含:Image classification用來(lái)識(shí)別影像並分類(lèi),使用預(yù)期類(lèi)別的樣本影像;Image segmentation用來(lái)搜尋特徵(缺陷),並針對(duì)影像鄰域像素分類(lèi)、標(biāo)記影像中的特徵,使用其分段預(yù)期特徵樣本;Object detection用於尋找和計(jì)數(shù)物體,同樣針對(duì)影像鄰域定位預(yù)訓(xùn)練物件或特徵類(lèi)別、提供偵測(cè)分?jǐn)?shù),並將影像中的物件或特徵包圍在產(chǎn)出的邊界框中,使用其封閉的預(yù)期物件樣本來(lái)進(jìn)行。
Anomaly detection則屬於非監(jiān)督式學(xué)習(xí),用來(lái)檢測(cè)與正常影像間差異,可捕獲如影像或其鄰域分類(lèi)為缺陷等異常,並指示影像中的異常情況,僅使用無(wú)異常圖像訓(xùn)練,所以毋須標(biāo)註或註釋?zhuān)瑴p少用來(lái)標(biāo)註的大量人力;僅標(biāo)示發(fā)現(xiàn)的異常狀況和粗略位置;可設(shè)定分?jǐn)?shù)閾值來(lái)控制偵測(cè)靈敏度,利用(integrated)GPU來(lái)進(jìn)行卸載或加速。
進(jìn)而投入發(fā)展Zebra AI OCR技術(shù),不必指定或?qū)W習(xí)字體即可讀取,分別支援拉丁字元、數(shù)字、標(biāo)點(diǎn)符號(hào),可處理印刷、雕刻或浮雕的點(diǎn)狀或?qū)嵭奈谋荆惶峁┳执P秃拖拗埔蕴岣叻€(wěn)健性和相關(guān)性。因此,不必?fù)?dān)心數(shù)以百計(jì)的化妝品的透明玻璃瓶,和不同反光及曲度、包裝標(biāo)籤字元太小。
形塑機(jī)器視覺(jué)生態(tài)系 為應(yīng)用服務(wù)加值
隨著近年來(lái)AI技術(shù)擴(kuò)大規(guī)模落地,已逐步滲入AOI、機(jī)器視覺(jué)應(yīng)用領(lǐng)域。因?yàn)槭芑蒽禢IVIDIA執(zhí)行長(zhǎng)黃仁勳點(diǎn)將而聲名大噪的所羅門(mén)公司,則從早期代理FA工廠(chǎng)自動(dòng)化設(shè)備、工業(yè)機(jī)器人等產(chǎn)品,再投入開(kāi)發(fā)3D視覺(jué)影像辨識(shí)平臺(tái)已默默耕耘許久。
面對(duì)傳統(tǒng)視覺(jué)系統(tǒng)具有許多環(huán)境上的限制,像是環(huán)境光線(xiàn)光影一變化可能會(huì)影響,或者物件複雜度高,辨識(shí)率就會(huì)下降等,都是工廠(chǎng)實(shí)際上會(huì)面臨的考驗(yàn),已在近年來(lái)導(dǎo)入AI技術(shù)後取得飛速進(jìn)步,如過(guò)去AOI光學(xué)檢測(cè)設(shè)備往往造成過(guò)殺(overkill)的問(wèn)題,在導(dǎo)入AI之後,總算可以解決,但新的課題也隨之而生。
所羅門(mén)公司董事長(zhǎng)陳政隆便舉例,過(guò)去他常遇到客戶(hù)想要導(dǎo)入AI視覺(jué)或3D視覺(jué)進(jìn)行AI檢監(jiān)測(cè)應(yīng)用時(shí)都會(huì)問(wèn)一個(gè)問(wèn)題,就是:「到底要收集多少圖片才能產(chǎn)生出AI模型?」一旦我們回覆至少需要1,000張圖片以上,收集成千上萬(wàn)筆資料,並需要大量人力去貼標(biāo)籤、訓(xùn)練,客戶(hù)聽(tīng)完之後就不太想做。
因此,所羅門(mén)團(tuán)隊(duì)當(dāng)時(shí)便思考如何去創(chuàng)造一個(gè)軟體平臺(tái),讓客戶(hù)以最少量的樣本去做客製化的AI模型,以提高客戶(hù)導(dǎo)入的意願(yuàn),解決客戶(hù)不便之處。陳政隆說(shuō):「要做到這樣的程度,我們必須串聯(lián)與整合大量的硬體!」
如今所羅門(mén)建立的平臺(tái)不只已經(jīng)串聯(lián)20~30個(gè)不同品牌機(jī)器人,還包括3~4種不同的2D、3D影像格式、各家品牌IP CAM等。並將現(xiàn)有的開(kāi)源神經(jīng)網(wǎng)路模型進(jìn)行優(yōu)化,整合各種軟硬體,降低客戶(hù)訓(xùn)練AI模型訓(xùn)練成本過(guò)高的問(wèn)題。
甚至因?yàn)榘雽?dǎo)體客戶(hù)良率高達(dá)99%,還會(huì)建議利用「瑕疵」來(lái)訓(xùn)練AI,即透過(guò)生成式AI去生成看樣本起來(lái)像真的瑕疵的資料讓AI學(xué)習(xí)。讓客戶(hù)甚至不需要寫(xiě)程式,只要以no code/low code方式就能創(chuàng)建自己所需要的應(yīng)用模式來(lái)滿(mǎn)足客戶(hù)需求,也能讓所羅門(mén)的軟體能快速切入不同行業(yè)別市場(chǎng)。