當(dāng)全球各地的企業(yè)與公部門組織都在開發(fā)人工智慧代理(AI agent),以提升工作團(tuán)隊的能力,也將更依賴搜尋并摘要來自於攝影機(jī)、物聯(lián)網(wǎng)感測器與車輛等,越來越多裝置所產(chǎn)生的大量AI視覺化資料。
 |
將 AI 視覺化後,任何產(chǎn)業(yè)現(xiàn)在都能搜尋并摘要大量的視覺資料 |
因此,適用於視訊搜尋與摘要的全新NVIDIA AI Blueprint,則強(qiáng)調(diào)能讓幾??所有產(chǎn)業(yè)的開發(fā)人員,建立可分析視訊與影像內(nèi)容的視覺AI代理功能,以支援他們進(jìn)行各項工作。包括回答使用者的問題、產(chǎn)生摘要,并針對特定情境啟用警示功能;以及用自然語言提示,而非死板的軟體程式碼,來客制化這些視覺 AI 代理,降低在各產(chǎn)業(yè)和智慧城市應(yīng)用部署虛擬助理的門檻。
該藍(lán)圖(blueprint)還為NVIDIA Metropolis專供開發(fā)人員,用於建置視覺AI應(yīng)用工具的一部分,結(jié)合了NVIDIA電腦視覺與生成式AI技術(shù)的客制化工作流程。吸引了包括埃森哲(Accenture)、戴爾科技集團(tuán)(Dell Technologies)與聯(lián)想集團(tuán)(Lenovo)在內(nèi)的全球系統(tǒng)整合商與技術(shù)解決方案供應(yīng)商。
估計將用於視覺搜尋與摘要的NVIDIA AI Blueprint,將帶給全球企業(yè)與城市使用,將掀起下一波 AI應(yīng)用的浪潮,可部署於工廠、倉庫、商店、機(jī)場、交通路囗等,以提升生產(chǎn)效率與安全性。視覺 AI代理則可由視覺語言模型(VLM)驅(qū)動,結(jié)合電腦視覺與語言理解的生成式 AI 模型,可解釋實體世界與執(zhí)行推理任務(wù)。
其中采用 NVIDIA AI Blueprint 可以為開發(fā)人員省去數(shù)個月的時間,來研究與最隹化智慧城市應(yīng)用的 AI 模型。透過在邊緣、地端或云端環(huán)境部署 NVIDIA GPU,可以大幅加快梳理視訊檔案以識別重要時刻的過程。
在倉庫環(huán)境中,利用這個工作流程建立的 AI 代理可以在工作人員違反安全規(guī)范時加以提醒。在繁忙的十字路囗,AI代理可以識別交通事故,并且產(chǎn)生報告以協(xié)助緊急應(yīng)變工作。而在公共基礎(chǔ)設(shè)施領(lǐng)域,維護(hù)人員可以要求 AI 代理檢視空拍畫面,找出老化的道路、火車軌道或橋梁,以支持更主動地維護(hù)。
因此,目前除了智慧空間之外,視覺 AI代理也可用於為視力受損人士摘要影片、自動產(chǎn)生體育賽事回顧,以及協(xié)助標(biāo)示大量視覺資料集以訓(xùn)練其他 AI 模型。如視訊搜尋與摘要工作流程加入了一系列 NVIDIA AI Blueprint,可輕松創(chuàng)造由 AI驅(qū)動數(shù)位化身、建立虛擬助理以提供個人化的客戶服務(wù),將從 PDF 資料中擷取企業(yè)洞察。
開發(fā)人員可以免費(fèi)體驗與下載NVIDIA AI Blueprint,且能透過 NVIDIA AI Enterprise端對端軟體平臺,在加速資料中心與云端進(jìn)行生產(chǎn)部署,將加快資料科學(xué)管道及簡化生成式 AI 的開發(fā)與部署。企業(yè)與公部門客戶還能在 NVIDIA 合作夥伴生態(tài)系的協(xié)助下,利用一整套的NVIDIA AI Blueprints軟體。