當(dāng)語音辨識技術(shù)正在改變多項產(chǎn)業(yè)的運(yùn)作模式,成為節(jié)省人力成本與提升效率的關(guān)鍵利器。由麗臺協(xié)助長問科技打造出臺灣在地的語音AI辨識系統(tǒng),即橫跨國、臺、英、客語言的輸入與輸出,成為企業(yè)數(shù)位轉(zhuǎn)型的重要動力,其應(yīng)用範(fàn)圍涵蓋金融、電信、醫(yī)療等領(lǐng)域,達(dá)到超過95%的辨識準(zhǔn)確率,還能針對不同行業(yè)的專業(yè)詞彙進(jìn)行語言模型優(yōu)化;甚至結(jié)合大型語言模型(LLM)提高語音AI辨識的準(zhǔn)確性,進(jìn)一步增強(qiáng)用戶體驗。
 |
長問科技副總經(jīng)理陳又碩認(rèn)為:「隨著技術(shù)進(jìn)步,人類與機(jī)器溝通可以透過精準(zhǔn)的數(shù)位化語音,很快便能實現(xiàn)人機(jī)自然的口語互動。」 |
為了滿足即時語音AI辨識對高計算性能的需求,長問科技選用了麗臺科技的高效能AI硬體設(shè)備,特別是NVIDIA RTX 6000 Ada Generation GPU與WinFast GS4850T 伺服器的結(jié)合,此強(qiáng)大的算力平臺為語音AI辨識系統(tǒng)提供了穩(wěn)定且高效的支援,確保能在應(yīng)用環(huán)境中快速反應(yīng)。
藉此推出的語音AI辨識系統(tǒng),得以專注於臺灣在地語言的研發(fā),採用單一模型實現(xiàn)多語言混合辨識,強(qiáng)調(diào)無需切換模型即可處理不同語言的輸入與輸出,適用於多種情境;該系統(tǒng)亦能透過RESTful API、WebSocket、MRCPv2,整合客服系統(tǒng),提升了操作的便利性與效率,有效提升企業(yè)效能。
長問科技副總經(jīng)理陳又碩表示:「麗臺的優(yōu)勢在於其卓越的效能、合理的成本以及專業(yè)的技術(shù)諮詢服務(wù)。我們的客戶通常有客製化需求,針對資料的大小,麗臺能提供精準(zhǔn)的建置建議。」讓該系統(tǒng)根據(jù)不同產(chǎn)業(yè)的需求優(yōu)化專業(yè)詞彙庫,確保精準(zhǔn)識別行業(yè)術(shù)語;還能靈活調(diào)整辨識速度,以適應(yīng)不同受眾需求(如年輕人或老年人),提升辨識精準(zhǔn)度和使用體驗。
面對技術(shù)快速發(fā)展,長問科技預(yù)計持續(xù)提升語音AI辨識的精準(zhǔn)度,更計劃擴(kuò)展辨識語言的廣度。陳又碩說:「我們預(yù)計把臺灣的語系做好之後,跨國的語音辨識也是未來的目標(biāo),計劃加入日語與越南語的辨識,以滿足更多產(chǎn)業(yè)的需求,進(jìn)一步促進(jìn)跨文化交流。」
通過高性能硬體和先進(jìn)技術(shù)的結(jié)合,語音AI辨識應(yīng)用正逐漸改變我們生活的方式,陳又碩認(rèn)為:「語音AI辨識是未來的趨勢,隨著技術(shù)的進(jìn)步,人類與機(jī)器溝通可以透過精準(zhǔn)的數(shù)位化語音,很快便能實現(xiàn)人機(jī)自然的口語互動。」未來,隨著技術(shù)的不斷成熟,語音AI辨識將帶來更多的創(chuàng)新和可能性。