
鴻海研究院2023 AI NExT Forum特別以「大模型研發所需要的資源與所創造的價值」為主題進行交流座談,由鴻海研究院人工智慧研究所栗永徽所長主持,與談貴賓則有台灣微軟首席技術長花凱龍、華碩電腦暨台智雲技術長陳忠誠協理以及中央研究院資訊科學研究所古倫維研究員,討論未來多模態AI技術在語音、自然語言處理和電腦視覺的應用及其潛力。
撰文/楊迺仁 圖片提供/Shutterstock
人工智慧這幾年在技術上的重大突破,例如用於文字生成的ChatGPT與用於影像生成的Midjourney等大型生成式模型,雖然對企業及組織帶來便利,但由於大型生成式模型通常需要使用數萬億個Token和數千億個參數進行訓練,導致巨大的運算資源和能源消耗。
栗永徽請與會來賓發揮想像力,針對基礎模型在各種模態裡面包括語音、自然語言處理以及電腦視覺的應用,構想現今這些AI技術,在未來可能會有什麼樣的發展跟應用?哪些產業或領域將受益于多模態數據融合的技術?
花凱龍指出,多模態技術將提高行政事務方面的效率。例如,新加坡政府正在規劃導入ChatGPT技術來改進政府服務,歐洲一些公司也在考慮透過Copilot機制改進工作報告的撰寫,希望這些技術能讓日常工作更順暢、更有內容。很多傳統技術都有提升的可能性。例如,如果導入ChatGPT技術來做輿情分析,跟過去相比會有一些不同的收斂成果。新員工入職時,傳統上需請教主管或資深員工,或在公司的知識庫中搜尋資料,這過程耗時且不一定能找到正確資料,透過ChatGPT技術,新員工能更有效率地找到所需知識。
陳忠誠指出,現在的AI技術應用非常多元,尤其是自然語言能力的突破,將對各個產業帶來巨大進步。因為人與人之間的溝通主要依賴語言,AI就像是一個24小時無所不知的顧問,隨時在身邊提供幫助。比如,可以詢問程式如何編寫,或獲取專業知識如醫學知識,甚至讓AI先生成行銷企劃書草案,然後再進行修改。他認為,AI現在的影響是非常全面的,因為模型的先驗知識可以產生很大的創造力。
古倫維認為,多模態語言模型將融合視覺、語言和語音,影響到的就是跟內容有關的所有產業,特別是在媒體和廣告業,這些技術將加速內容創作和迭代速度,帶來顯著變化。
現有的技術與資源能否滿足大型模型需求
栗永徽指出,隨著語言模型愈來愈大,資料量和計算資源需求也在增加,如果算力的需求一直往上,現有的技術跟硬體資源能否滿足需求?還是我們需要開發更高效更節能的硬體和技術?
陳忠誠表示,語言模型有兩個趨勢,一是模型愈來愈大化,希望其愈來愈聰明;二是計算資源要更強、更節能。例如,若每個Google搜尋都需經過大語言模型處理,將需要大量的GPU資源。訓練大型模型可能需要數萬張A100 GPU,接下來會有更多個垂直領域,包括法律、醫學、教育等預期會有百花齊放的應用,最後不管是在訓練或者是在推論未來預期需要更大的算力和更優化的超級電腦平行運算架構。
栗永徽補充,這也正是台灣的機會,台灣的硬體製造能力強,可以設計讓AI加速的晶片或新的硬體架構,讓AI訓練速度更快,資源消耗更少。此外,未來基礎模型可能會成為生活中的基礎架構,如同電力一樣,我們只要插上插頭,就可以有各種各樣的電器用品為我們所用,然後可以改變我們的生活,AI基礎模型可能在智能社會中扮演重要角色。
古倫維認為,懶惰是科學進步的原動力,所以人們未來應該會非常的依賴AI服務。即便目前OpenAI僅開放試用帳號,已有各種不同的使用方式。人們會更傾向於問ChatGPT,而非使用Google,因為ChatGPT提供的答案更直接,不需要翻閱大量資訊。然而,他提醒大家,現階段的AI技術並不完美,人們需要了解其局限和潛在危險,但在一定範圍內,AI可以有很多用途,並成為生活的一部分。
花凱龍表示,從ChatGPT的使用狀態來看,AI技術的趨勢無法阻擋、不可逆轉。然而,短期內這些服務還不夠成熟,生成的內容無法完全正確。因此,目前只能在有限的領域發揮其應用,並需要專業人才進行後續創造和修改。

從ChatGPT的使用狀態來看,AI技術的趨勢無法阻擋、不可逆轉。
陳忠誠相信,AI服務會成為人們生活的一部分,透過語言跟文字溝通,然後產生生產力,是人類文明進步一個很大的原因,就是因為模型有文字理解的能力,有文字回答能力,才可以創造出很多的想像。未來的發展將像生態圈一樣進步,例如,台積電的製程將朝更小、更節能、更快發展,未來除了NVIDIA,還會有其他晶片業者投入。不管是什麼樣的AI應用,都有機會在市場中占據一席之地,這取決於業者如何把握機會,利用自身已具備的優勢切入相關應用。
台灣是否有必要開發自己的大型模型
栗永徽再提問,台灣是否有必要開發自己的LLM或者是大型的基礎模型?如果我們自己不做的話,會不會有一些我們現在還看不到,但是未來可能會發生的一些隱藏的風險?
花凱龍指出,微軟、Google、Meta等公司在AI領域的投資不斷增加,競爭相當激烈,在這種環境下,中小企業資本額小,難以進行大型研發,應利用成功的模型進行應用創新。在研究領域,如何持續培養關鍵技術人才是重要議題,政府需考慮語言、國防等多方面需求,合理配置資源。
古倫維認為,開發模型後要有持續改進和運行的資源,以保持技術領先。台灣若擁有自己的大型語言模型,不僅能培養這個領域的技術人才,也有機會提升國力,但這是一項進展快速的服務型技術應用,需要持續運行的資源,否則效果有限。
陳忠誠認為,台灣應開發自己的基礎模型,以實現自己想像的未來AI,避免掌握在少數公司手中。語言模型與地域和地緣政治相關,每個語言的資料來源不一樣,反應也會不一樣,回答的方式也會不一樣。在東南亞市場包括印尼文、泰文、越南文,其實有很多的商機,台灣若能開發相關技術,將抓住市場機會。未來會有多種垂直應用場景,如果都掌握在少數的雲端大廠,這些大廠不見得會有時間及能力去幫各式各樣的問題客製化。台灣不管是從最底層的IC硬體系統工程、AI的模型資料,到各式各樣的垂直領域都有很好的人才,所以AI產業界未來可以參與的空間非常大。
台灣產官學界必須通力合作
若台灣要做自己的大規模基礎模型,資源應該要如何整合?產官學界分別可以扮演什麼樣的角色,需要投入什麼樣的資源才是足夠的?陳忠誠認為,做大型語言模型有3個要素:計算能力、資料及AI人才。國家如果可以投資建設下一代的AI基礎建設,配合產業界的人才投入,以及學界很多非常優秀的學者,高品質資料和下一代AI基礎建設是關鍵,學界在模型訓練提供幫助,產業界則負責應用實踐。
打造國家級大型語言模型需要各式各樣的政策,模型的發展不是突然的成長,而是需要經歷一段披荊斬棘的過程,學界在這階段可以提供會是非常大的幫助,產業界的能力就會比較局限。這是一個很大也應該做的工程,但絕對不是單一單位可以獨立完成,所以非常期待產官學界可以一起合作。
古倫維表示,現在面臨的問題,就是相關人才比較短缺。如果說要做自己的大型基礎模型,可能整個產業鏈要先有大公司去帶動,然後就是往正向循環發展,才會有比較多的機會培養出人才,並且留在台灣來做AI相關的技術發展。
花凱龍指出,政府有沒有針對未來的應用情境做好評估,是非常重要的前提,因為每一次要訓練的成本其實並不低,必須思考清楚使用情境,合理規劃投入的資源,確保持續維護和發展。政府的規劃清晰,業者更能理解政府意圖,創造應用場景的價值,未來的貢獻清楚了,要怎麼投資才會清楚,整個面向就會更完整。
栗永徽總結,若台灣要開發大型語言基礎模型,應先確定目標,由資源最多的政府帶頭,結合產業界力量,尋求好的應用,讓整件事情可以變成一個可持續的狀態。學界可協助技術深化,未來可能有更大的模型能融合不同技術,讓AI朝向更高智慧發展,迎接新AI時代。
