Page 58 - 鴻海研究院2023年年鑑
P. 58
Hon Hai Research Institute 院長序 執行長序
鴻海研究院2023年鑑
等,可應用在自駕車光達攝影機、醫學超 巨大模型的應用樣貌 整合協作
音波、核磁共振等訊號觀察。 簡仁宗教授表示,大規模預訓練模型
中央研究院資訊科學研究所古倫維研 的對話AI系統,倚賴自動語音識別、自然
究員判斷,優化語言模型的推理,個性 語言理解、對話管理器,以及自然語言生
化,是下個階段重要議題。 成、文本、語音多元組件,參與精密的多
主軸3》大規模視覺基礎模型 模態機器學習,需要在既有基礎模型,重
鄭文皇教授從目前智慧製造、自 建編程、重塑功能化的系統架構。
駕車情境,產生通用物件偵測(Object 華碩電腦(ASUS)算是早期參與的先
detection)、AOI自動光學檢測模型種種需 鋒,集團旗下「台灣智慧雲端」(TWSC)技
求,可見未來會有更多模態應用任務。 術長陳忠誠協理,分享「台灣杉二號」超級
以技術面探討策略,簡單來說就是2個 電腦成功微調的大型語言模型BLOOM經驗
階段:收集大量多模態資料,包括文字、 談,其參數量達到1,760億個,可使用840張
語音、影像、影片甚至3D立體資訊,訓 GPU進行訓練,與Chat GPT實力相當。
練出一個多模態基礎模型,再由基礎模型 下一個世代的AI潮流,即是AI 2.0大語
(Foundation model)依據下游任務進行 言模型及多模態AI,運用大模型來解決語
微調訓練(Finetuning)。最後進入市場, 言、影像、視訊問題,需要超級電腦和大
運用提示工程(Prompt Engineering)特 量平行運算,結合一路走來的大語言模型
化模型解決各種問題。 技術以文生文,以文生圖,甚至以文生成
隨著多模態基礎愈來愈完整,清華大 影片。
學電機資訊學院賴尚宏副院長試圖展示,
大量模型進入「電腦視覺深度多模態學 論壇多角化視野
習」,透過文字和圖像共同預訓練的視覺 勾勒AI 2.0未來藍圖
語言模型,可以精準理解圖像和文本,作 見證「台灣智慧雲端」(TWSC)開發
為「零樣本學習」(Zero Shot Learning) 的「台灣杉二號」可以成功微調BLOOM大
的基礎,利用既有數據資料,建構未知場 型語言模型,可以肯定的是,「多模態基
景概念。 礎模型」正在一步步成形,想見AI未來發展
這類多模態基礎模型研究,特別廣泛 前景。Irina期待公部門大規模投入演算資
應用在對話AI系統中。國立陽明交通大學電 源,建立開源AI的基礎模型,落地學術研
機學院終身講座教授簡仁宗以更長遠藍圖 究、社會公眾等應用領域。
預設,一旦語音對話系統成熟,將來可能 Irina一再鼓勵開放原始碼共享,面對
進入客服、娛樂、健康領域用途;屆時, 未來全新的AI新時代,實際上不只有技術屏
實務上直接接觸自然語言,基礎模型會面 障,更大的挑戰在於,人類社會與科技倫
臨更直接的挑戰。 理的認知,亟需跨域合作解決資安疑慮。
58
ɨʹ
ᒿऎӺ৫ ʫ˖ ᒈැೊᓃ JOEE
ᒿऎӺ৫ ʫ˖ ᒈැೊᓃ JOEE ɨʹ

