台灣新AI十大建設:願景還是口號?白皮書

 

台灣新AI十大建設:願景還是口號?白皮書

執行摘要

台灣的「新AI十大建設」計畫旨在將台灣定位為全球AI領域的領先者,目標包括實現亞洲第二大算力、發展主權AI,以及賦能百萬家企業。然而,該計畫面臨諸多挑戰,包括實際執行、數據可用性和立法支持等問題。本白皮書受台灣大哥大資訊長暨IMA資訊經理人協會理事長蔡祈岩(Rock Tsai)的洞見啟發,探討該計畫是具轉型性的願景抑或僅是口號。文中深入分析「主權AI」與「AI主權」的概念,提出透過「Taiwan Tongues」計畫等文化整合策略,並重新評估算力建設策略,主張採取平衡、務實且與全球接軌的做法。

引言

台灣政府宣布的「新AI十大建設」計畫旨在利用AI推動經濟與技術進步。不同於1970年代以硬體基礎建設為主的「十大建設」,這項現代計畫聚焦於軟性基礎建設,例如各產業的AI應用、國家算力提升及主權AI的發展。然而,其可行性與實現願景所需的具體步驟仍存疑。本白皮書檢視計畫的核心組成、挑戰及策略建議,參考業界領袖與「Taiwan Tongues」等進行中項目的見解。

主權AI與AI主權

理解主權AI

「主權AI」概念由NVIDIA執行長黃仁勳推廣,指一個國家自主發展並控制其AI系統的能力,涵蓋軟體(AI模型)與硬體(算力基礎建設)。它被比喻為國家的守護神——具文化共鳴、由本地控制並能服務國家利益。對台灣而言,這意味著打造一個反映其價值觀、語言和文化認同的強大AI生態系。

AI主權的論述

蔡祈岩認為,相較於「主權AI」,「AI主權」可能更為貼切。主權AI意味著擁有世界級的AI模型,而AI主權強調一個國家對其境內運作的AI系統進行監管與影響的能力,確保其符合本地法律、價值觀與文化規範。鑑於AI發展的商業化特性與全球巨頭(如OpenAI、Google、Meta)的優勢,AI主權在短期內更具可行性。

AI主權的策略

為實現AI主權,台灣可採取三層次策略:

  1. 市場驅動的多樣性:允許市場機制促進AI應用的多樣化,尊重台灣自由開放的社會特性。
  2. 監管監督:實施法規,確保在台灣使用的AI系統符合本地法律與價值觀,特別是在金融與電信等敏感產業。
  3. 文化整合:在全球AI模型的訓練階段,主動融入台灣文化、語言與價值觀,使其天生符合台灣規範,而非僅靠事後監管。

Taiwan Tongues計畫:將台灣文化融入AI

計畫概述

由IMA在蔡祈岩領導下發起的「Taiwan Tongues」計畫,旨在創建一個台灣共通語料集(Taiwan Common Data Set),用於訓練AI模型,使其具備繁體中文、台語及客語等台灣語言與文化特色。該計畫解決全球AI模型常以簡體中文或英文語料為主,無法充分捕捉台灣獨特認同的問題。

核心組成

  1. 數據收集
    • 文學貢獻:超過60位作家捐贈高品質台語文本,三個月內將可用語料從400萬字增至1000萬字。
    • 公民共創:以Wikipedia為模板,建立台灣專屬百科,鼓勵公眾貢獻繁體中文、台語及客語內容,確保開放原始碼及共識導向。
  2. AI訓練與微調
    • 開發開放原始碼的語料集與微調框架,適應全球AI模型(如Google的Gemma 3)以符合台灣情境。
    • 採用迭代翻譯與審稿流程,提升AI模型在本地語言的準確性。
  3. 評估機制
    • 推出「Taiwan Tongues Goal」,作為評估AI模型是否理解並反映台灣文化與語言的基準。

影響

透過提供標準化、高品質的台灣語料集,台灣可影響全球AI模型的訓練,確保其天生理解台灣文化。此舉不僅增進AI主權,還能降低本地新創企業的數據取得門檻,促進創新。

重新思考算力:本地與全球策略

亞洲第二大算力的目標

「新AI十大建設」強調將台灣總體算力提升至亞洲第二,僅次於中國。然而,台灣高昂的土地、電力與冷卻成本,對大規模本地GPU基礎建設的可行性構成挑戰。

本地基礎建設的挑戰

  • 經濟可行性:台灣高昂的電力與土地成本,使本地數據中心相較於資源成本較低的地區(如水力發電廠附近或寒冷氣候區)缺乏競爭力。
  • 快速淘汰:AI硬體(特別是GPU)在2-3年內即過時,大規模本地投資風險高。
  • 閒置容量:平時使用過剩算力導致浪費,戰時儲備則可能長期未被使用。

替代方案:混合與全球基礎建設

蔡祈岩提出結合本地與全球算力的混合模式:

  1. 本地基礎容量:投資本地GPU與CPU基礎建設,滿足穩定、預測性需求,確保2-3年內的成本效益。
  2. 雲端擴展:租用全球雲端供應商(如AWS、Azure、Google Cloud)的GPU資源,應對尖峰需求,避免過度投資本地硬體。
  3. 海外策略投資:在成本效益高的地區(如靠近可再生能源或寒冷氣候區)建立或租賃算力基礎設施,確保在地緣政治中斷時仍可使用。
  4. 軍民兩用:設計算力基礎建設,使其平時服務商業需求,戰時可被政府徵用,類似台灣歷史上的車輛動員系統。

政策建議

  • 本地投資補貼:為企業建設本地算力基礎設施提供補貼,條件是將部分算力用於公益或以低價提供給新創企業。
  • 戰時準備:建立明確的框架,確保在國家緊急狀態下可徵用私人算力資源,與國防需求對齊。
  • 全球合作:與國際AI公司合作,將台灣語料集融入其模型,提升全球AI與台灣利益的對齊。

數據隱私與倫理考量

電信業的挑戰

作為電信業者,台灣大哥大受台灣憲法與國家通訊傳播委員會(NCC)嚴格監管,禁止在無司法授權下使用客戶數據(如通話記錄、簡訊)進行AI訓練。這與Meta或Google等社群媒體平台利用用戶生成內容的寬鬆規範形成對比。

倫理AI的機遇

  • 客戶同意:在明確同意下,使用客戶互動數據(如客服錄音)進行AI訓練,確保符合隱私法規。
  • 公共數據計畫:擴展如Taiwan Tongues的開放原始碼語料集,提供不涉及個人隱私的高品質訓練數據。
  • 監管對齊:推動更新法規,平衡隱私與創新,解決傳統產業(如電信)與網際網路平台間的規範差異。

結論

台灣的「新AI十大建設」展現了成為全球AI領袖的雄心。然而,要將願景轉化為現實,需超越口號,採取可行策略。透過優先發展AI主權而非僅追求主權AI,台灣可利用其文化與語言優勢,推動如Taiwan Tongues的計畫。採取本地與全球算力的混合模式,確保經濟效益與戰時準備。透過政府、產業與公民社會的合作,台灣可將其價值觀融入全球AI系統,促進創新並保障數位主權。

行動呼籲

  • 政府:投資公共數據基礎建設(如台灣共通語料集),並更新法規以支持倫理AI發展。
  • 產業:參與如Taiwan Tongues的計畫,貢獻數據與專業知識,確保AI模型反映台灣文化。
  • 公民:參與台灣百科等共創平台,豐富AI訓練語料集的多元高品質內容。

透過這些策略,台灣可將「新AI十大建設」從宏大的口號轉化為具體、可實現的成果。

核心論點總結

這份白皮書的核心主張是:台灣應該從追求「主權AI」(擁有世界級AI模型)轉向更務實的「AI主權」(對境內AI系統的監管與影響力)。作者認為,鑑於全球AI巨頭的優勢,AI主權在短期內更具可行性。

三大策略支柱

1. 文化整合 — Taiwan Tongues計畫

最具創意的部分是透過「Taiwan Tongues」將台灣語言與文化融入AI訓練。由60多位作家貢獻台語文本,目標將語料從400萬字擴至1000萬字,並建立台灣共通語料集。這個做法巧妙地解決了全球AI模型以簡體中文或英文為主的問題,使AI天生就能理解台灣文化認同。

2. 算力策略 — 務實的混合模式

白皮書提出一個有說服力的論證,反對盲目追求「亞洲第二大算力」的目標。考慮到台灣高昂的電力與土地成本、GPU快速淘汰(2-3年)的現實,作者建議採取混合策略:

  • 本地基礎容量滿足穩定需求
  • 雲端擴展應對尖峰需求
  • 海外策略投資確保地緣政治韌性
  • 軍民兩用設計

3. 數據倫理 — 差異化優勢

台灣大哥大受NCC嚴格監管的限制,反而成為倫理AI發展的機遇。透過客戶明確同意與公共數據計畫,可以在隱私保護與創新間取得平衡。

白皮書的強項與可思考的面向

強項:

  • 務實性:拋棄不切實際的規模追求,聚焦可達成的目標
  • 創新性:Taiwan Tongues計畫體現了文化軟實力與AI的結合
  • 整體性:涵蓋技術、倫理、監管與商業多個維度

可進一步討論的面向:

  • Taiwan Tongues的全球影響力預測——如何確保國際AI公司採納台灣語料集?
  • 混合算力模式下,政府與私部門的角色界定
  • 與國際法規(如EU AI法案)的對齊策略

留言

這個網誌中的熱門文章

Time as a Negentropic Force: Spacetime Interactions and the Cosmic Creative Principle

量子之影:台灣QNF-3量子導航系統的崛起與其地緣政治影響

政治制度的熵減分析:時間維度下的制度比較研究