ben chen
這支影片點出了一個超級驚人的數據,這也是為什麼日本人現在對「國產 AI」這麼焦慮的原因!
這是 Preferred Networks (PFN) 社長岡野原大輔在 TBS CROSS DIG 節目中的訪談。簡單來說,他們認為如果不做自己的 AI,日本的語言文化甚至經濟都會面臨危機。
1. 震撼的數據:日語資料只佔 0.1%?! 
* 你可能以為網路上的日語很多,但在 ChatGPT 或 Gemini 這些全球超大型 AI 的訓練資料裡,日語資料的佔比其實少得可憐,大約只有 0.5%,甚至可能低到 0.1% [00:12]。
* 這意味著這些 AI 的「大腦」裡,99% 以上都是英語或其他語言的邏輯。
2. 為什麼這很危險?(和資料量的關係) 
* 「AI 日語」的反撲: 因為訓練資料太少,AI 輸出的日語雖然通順,但可能只會用「某幾種特定的表達方式」,導致日語的豐富性和文化底蘊快速消失 [00:00]。
* 下一代的危機: 岡野原社長擔憂,如果未來 10 年、20 年大家都在用這種 AI,日本人的下一代可能會是被「AI 說的日語」養大的,導致原本的語言文化被稀釋掉 [00:23]。
3. 國產 AI 的戰略意義 
* 經濟上的「數位赤字」: AI 是未來的基礎建設(像水電一樣)。如果日本只能租用外國的 AI,資金就會不斷流向海外(數位赤字)[04:25]。
* 握有選擇權: 不是要完全排斥外國 AI,但在關鍵領域(特別是涉及日本文化、機密或獨特價值觀時),必須要有「自己能掌控」的國產選項,不能把命運全交給別人 [00:31]。
一句話總結:
如果不做國產 AI,日本不僅錢會被賺走,連「什麼是道地的日語」這件事,未來可能都是由外國 AI 來定義的。這聽起來是不是有點像文化層面的生存保衛戰?
如果是你,你會比較信任用「全繁體中文資料」訓練出來的台灣國產 AI,還是覺得用 ChatGPT 翻譯的其實就夠了呢?
沒有留言:
張貼留言