2025年12月24日 星期三

【 A. I. Artificial Intelligence 產業2 】為何 AI 巨頭紛紛斥巨資蓋基建?算力遠遠不夠的原因 - 推理時的運算ChatGPT 生活運用

 

ChatGPT 生活運用

為何 AI 巨頭紛紛斥巨資蓋基建?算力遠遠不夠的原因 - 推理時的運算
這五年來,主宰 AI 進化的法則,大家都知道就是 Scaling Laws。但你認為的 Scaling Laws 如果還是那個 Chinchilla Scaling Laws,即無限增加算力及資料時,AI 的能力就會線性增長,老實說,這個時代早就過去了。
不管是 Ilya 或 Hassabis 都說了,訓練時的 Scaling Laws 已經從增長期進入緩慢期,我們需要另個比擬 Transformers 的劃時代架構,才能再進入更高層次的 AI 領域。但矽谷大佬們為何還是忍住一肚子火交「輝達稅」買 GPU 呢?為何皮衣老黃還是毫無羞愧用 75% 的高毛利賣 GPU 呢?因為在這些矽谷大老心中,就算預訓練的瓶頸已經達到,但真正要消耗算力的,竟然是在推理階段的大量 Token 產生,這被稱為 Inference-Time Compute,或是 Inference-time Scaling Laws。
怎麼說?
這是一個 AI 發展典範的轉移。過去我們認為「模型訓練好就是固定的」,要變強只能重新訓練(Training-time compute),改變它的參數才行。但現在的觀念變了。即使模型不重新訓練,只要給它更多「思考時間」(Inference-time compute),它就能變得更強。
這就是當代最強的高階推理模型背後的秘密。我們可以把它想像成從「直覺反應」進化到「深思熟慮」,你看到的最新模型,包括 GPT-5.2,Gemini 3 Flash/Pro 或 Claude 4.5 Opus/Sonnet 都是如此。
這個稱為「推理期的可驗證式合成資料」(Verifiable Synthetic Data)可能在一般文字的生成上表現差強人意,但在「程式碼生成」或「數學推理上」的具體運作流程則是強上加強,這邊舉個具體的例子說明它如何運作,程式碼生成是最棒的範例。
程式碼有一個人類語言沒有的特性:它能被執行,而且非黑即白(對就是對,錯就是錯)。我們現在要利用這個可驗證合成資料的目的,就是要打造一本「完美題庫」,作為日後的訓練。
假設我們要訓練一個模型學會寫 Python 程式,但網路上高品質的「題目 + 完美解法 + 詳細思考過程」不夠多。我們該怎麼憑空變出這些資料?
這就是 Rejection Sampling(拒絕採樣) 或 Best-of-N 的流程。下面是詳細的步驟。
第一步:大量生成(廣撒網):
我們給一個還算聰明的模型難題
* 題目: 請寫一個 Python 函數,計算費氏數列的第 n 項,要求時間複雜度必須低於 O(n)。
* 然後要求模型生成 100 個不同的解答 (Rollout)。 這時候,模型會產生各種品質的代碼:
* 解答 A:寫錯了,語法錯誤。(垃圾)
* 解答 B:寫對了,但用遞迴寫法,速度很慢(O(2^n))。(普通)
* 解答 C:寫對了,用矩陣快速冪,速度極快。(極品)
...(其他 97 個各種奇怪的解法)
第二步:硬體驗證(過濾器)
這時候,不需要人類介入。我們寫一個自動化的「判卷程式(Unit Tests + Profiler)」去跑這 100 個解答:
* 編譯檢查: 解答 A 報錯 -> 淘汰。
* 正確性檢查: 輸入 10,看輸出是不是 55。不對的 -> 淘汰。
* 效能檢查: 輸入 10000,看誰能在 0.1 秒內跑完。解答 B 超時 -> 淘汰。
* 最後,系統發現解答 C 是唯一通過所有測試,且效能最高的代碼。
第三步:逆向合成(Back-Translation / Synthesizing Reasoning)
現在我們有了「題目」和「正確代碼(C)」,但這還不夠。我們要教模型「思考」。 我們再把「題目」和「解答 C」丟回給模型,下一個指令:
「這是一個完美的解答,請你詳細解釋這段代碼為什麼這樣寫?請一步步推導出矩陣快速冪的思考過程。」
模型會根據正確答案,反向生成出一段高品質的「思維鏈(Chain of Thought)」。
第四步:存入資料庫
最後,我們得到了一組由 AI 生成,但經過嚴格數學驗證的完美教材:
Input: 題目
Output: 高品質思維過程 + 完美代碼(解答 C)
這就是合成資料。 它不是從網路上抄來的,也不是蒸餾自別人的模型(因為別人的模型可能也寫不出解答 C),它是透過「暴力嘗試 + 嚴格驗證」篩選出來的「黃金樣本」。
為什麼這招比「蒸餾」更強?
第一就是因為 GitHub 上的程式碼有很多是初學者寫的垃圾程式碼,如果你只用網路資料訓練,模型就會學到垃圾寫法。但透過上述流程,模型只會學到「被驗證過最高效」的寫法(寫法 C)。
第二就是可以打破資料牆。數學題、邏輯題、物理模擬都可以這樣做。只要能寫出「驗證程式(Verifier)」,就能無限生成資料。Google DeepMind 的 AlphaGeometry 就是用這種方法,憑空生成了幾億則幾何證明題來訓練,最後解題能力拿到國際數學奧林匹亞金牌等級。
如果是寫作文、寫詩: 那確實很像「蒸餾」,因為很難驗證好壞,容易造成模型崩潰。
如果是寫程式、數學、科學: 那就是「演化」,透過優勝劣汰的機制,讓合成資料的品質超越原始資料。
上面還是使用資料來訓練,但真正的在用戶提問時,即時運用類似上述的原理來產生回答的嗎?這就是到 Inference-time compute 的概念。
LLM 在產生資料時,會有兩個作法,稱為 System 1 和 System 2,這和人類一模一樣。這是心理學家 Daniel Kahneman 提出的。
System 1 為快思考,是傳統的 LLM 運作方式。看到問題,憑藉訓練時的「直覺」直接預測下一個字。就像你被問「1+1等於幾?」,你不用算就能脫口而出「2」。這個方式的優點就是快,便宜。但缺點就是遇到複雜邏輯題容易「一本正經講幹話」,因為它是線性的,一旦前面預測錯了,後面就跟著錯,無法回頭。
System 2 稱為慢思考,看到問題,不准馬上回答。模型內部先啟動一個「隱藏的思考流程」。就像你遇到一題微積分,你需要拿出一張紙在上面試算、畫圖、發現算錯了劃掉重算,最後才把乾淨的答案寫在考卷上。這類模型回應時會顯示「Thinking...」,並且等待時間較長。
Inference-time Compute 就發生在此。當你問一個複雜問題時,推論模型在那個「等待時間」內,其實是在瘋狂地進行我們上一段提到的「生成 -> 驗證 -> 修正」循環,只是這一切都發生在短短幾秒鐘內。下面會做幾件事
A. 隱藏的思維鏈(Hidden Chain of Thought)
模型開始生成一連串的「思考 Token」,這些 Token 不會顯示給你看。
(模型內心獨白):用戶要我寫一個貪吃蛇遊戲。我應該先決定用什麼庫?Pygame 好像太重了,用 HTML Canvas 好了。等等,用戶之前好像說過喜歡 Mac 風格... 那我介面要設計成圓角。先試著寫一段邏輯... 咦,這裡碰撞檢測好像寫錯了,如果是撞到自己的身體應該要 Game Over。修正一下...
B. 自我反思與搜索(Self-Correction & Search)
這就是最關鍵的一步。傳統模型是一條路走到黑,推論模型則像是在走迷宮(Tree Search):
嘗試路徑 A: 走到一半發現邏輯不通 -> 主動放棄(Backtrack)。
嘗試路徑 B: 邏輯通順,但效率太低。
嘗試路徑 C: 完美。
它會在內部模擬多種可能的解法,只有當它對結果有足夠的「信心分數」時,才會把最終的路徑 C 翻譯成文字輸出給你。
如果是這樣搞,算力當然不夠!(黃仁勳表示...)。
首先就是推理成本暴增。以前問一個問題,模型輸出 100 個字,就消耗 100 個單位的算力。 現在問同樣問題,模型內部可能生成了 50,000 個字的「思考過程」(你看不到),最後只輸出 100 個字。 推理階段的算力需求可能會變成原來的 100 倍甚至 500 倍。
另外就是打破「模型大小」的限制。過去我們認為要變聰明,模型參數就要變大(例如從 7B 變成 70B)。但現在小模型只要給夠長的「思考時間」,它的表現可以超越一個秒回的大模型。這在業界被稱為「Scaling Laws for Inference(推理的擴展定律)」,智力可以透過「時間」來換取,而不僅僅是透過「參數量」。
「合成資料」是在訓練前把教材準備好(Offline)。 而現在的「推論模型」則是把這個過程搬到你提問的那一瞬間(Online/Real-time),就像一個考試時會反覆檢查驗算的學生,雖然交卷比較慢,但考 100 分的機率遠高於那些寫完就交卷的學生。
所有巨頭都在等待 AI 爆發的時刻,現在不蓋基建就會被擠出賽道,連機會都沒有,但當 AI 爆發時,全世界如果大家都用上 AI,並且要求模型在合理的時間內思考出正確的答案,那他們是對的,目前算力遠遠不夠。說句難聽的話,就算現在模型不再訓練不進步了,就使用現在的模型,如果用的人一多,算力就是不夠了。Scaling Laws 還活著,只是換了一個戰場,如果現在底層架構不修改,這麼耗能的使用方式會一直爆炸成長,這也難怪全世界的 AI 頂級廠商不惜血本也要拼命擴建,也是我們這些使用者造成的呢。

王德威(David Der-wei Wang)宋偉杰(Weijie Song)世界中的東北:東北讀本(上)東北文藝復興:東北讀本(下)阿成(阿城本名)的小說《安重根擊斃伊藤博文》





世界中的東北:東北讀本(上)
Worlding Northeast China: Northeast China Reader. Volume I作者: 王德威、宋
原文作者: Edited by David Der-wei Wang and Weijie Song
出版社:時報出版 
出版日期:2025/





在臺灣讀東北是一種地理的拓撲實驗,或重新理解「文學即歷史」的方法。遠和近、大和小,必然和偶然,並置和岐出,相互交錯,產生前所少見的史觀。「東北」作為一意義不斷敞開生成的所在,臺灣參與其中,引譬連類,新意綻生。
讀本、選文所講述、投射、召喚的東北全息圖景,在在昭示我們:關外、邊地並非歷史地理的邊緣,而是知識考古、思想糾纏、文學實驗、想像未來的前沿。
──王德威、宋偉杰(本書主編)
 
從中古到當代,時間橫跨近2000年
中文世界第一本關於中國東北全方位的歷史人文讀本
閱讀東北的最佳入門導引,任何系所師生適讀
本冊包含重要作家契訶夫、夏目漱石、芥川龍之介、安部公房、哈金、王安憶、傅斯年、遲子建、王鳳儀、梁啟超、魯迅、蕭軍、劉賓雁、蕭紅、端木蕻良、溥儀、梅娘、川島芳子、間宮林藏、愛德加‧斯諾、巴金……
100多位作家 120餘篇作品,東北故事既傳奇也蒼茫,既豪放也悲涼
 
東北是現代中國最複雜、最具爆炸性的區域,也是東亞進入世界的「核心現場」之一。
甲午戰爭、九一八事變、滿洲國、人民共和國……中國沒有其他地區在過去一世紀經歷過如此劇烈的震蕩和張力。
闖關東、「哈爾濱摩登」、「共和國長子」、北大荒、下崗潮……東北不僅是亞洲的「方法」,更是現代人與歷史和環境搏鬥的舞台。
如何敘說關內與關外,東北與東亞,移民與殖民,遺民與夷民,革命與後革命……種種交錯的線索,都是極有潛力的話題。而東北文學以其多元,以其顛簸,投射斯土斯人的深刻經驗。
 
「東北」不僅是國族地理方位、風土人情的聚焦,更是興觀群怨的喻象。從漢魏曹操的詠歎到唐代王昌齡的感懷,從清代謫人吳兆騫、楊賓的悲吟到近現代有志之士梁啟超、魯迅的吶喊,東北不斷註記帝國疆界的消長,以及隨之而起的情感坐標。東北也是世界中的東北。
從文學研究的角度探討東北,方法之一,是重新講述東北故事。所謂故事,當然不只是虛構的起承轉合,而更關乎一個社會如何經由各種對話、傳播形式,凝聚想像共同體。
讀本則嘗試搭設一個全息東北的文藝裝置:在選文褶皺處顯影知識路徑,在信息隱秘點考掘問題方法,在敘事裂隙間叩問生存困境,在現象魅影中召喚生命魂靈。
 
《東北讀本》是中文世界以及全球第一本關於中國東北全方位的歷史人文讀本。從曹操到魯迅,從蕭紅到遲子建,從契訶夫到夏目潄石,從「東北作家群」到「東北文藝復興」⋯⋯東北故事既傳奇也蒼茫,既豪放也悲涼。
 
本書精采篇章:
◎為什麼在臺灣讀東北?
◎全息東北
◎文學東北與中國現代性
◎山海關外
◎有聲的東北
◎東北作家群
◎滿洲國浮沉錄
◎世界中的東北
◎跨過鴨綠江
 

作者介紹

王德威(David Der-wei Wang
美國哈佛大學東亞語言與文明系暨比較文學系Edward C. Henderson講座教授,中央研究院院士,美國國家藝術與科學院院士,英國國家學術院國際院士。著有《小說中國:晚清到當代的中文小說》、《如何現代,怎樣文學》、《後遺民寫作》、《現代「抒情傳統」四論》、《危機時刻的知識分子》、《可畏的想像力:當代小說31家》、Fictional Realism in 20th Century China: Mao Dun, Lao She, Shen Congwen(《茅盾‧老舍‧沈從文:寫實主義與現代中國小說》),Fin-de-Siècle Splendor: Repressed Modernities of Late Qing Fiction, 1849-1911(《被壓抑的現代性:晚清小說新論》),The Monster That Is History: History, Violence, and Fictional Writing in Twentieth-Century China(《歷史與怪獸:歷史‧暴力‧敘述》),The Lyrical in Epic Time: Modern Chinese Intellectuals and Artists Through the 1949 Crisis(《史詩時代的抒情聲音:二十世紀中期的中國知識分子與藝術家》)、Why Fiction Matters in Contemporary China等。主編A New Literary History of Modern China(《哈佛新編中國現代文學史》)、《南洋讀本:文學‧海洋‧島嶼》等。
 
宋偉杰(Weijie Song
北京大學中文系博士,哥倫比亞大學東亞系博士,美國羅格斯大學亞洲語言文化系副教授,研究生部主任。著有Mapping Modern Beijing: Space, Emotion, Literary Topography(《測繪現代北京:空間,情感,文學地形圖》)、《中國‧文學‧美國:美國小說戲劇中的中國形象》、《從娛樂行為到烏托邦衝動:金庸小說再解讀》等。(合)譯有《被壓抑的現代性》、《跨語際實踐》、《比較詩學》、《公共領域的結構轉型》、《理解大眾文化》、《大分裂之後》等。
 

目錄

前言:為什麼在臺灣讀東北?/王德威
序:全息東北/宋偉杰
 
導論:文學東北與中國現代性/王德威
 
1章 山海關外
導讀 山海關外/王德威
曹操 觀滄海
王昌齡 出塞
嘎仙洞石刻祝文
宋徽宗趙佶 在北題壁
金完顏亮 念奴嬌‧詠雪
吳兆騫 長白山賦並序
顧貞觀 金縷曲詞二首
楊賓 柳邊紀略
梁啟超 新中國未來記
瞿秋白 餓鄉紀程
馮至 北遊
李克異 廟和墳
王充閭 土囊吟
素素 永遠的關外
遲子建 喝湯的聲音
 
2章 有聲的東北
導讀 有聲的東北/王德威
傅斯年 東北史綱
魯迅 田軍作《八月的鄉村》序
田漢、聶耳 義勇軍進行曲
趙一曼 濱江述懷
楊靖宇 東北抗聯第一路軍軍歌
王鳳儀 王鳳儀言行錄節錄
蕭軍 閒話「東北問題」
全勇先 昭和十八年
阿成 安重根擊斃伊藤博文
劉賓雁 人妖之間
王安憶 一把刀,千个字
 
3章 東北作家群
導讀 東北作家群/王德威
李輝英 最後一課
蕭紅 生死場
張寒暉 松花江上
金劍嘯 興安嶺的風雪
端木蕻良 鴜鷺湖的憂鬱
舒群 沒有祖國的孩子
羅烽 第七個坑
駱賓基 幼年
王小妮 相遇──蕭軍,蕭軍,蕭軍!
 
4章 滿洲國浮沉錄
導讀 滿洲國浮沉錄/王德威
溥儀 我的前半生
穆儒丐 福昭創業記
鄭孝胥 九日
梁山丁 山風
爵青 哈爾濱
梅娘 女難
川島芳子 詩
羅繼祖 大雲書庫藏書、搜集、破壞、整理、歸宿記略
金仁順 小野先生
 
5章 世界中的東北
導讀 世界中的東北/宋偉杰
間宮林藏 東韃紀行(下卷)
契訶夫 書信選
夏目漱石 滿韓漫遊
芥川龍之介 落頭譚
弗‧克‧阿爾謝尼耶夫 在烏蘇里的莽林中
秋原勝二 故鄉喪失
今村榮治 同行者
金東仁 赭色的山──某醫師的筆記!
尹東柱 數星星的夜
安壽吉 北鄉譜
拜闊夫 獵鹿
安部公房 老村長之死(岡地村物語〔一〕)
愛德加‧斯諾 東北:工業重地
 
6章 跨過鴨綠江
導讀 跨過鴨綠江/宋偉杰
魏巍 誰是最可愛的人
楊朔 三千里江山
路翎 洼地上的「戰役」
巴金 團圓
公木 英雄讚歌
王北山 韓戰生死戀
哈金 戰廢品
 

在臺灣讀東北是一種地理的拓撲實驗,或重新理解「文學即歷史」的方法。遠和近、大和小,必然和偶然,並置和岐出,相互交錯,產生前所少見的史觀。「東北」作為一意義不斷敞開生成的所在,臺灣參與其中,引譬連類,新意綻生。
讀本、選文所講述、投射、召喚的東北全息圖景,在在昭示我們:關外、邊地並非歷史地理的邊緣,而是知識考古、思想糾纏、文學實驗、想像未來的前沿。
──王德威、宋偉杰(本書主編)
 
從中古到當代,時間橫跨近2000年
中文世界第一本關於中國東北全方位的歷史人文讀本
閱讀東北的最佳入門導引,任何系所師生適讀
本冊包含重要作家齊邦媛、鍾曉陽、郭松棻、白先勇、班宇、鄭執、雙雪濤、鍾理和、寶石Gem(董寶石)、劉慶、嚴歌苓、遲子建、蕭紅、張抗抗、梁曉聲、丁玲、周立波、艾青、草明、聶紺弩、曲波……
100多位作家 120餘篇作品,東北故事既傳奇也蒼茫,既豪放也悲涼
 
東北是現代中國最複雜、最具爆炸性的區域,也是東亞進入世界的「核心現場」之一。
甲午戰爭、九一八事變、滿洲國、人民共和國……中國沒有其他地區在過去一世紀經歷過如此劇烈的震蕩和張力。
闖關東、「哈爾濱摩登」、「共和國長子」、北大荒、下崗潮……東北不僅是亞洲的「方法」,更是現代人與歷史和環境搏鬥的舞台。
如何敘說關內與關外,東北與東亞,移民與殖民,遺民與夷民,革命與後革命……種種交錯的線索,都是極有潛力的話題。而東北文學以其多元,以其顛簸,投射斯土斯人的深刻經驗。
 
「東北」不僅是國族地理方位、風土人情的聚焦,更是興觀群怨的喻象。從漢魏曹操的詠歎到唐代王昌齡的感懷,從清代謫人吳兆騫、楊賓的悲吟到近現代有志之士梁啟超、魯迅的吶喊,東北不斷註記帝國疆界的消長,以及隨之而起的情感坐標。東北也是世界中的東北。
從文學研究的角度探討東北,方法之一,是重新講述東北故事。所謂故事,當然不只是虛構的起承轉合,而更關乎一個社會如何經由各種對話、傳播形式,凝聚想像共同體。
讀本則嘗試搭設一個全息東北的文藝裝置:在選文褶皺處顯影知識路徑,在信息隱秘點考掘問題方法,在敘事裂隙間叩問生存困境,在現象魅影中召喚生命魂靈。
 
《東北讀本》是中文世界以及全球第一本關於中國東北全方位的歷史人文讀本。從曹操到魯迅,從蕭紅到遲子建,從契訶夫到夏目潄石,從「東北作家群」到「東北文藝復興」⋯⋯東北故事既傳奇也蒼茫,既豪放也悲涼。
 
◎為什麼在臺灣讀東北?
◎全息東北
◎文學東北與中國現代性
◎共和國長子?
◎革命時代的抒情
◎東北風‧人間世
◎有靈的天地
◎新東北文學
◎靈魂的停泊

目錄

前言:為什麼在臺灣讀東北?/王德威
序:全息東北/宋偉杰
 
導論:文學東北與中國現代性/王德威
 
7章 共和國長子?
導讀 共和國長子?/宋偉杰
周立波 暴風驟雨
草明 原動力
曲波 林海雪原
李鐵 喬師傅的手藝
賈行家 斷了線的人,說不的人
 
8章 革命時代的抒情
導讀 革命時代的抒情/宋偉杰
艾青 燒荒
聶紺弩 《北荒草》二首
郭小川 刻在北大荒的土地上
丁玲 杜晚香
梁曉聲 這是一片神奇的土地
張抗抗 隱形伴侶
 
9章 東北風‧人間世
導讀 東北風‧人間世/宋偉杰
鄧剛 迷人的海
劉兆林 雪國熱鬧鎮
鄭萬隆 老棒子酒館──異鄉異聞之三
洪峰 瀚海
謝友鄞 馬嘶
孫惠芬 在迷失中誕生──《歇馬山莊》(創作談)
刁鬥 我哥刁北年表
 
10章 有靈的天地
導讀 有靈的天地/宋偉杰
蕭紅 呼蘭河傳
烏熱爾圖 七叉犄角的公鹿
遲子建 額爾古納河右岸
格日勒其木格‧黑鶴 狼獾河
劉慶 唇典
胡冬林 原始森林中的寫字檯
 
11章 新東北文學
導讀 新東北文學/王德威
雙雪濤 走出格勒
班宇 冬泳
鄭執 仙症
趙松 撫順故事集
談波 私奔
寶石Gem(董寶石) 野狼Disco
潘一擲 子弟
楊知寒 水漫蘭橋
 
12章 靈魂的停泊
導讀/王德威
鍾理和 門
白先勇 父親的憾恨──東北失守始末
紀剛 臨水溯源──談《滾滾遼河》的去脈來龍
郭松棻 介紹《沸騰的群山》
鍾曉陽 故國之痕
嚴歌苓 小姨多鶴
齊邦媛 巨流河



阿城
(作家)、伊藤博文(日本前首相)和安重根(朝鮮獨立運動家)三者關係密切,主要因作家阿成(阿城本名)的小說《安重根擊斃伊藤博文》,描寫了安重根在哈爾濱火車站刺殺伊藤博文的歷史事件,該事件是安重根為反對日本侵略朝鮮而採取的行動,使安重根成為韓國民族英雄。 
  • 安重根: 朝鮮愛國志士,因在1909年於哈爾濱火車站槍殺日本首任內閣總理大臣伊藤博文,被韓國視為民族英雄。
  • 伊藤博文: 日本明治維新時期的重要政治家,曾任日本首相,因其侵略政策而成為安重根的刺殺目標。
  • 阿城 (作家): 著名作家,其作品《安重根擊斃伊藤博文》將這段歷史事件文學化,使其廣為人知。 
事件背景:
1909年,安重根在哈爾濱火車站刺殺了正在訪問中國的伊藤博文,此舉旨在反抗日本對朝鮮的殖民統治,被視為對日本帝國主義的重大打擊。安重根的行動在中國和韓國都受到尊重,甚至在哈爾濱也設立了紀念館,但日本則視其為恐怖分子。 

網誌存檔