2026年3月25日 星期三

【 A. I. 產業8】: 大型語言模型對記憶體需求量巨大,儘管有一系列壓縮演算法,統稱為 TurboQuant.....(蕭上農) 。OpenAI 宣布關閉其短視訊應用程式 Sora,距離上線僅六個月。此舉主要是為了削減高昂的營運成本,並在潛在的 IPO 之前重新分配資源。近20個月前,韓國記憶體巨頭 SK 海力士總裁等專機來台灣訪TSMC,今天證實將在 2027 年底前,狂砸 80 億美元(大約新台幣 2580 億元),專門用來採購與升級最頂級的 EUV 曝光機.......。 亞馬遜旗下的 AWS 雖然持續投入自研硬體,最終仍向Nvidia低頭,吞下高達一百萬顆繪圖處理器(GPU)的歷史級超級訂單......。「淘金熱賣鏟子」戰術:只要這些機器人還不夠聰明,廠商們就得乖乖掏錢,繼續向輝達「繳學費」。現實世界的機器人越笨拙,輝達伺服器裡的晶片就賣得越好。阿里巴巴整合AI業務,成立Alibaba Token Hub事業群 AI算力倒向「推理」,輝達還能穩坐江山嗎? 亞馬遜擬大幅削減通過美國郵政總局寄送的包裹數量 微軟重組Copilot團隊,以加強AI業務統籌。

 結果今日美股記憶體因爲這樣大跌XD 我覺得現在這都像 DeepSeek,如果用過 Claude Code 跟龍蝦,就會知道 Token 需求量巨大XD

蕭上農 你跟 AI 聊太久,它會開始忘記你前面說過的話,回覆也變慢,這主要是記憶體問題。
大型語言模型在對話時,需要把你講過的每一句話都存成一份「會議紀錄」,術語叫 KV cache。對話越長,這份紀錄越大,大到一個長對話可能佔掉整張 GPU 記憶體的大半。這是推理成本居高不下的核心原因之一。
Google Research 發表了一系列壓縮演算法,統稱為 TurboQuant,把這份紀錄從 32 位元壓到只剩 3 位元,記憶體佔用縮小 6 倍以上,注意力運算在 H100 上快了 8 倍。在 Llama-3.1-8B-Instruct、Gemma、Mistral 三個模型上測試,基準測試精準度零損失,不需要重新訓練,直接套用。
但真正有意思的不是數字本身,是背後兩個數學技巧怎麼做到「壓這麼狠還不壞」。如果你想知道:
- 什麼是 KV cache,為什麼它是 AI 推理最大的記憶體瓶頸
- PolarQuant 怎麼用極座標和隨機旋轉把壓縮效率拉到極限
- 這對手機上跑 AI、對話長度限制、推理成本分別意味著什麼
- Google 原文說的「零損失」到底有沒有但書


----

人工智慧概覽


OpenAI 宣布關閉其短視訊應用程式 Sora(原定於 2025 年 9 月發布),距離上線僅六個月。此舉主要是為了削減高昂的營運成本,並在潛在的 IPO 之前重新分配資源。先前,用戶普遍擔憂人工智慧產生的「劣質」內容、深度偽造、版權侵權以及用戶黏性不足等問題。

Reddit


關閉的主要原因:

成本不可持續:產生逼真的影片需要耗費大量資源。有報導稱,該應用程式是一個“無底洞”,獲利前景黯淡。


專注於核心業務:OpenAI 正在將資源轉移到企業級編碼、推理模型和人工智慧代理商等利潤更高的領域,而不是維護一款面向消費者的娛樂應用。


內容安全和版權問題:該平台因允許用戶使用熱門版權角色(例如迪士尼角色)和公眾人物創建逼真影片而受到嚴格審查,導致聲譽風險和合作夥伴關係破裂。


競爭與策略轉變:隨著競爭對手的不斷進步以及與迪士尼合作關係的結束,OpenAI 決定不再將 Sora 視為獨立的消費者平台。


OpenAI 表示,他們將提供關閉該應用程式和 API 的時間表,以及相關方法。



OpenAI is shutting down its Sora short-form video app (launched Sept 2025) six months after release, primarily 
to cut high operational costs and reallocate resources ahead of a potential IPO. The decision follows widespread concerns over AI-generated "slop," deepfakes, copyright infringement, and a lack of user "stickiness".
Key Reasons for Closure:
  • Unsustainable Costs: Generating realistic video is extremely resource-intensive. Reports suggested the app was a "money pit" with poor monetization prospects.
  • Focus on Core Business: OpenAI is shifting resources to more lucrative areas like enterprise coding, reasoning models, and AI agents, rather than maintaining a consumer entertainment app.
  • Content Safety & Copyright Issues: The platform faced intense scrutiny for allowing users to create realistic videos using popular copyrighted characters (e.g., Disney) and public figures, leading to reputation risks and a collapse of partnerships.
  • Competition and Strategy Shift: With competitors advancing and the Disney partnership ending, OpenAI decided to stop treating Sora as a standalone consumer platform.
OpenAI indicated they would provide details on timelines for shutting down the app and API, as well as methods to pres
既不驚訝又非常驚訝!OpenAI 宣布「退出」AI影音生成,將關閉 Sora!
去年12月迪士尼才高調宣布,要為 Sora 而投資 OpenAI 10 億美元,合作內容包括:
- 10億美元投資換取 OpenAI 股權
- 讓迪士尼成為 Sora 的第一個主要內容授權夥伴
- 迪士尼授權旗下經典角色,包括米老鼠、漫威、星際大戰、皮克斯等,共計超過 200 個,供 Sora 訓練和生成影片。
此外,迪士尼也曾宣布發展豎屏影音平台讓粉絲運用迪士尼IP生成與分享UGC二創內容,當時許多人的理解,這也是迪士尼投資 OpenAI 的衍生效益。
現在這些都沒了!OpenAI 宣布退出AI影音生成。向 Sora 說掰掰。
接下來,還有哪些公司的哪些模型、哪些應用,會陸續退出?




你敢信嗎?一家公司居然一口氣砸下超過 2500 億台幣,就為了「瘋狂網購」一批機器 🤯 這是真實上演的全球晶片大戰。
韓國記憶體巨頭 SK 海力士這次真的是殺紅了眼,為了搶下 AI 記憶體的主導權,直接向荷蘭大廠 ASML 下了天價大單!
根據最新曝光的計畫,SK 海力士證實將在 2027 年底前,狂砸 80 億美元(大約新台幣 2580 億元),專門用來採購與升級最頂級的 EUV 曝光機。
這筆錢到底有多誇張?這金額已經佔了這家韓國巨頭到去年底總資產的將近 10%,等於是把老本都端出來、直接把身家都押上去了 💰
據了解,這種 EUV 機器就像是晶片界的「超級奈米印表機」,一台造價就高達上百億台幣,買一台的錢就足夠在台北信義區買下好幾十棟頂級豪宅。
為什麼要這麼拚命砸錢?其實一切都是為了目前紅到發燙的 AI 市場。
現在不管是什麼頂級的 AI 伺服器,都需要一種叫做 HBM 的高頻寬記憶體,而 SK 海力士為了讓未來的記憶體跑得更快、效能更猛,正準備全面推進到更先進的「1c」製程。
他們甚至急到把清州新廠房的設備安裝時程,硬生生提前了兩個月,還計畫在未來幾年引進超過 20 台新的 EUV 設備,直接把手上的機台數量翻倍 🚀
不過值得注意的是,雖然 SK 海力士在記憶體領域是自己包辦,但在未來更先進的 HBM4E 產品佈局中,這家韓國大廠預計會找上我們台灣的「護國神山」台積電來代工核心的邏輯晶片。
看來在這場 AI 晶片大戰裡,口袋裡沒有個幾千億,根本連坐上牌桌的資格都沒有。
別人買機器是一台一台算,這些巨頭買機器是直接拿公司總資產來拚,這就是神仙打架的真實世界啊。 #樂樂
(示意圖/AI生成,僅作為新聞說明輔助使用) #fblifestyle



-----

亞馬遜旗下的 AWS 雖然持續投入自研硬體,最終仍向英偉達(Nvidia)低頭,吞下高達一百萬顆繪圖處理器(GPU)的歷史級超級訂單。
這場預計從今年啟動並一路延續至 2027 年的交付計畫,徹底揭露了全球最大雲端巨頭在人工智慧基礎設施競賽中的深層焦慮。
這份由英偉達超大規模與高效能運算副總裁 Ian Buck 證實的協議,其核心邏輯遠跨越了單純的算力採購。AWS 將同步導入 Spectrum 網路晶片與 ConnectX 系統,藉此極限加速資料中心內部的數據傳輸效率。
英偉達的商業宰制力已進化至全面綁定基礎架構生態系。為了強化從訓練模型生成即時輸出的 AI 推論能力,AWS 必須部署英偉達多款新一代晶片,其中更直接包含了其近期推出的 Groq 產品組合。
這筆交易完美對齊了執行長黃仁勳的資本藍圖。伴隨次世代 Blackwell 與 Rubin 晶片平台的推進,英偉達正將高達一兆美元的潛在營收機會轉變為絕對的市場統治力。
這或許預示著,試圖透過客製化晶片來實現技術獨立的雲端供應商,將在極致的算力需求前撞上難以跨越的硬體生態高牆。
如果這個趨勢持續,底層硬體供應商與雲端服務商的權力平衡將被徹底顛覆,未來 AI 時代的基礎設施定價權,將無可避免地全面向晶片製造端收攏。 #樂樂
造價上億的 AI 機器人準備接管世界了?結果在輝達 GTC 大會上,它們連遞一包洋芋片都笨手笨腳!🤯 但你敢信嗎?黃仁勳根本不在乎機器人有多笨,因為在這個局裡,機器人越會出包,輝達賺得越誇張。
白話來說,今年 GTC 大會現場就像一場大型的「機器人現形記」。
那些在募資簡報和宣傳影片裡身手矯健、看起來隨時能取代你工作的雙足機器人,到了展場實測,動作卻像網路嚴重延遲一樣卡頓。
外媒記者實測請機器人遞一包零食,它猶豫、算半天、手還抓不太準,雖然最後沒弄掉,但整個過程超級尷尬。說句實在話,這任務隨便一個國中生閉著眼睛都能做得比它好。
看到這裡你可能會想:這些估值動輒幾百億的機器人新創,是不是都在畫大餅?輝達壓寶這個賽道是不是要翻車了?
恰恰相反,這正是老黃最聰明的地方。
輝達根本沒有要自己跳下去組裝機器人,他們做的是賣「大腦」跟「虛擬訓練場」。要把一個笨手笨腳的機器人,訓練到能在你家雜亂的廚房幫忙洗碗,需要經過幾百萬次的跌倒、打破盤子、撞到小孩。如果在現實中這樣練,廠商光賠醫藥費跟損壞算盤就直接破產了。
所以輝達賣給開發商一套虛擬模擬平台,讓機器人在虛擬世界裡盡情地摔。
最狠的商業邏輯就在這裡:機器人每一次抓錯東西、每一次腳步沒踩穩,都需要重新收集數據、丟回模型裡訓練。
這代表什麼?代表開發商需要買更龐大的算力、跑更長時間的模擬、插上更多的輝達晶片。
這就是教科書等級的「淘金熱賣鏟子」戰術⛏️
不管最後是哪家機器人公司稱霸天下,也不管讓機器人學會開門還要摸索幾年,只要這些機器人還不夠聰明,廠商們就得乖乖掏錢,繼續向輝達「繳學費」。現實世界的機器人越笨拙,輝達伺服器裡的晶片就賣得越好。
科技的進化往往就是這樣,從「笨拙好笑」到「接管日常」,中間的過渡期比我們想像得長,但也比我們預期的還要燒錢。
當哪天機器人幫你倒一杯咖啡,你覺得理所當然,甚至無聊到連新聞都懶得報的時候,才是這個產業真正成熟的時刻。至於現在,看懂這個「賣鏟子」邏輯的人,應該已經知道未來的資金會繼續往哪裡流了。

沒有留言:

網誌存檔