《財星》雜誌
22小時
·
🔗: https://bit.ly/3N2pBKt
丹妮拉·阿莫迪(Daniela Amodei)與她的哥哥達裡奧(Dario)共同創立了Anthropic公司。她表示,在人工智慧時代,人類獨有的特質實際上會變得更加重要,而不是不那麼重要。
Daniela Amodei, who cofounded Anthropic with her brother Dario, said uniquely human qualities will actually be more critical in the age of AI, not less.
Gemini 3.5曝光 Google全時AI Agent「Spark」引爆市場關注
Google (GOOGL-US) 新一代 AI 模型 Gemini 3.5 尚未正式發布,卻已提前在網路上大規模曝光。根據多名爆料者與開發者流出的資訊,代號「Cappuccino」的 Gemini 3.5 Pro 檢查點已開始產出內容,原先外界預期的「Gemini 3.2」也被直接跳級取代,顯示 Google 正試圖加速 AI 產品節奏,以迎戰 OpenAI 與 Anthropic 日益激烈的競爭。
科技媒體與社群近期流出的截圖顯示,Gemini 3.5 在多模態生成與互動式應用能力上出現明顯提升。知名爆料者 can 率先公開兩項測試成果,包括 DualShock 4 手把互動式藍圖拆解,以及一個可即時調整光線、配件、速度與車架顏色的「鵜鶘騎自行車」向量插畫。
外界認為,這已不再只是單純 SVG 圖片生成,而是可透過 prompt 直接產生完整互動式 Web 應用程式,代表 Google 正在將大型語言模型與前端互動生成進一步整合。
隨後,Abacus.AI 執行長 Bindu Reddy 公布更多測試數據,指出 Gemini 3.2 Flash 在編碼與推理能力上,已達 OpenAI GPT-5.5 約 92% 的水準,但運行成本卻低 15 至 20 倍。LM Arena 匿名跑分結果也顯示,Gemini Flash 在 SVG 生成、互動式 3D 編碼與動畫處理等領域,已超越 Gemini 3.1 Pro。
市場分析認為,這代表 Google 正在透過蒸餾與稀疏化技術,將大型前沿模型壓縮成更低成本版本,同時維持高品質輸出,以提升模型商業化競爭力。
除了模型本身外,另一項受到高度關注的產品則是全新 AI 代理系統「Gemini Spark」。根據曝光資料,Spark 被定位為「全天候待命的個人 AI 智能體」,能 24 小時協助管理電子郵件、執行線上任務、安排多步驟流程,甚至具備自主執行能力。
不過,Spark 引發外界熱議的原因,還包括其高度權限設計。根據流出的服務描述,Spark 可存取 Google 應用程式、聊天記錄、定時任務、登入網站、位置資訊以及個人偏好資料,並可能將姓名、聯絡資訊與文件分享給第三方服務,以完成指定任務。
更受爭議的是,系統說明中提到,Spark 雖然原則上會在敏感操作前徵求使用者同意,但「可能在未經詢問的情況下分享資訊或完成購買」。也就是說,AI 代理未來可能具備自主下單與自主資料分享能力。
市場認為,Spark 實際上是 Google 內部 Agent 計畫「Remy」的升級版,過去僅限 AI Ultra 訂閱用戶使用,如今則準備全面推向更大規模市場。外界也認為,Spark 的定位,正面對標 Anthropic 推出中的 Conway 代理系統,以及 OpenAI 已部署的 24 小時 Agent 平台。
不過,儘管 Gemini 3.5 聲量持續升高,部分業界人士對其實際競爭力仍保持保留態度。科技記者 Alex Heath 引述多位消息人士指出,即將發布的新 Gemini 模型,大致僅能達到 GPT-5.5 等級,與 Anthropic 最新 Mythos 模型仍有明顯差距。
事實上,Gemini 3 曾憑藉 LM Arena 1501 Elo 成績登頂多項排行榜,但隨著 OpenAI GPT-5.5、Anthropic Opus 4.7 與 Mythos 陸續推出,AI 競爭格局已快速改變。
英國 AI 安全研究所 (AISI) 近期測試指出,Mythos 是首個同時通過兩項高強度網路安全測試的 AI 模型,而 GPT-5.5 僅通過其中一項。AISI 甚至坦言,目前評測框架已逐漸跟不上最新模型能力演進速度。
另一方面,開發者也在最新 Gemini 介面中發現新功能跡象。根據爆料者 Fandu 曝光的模型選擇器畫面,新 Gemini 可能原生支援 MCP 第三方工具接入,並重新設計 Thinking 模式,從原本獨立模式改為全域開關,區分為 Standard 與 Extended 兩種推理模式。
其中,Extended 模式被認為將專門用於複雜問題求解,而新增的「MCP Tool Testing」分類,也意味 Google 可能正在加強外部工具與 Agent 協作能力。
程式設計能力則被視為目前 Google 壓力最大的領域。Alex Heath 指出,Google DeepMind 內部對 AI 編碼競爭感到高度焦慮,尤其是 Anthropic 旗下 Claude 系列,過去一年已逐漸成為開發者社群的主流選擇。
Google 內部使用頻繁的 AI 編程平台 Antigravity,雖然推出 4 個月便取得約 6% 的開發者採用率,但與 Anthropic 的 Claude Code 及 OpenAI 的 Codex 相比,市場影響力仍存在差距。
科技媒體 XDA 實測也指出,在相同任務下,Claude Code 能準確理解複雜創意需求,但 Antigravity 生成結果則明顯較粗糙。此外,Google 多次修改收費模式,也引發開發者對額度與信用制度的不滿。
市場觀察人士認為,AI 編程如今已從工程師工具,進一步擴大至產品經理、設計師等非技術族群。例如 OpenAI Codex 與 Claude Code 已能讓使用者透過自然語言生成原型程式,甚至直接將 Figma 設計稿轉換成前端程式碼。
相較之下,Google 目前尚未推出足以主導此市場的產品。
不過,也有觀點認為 Google 的策略並非單純追趕 AI 編碼工具,而是押注更大規模的多模態 AI 生態。科技評論人士 Haider 指出,Google 真正優勢在於其擁有 Android、Gmail、搜尋與 Chrome 等 10 億級分發入口,一旦 Spark 全面部署,用戶郵件、行程、購物與瀏覽資料,都將成為 Gemini 未來訓練的重要數據來源。
這種結合分發平台與 AI Agent 的模式,被認為是 OpenAI 與 Anthropic 短期內難以複製的競爭優勢。
目前 AI 三強競爭也同步升溫。OpenAI 近期替 Codex 加入 ultrafast 模式,速度提升 2 至 3 倍,並推出企業轉移補貼方案;Anthropic 則同步發布 Opus 4.7 Fast 模式,並將 Claude Code 額度提高 50%。
市場認為,這場競爭表面上是爭奪開發者,但核心其實是搶奪 AI 自我迭代的資料循環。由於 AI 生成的程式碼可再反向成為訓練資料,誰掌握更多開發工具使用者,誰就能更快推動下一代模型進化。
目前 OpenAI 主打高速產品迭代、Anthropic 聚焦模型品質,而 Google 則試圖透過 Agent 與龐大平台生態包圍市場。隨著三大陣營全面加速,市場普遍認為,AI 產業的軍備競賽已正式進入新階段。
沒有留言:
張貼留言