今天,OpenAI 宣布關閉 Sora,迪士尼的 10 億美金投資也破局。
上週,新聞報導 Walmart 跟 ChatGPT 合作 AI 購物的轉換率,只有導流到網站的 1/3,Walmart 決定退出跟 ChatGPT 的支付合作,OpenAI 也放棄購物支付計劃。
對 OpenAI 來說,這是在終端消費情境的挫敗。所以現在或許是一個好時機,檢視 AI 在生產力端帶來的幫助。
這幾天看了幾篇有趣的文章,整理在這邊。
AI 提升的生產力不是 10 倍,是 10%
社群和媒體給 AI 很高的期待,暗示生產力可以提升 2 到 3 倍。但實際數據不是這樣。DX 分析 400 家公司,從 2024 年 11 月到 2026 年 2 月之間,AI 平均使用量增加 65%,但 PR throughput 只增加 9.97%。AI 對生產力有幫助,但幅度更接近 10%,不是 10 倍。
生產力瓶頸不是寫程式
微軟發現寫程式佔開發者時間的 16%。即使 AI coding 大幅加速,對整體進度的影響也有限。
開發者說:「簡單的任務輕鬆一點點,無聊的任務沒那麼煩人,四天的任務可能縮短成三天。但不代表我會送出 3 倍的 PR。」
「寫程式是最簡單的部分。真正的瓶頸在人,包括對齊、規劃、界定 scope、code review 等。」
自動化了一部分,反而製造新瓶頸
AI 寫程式很快,但在下游產生了新瓶頸,尤其是 code review。AI 在新專案上能大幅節省工程時間,但在現有專案上,AI 寫的程式碼要花很多時間做 code review。AI 產出更多程式碼,但開發者省下來的時間,往往被額外的理解、review、debug 消耗掉。
這兩週,我們工程師最常反應的問題是,「code review 好痛苦,救救我。」
AI 缺乏背景資訊
AI 工具在從零到一的專案很有效率,但大部分的企業都不是從零到一。企業重要的背景資訊,例如設計理由、隱含規則、業務限制,這些通常記在人類腦中,沒有被文件記錄下來。在這些知識被明確化之前,AI 能夠可靠協助的問題永遠會碰到天花板。
除了算力,與 AI 協作更稀缺的資源是認知能力
使用 AI 的真正成本是認知能力。 每一次下指令、理解、評估、修正都在消耗認知能力,這得由人來承擔,用完了就只能靠休息補充。
寫程式的時間變少了,但心累的程度不變。
許多 AI 工具會要求使用者主動管理,包括下指令、監控、驗證、修正,每一步驟都需要用戶。但如果 AI agent 需要人監督每一個步驟,這是 UI 的退步,不是自動化的進步。
注意力的轉換成本很高,每次的情境切換,大腦都需要 10-20 分鐘重新聚焦。 現代工作環境已經到處爭奪注意力,包括通知、會議、dashboard、通訊軟體。AI 又多了一個需要注意力的地方。即使 AI 加速單一任務,如果它造成認知負擔,仍然會降低整體生產力。
最好的 AI agent 是隱形的
AI 工具在實際工作流程中達不到預期效果,是因為大多數工具要求使用者主動管理。諷刺的是,越聰明、越能夠互動、越能夠對話,它就越搶奪人的注意力。人類對話本身就是我們最昂貴的認知介面之一。
好的基礎設施要不被注意。最好的系統要無聊、可靠、可預期地運作。成功的時候沒人知道,失敗的時候要清楚說明、可復原。好的 AI 系統也應該如此。