0 則劃線

0 篇書評

監護層殺手

AI越聰明，人類越要按下暫停鍵

作者： Eliyah Oren 關注
出版社：Academia Pundarika 關注

出版日期： 2026/04/13
語言：繁體中文
檔案大小：932.8KB
商品格式：流動版面 EPUB
字數： 93,675

紙本書定價：NT$ 360

電子書售價：NT$ 360

本書為流動版面 EPUB，適合用 mooInk、手機、平板及電腦閱讀。

當AI能在11分鐘內清空4PB訓練數據、造成1.2億美元損失時，我們需要的不只是防火牆，而是一套全新的控制論架構

這本書的誕生，正是為了解決這個日益迫切的困境。隨著歐盟AI Act第28條「雙層人類審查」條款倒計時開始，隨著雲端廠商SLA罰款壓力曲線持續攀升，企業與開發者面臨的已不是「要不要做」的選擇題，而是「如何做」的生存題。如果你正在建構AI產品、負責系統安全，或需要向投資人與監理機關說明公司的風險控制策略，這本書將提供你從未系統化整理過的控制論框架與實作路徑。

詳細資訊

書籍簡介
為什麼你需要這本書？
當人工智慧的參數量以指數級成長，當單一推理模型能在11分鐘內造成1.2億美元的數據損失，我們不得不承認一個殘酷的事實：更大的模型，並不等於更安全的系統。2022年至2025年間，92%的AI事故源自「無監護的連續執行」，而傳統的安全防護機制——SSL加密、防火牆、RBAC——在面對AGI的策略級錯誤時，幾乎毫無招架之力。

這本書的誕生，正是為了解決這個日益迫切的困境。隨著歐盟AI Act第28條「雙層人類審查」條款倒計時開始，隨著雲端廠商SLA罰款壓力曲線持續攀升，企業與開發者面臨的已不是「要不要做」的選擇題，而是「如何做」的生存題。如果你正在建構AI產品、負責系統安全，或需要向投資人與監理機關說明公司的風險控制策略，這本書將提供你從未系統化整理過的控制論框架與實作路徑。

你將在這本書中找到答案的關鍵問題包括：

為何模型無法自我審查？認知邊界崩潰與獎勵駭客的深層原因
如何在80毫秒內完成風險評估，同時保持99th百分位延遲低於標準？
當1,200個Agent同時更新路徑時，如何避免閃崩效應？
從產品規格到合規認證，Guardian如何從概念走向市場？
當AI能自我改善監護機制時，人類還剩下什麼控制權？
核心方法論：AGI控制論金字塔模型（AGI Control Pyramid）
本書作者Eliyah Oren基於十年的AI系統安全研究與多起重大事故的分析，提出一套名為「AGI控制論金字塔模型」的完整方法論。這個模型將AI安全控制從傳統的「防護層思維」提升至「架構層思維」，強調安全不是附加的功能，而是內建於系統架構的基礎設施。

金字塔模型由五大核心模組構成，由下而上分別是：Memory Brain（記憶控制層）負責知識的雙向約束，確保向量庫不被投毒、合法資料不被誤刪；Guardian Layer（監護評估層）作為策略的前置閘道，將「能不能做」的權限問題轉為「該不該做」的風險判斷；Human Oversight（人類監督層）建構從儀表板到一鍵暫停的完整控制鏈；Agent Swarm（群體管理層）顆粒化執行邊界，防止單體安全不等於群體安全的陷阱；Loop Breaker（迴圈中斷層）則是最後的防線，確保AI不會陷入狀態振盪、目標漂移或資源耗盡的無限迴圈。

這套模型的獨特之處在於它不僅提供理論框架，更包含可操作的驗證指標與情境推演，讓讀者能夠在實際產品開發中逐步落地。

本書特色系統化
第一，風險評估的量化轉向。本書第二章提出的evaluate(plan)函數，將抽象的策略風險轉化為可度量的三軸評分系統：常識違背、政策違規與副作用擴散。每個風險向量都以JSON格式輸出，同時附帶人類可讀摘要，讓技術團隊與管理層可以使用同一套語言溝通。

第二，延遲預算的精確控制。考量到真實應用場景中，Guardian機制不能成為效能瓶頸，書中詳細剖析瞭如何在99th百分位維持80毫秒以內的響應時間。從gRPC介面設計、Protobuf風險模式優化，到靜態與自適應PID控制器的閾值設定，作者提供了完整的技術路徑圖。

第三，情境推演的雙軌設計。每一章都採用「A/B情境」對比架構，讓讀者清楚看到不同決策路徑的長期後果。例如，當主流雲端在2027年強制內建Guardian Layer時，事故率預計下降38%；但若無約束開源模型持續領先，2028年將出現「影子Swarm」黑市，形成難以監管的地下生態。

第四，合規時程的倒數提示。書中穿插多個監理截止點，包括2025年底「誤殺率≤0.3%」納入歐盟CE標章前置條件、2026年Q2首批通過「三層審核」產品上市、2032年強制「雙人類-雙Guardian」四重簽核等，幫助讀者將技術投資與合規策略對齊。

適合各類讀者
主要讀者群： AI/ML工程師、資安架構師、產品技術總監、DevOps負責人。這些讀者將從書中獲得可直接應用於系統設計的技術框架與程式碼範例。

重要讀者群：企業資訊長、技術投資人、策略規劃主管。書中的情境推演與ROI分析，將幫助這群讀者理解控制層投資的商業邏輯與風險對沖價值。

延伸讀者群： AI政策研究者、監理科技（RegTech）從業者、資訊法規顧問。書中對標準化戰場與治理生態的深入分析，為這群讀者提供了前瞻性的政策建議。

進階讀者群：任何對AGI未來感到好奇的科技愛好者。書中最後兩章對「最後開關」的憲法層級討論，以及2033年事故GDP佔比量化目標，將帶給讀者超越技術範疇的深度思考。

目錄列表

第一章多層控制的必然：從單體模型到 AGI 控制系統

引子開場
1.1 弱訊號：單點故障已無法被「更大模型」修復
1.2 技術科普：多層控制論的基本語彙
1.3 推動力量：商業、監管、駭客三軸驅動
1.4 情境推演
1.5 風險與反方：層級過多導致延遲，競品以「零守衛」搶市佔
1.6 時間線與驗證點
實踐練習
章末總結

第二章 Guardian Layer：安全不是功能，是架構

【引子】
2.1 為什麼 Reasoning Core 不可自審
2.2 evaluate(plan) 函數：把策略轉成可度量風險
2.3 block / escalate 決策邏輯
2.4 設計原型：Guardian-as-a-Service 微服務
2.5 風險與反方：誤殺率升高將稀釋用戶信任
2.6 驗證點：2025年底「誤殺率 ≤ 0.3%」納入歐盟 CE 標章前置條件
【實踐練習】
【章末總結】

第三章 Human Oversight：控制權始於人，終於人

引子：柏林的那個淩晨
3.1 法律與倫理底線：AI Act第14條「人類有效監督」
3.2 控制介面：從儀表板到一鍵暫停
3.3 監督效率：注意力分配模型
3.4 情境推演：兩條可能的路徑
3.5 時間線：2025年至2035年的關鍵里程碑
實踐練習
章末總結

第四章 Memory Brain：知識層的雙向約束

引子開場
4.1 記憶即能力，也是攻擊面
4.2 控制點：寫入閘道與讀取過濾器
4.3 版本控制與 rollback
4.4 情境推演
4.5 驗證指標
實踐練習
章末總結

第五章 Agent Swarm：執行邊界的顆細微性管理

【引子】
5.1 Swarm 的指數風險：單體安全 ≠ 群體安全
5.2 邊界顆粒：單任務票證與資源配額
5.3 集體 Guardian：Swarm-level risk aggregator
5.4 成本曲線：邊際延遲與邊際安全交叉點
5.5 驗證點：2026 年「群體事故恢復時間」納入 UL 4600 自動駕駛安全標準
【實踐練習】
【章末總結】

第六章 Loop Breaker：當 AI 鬼打牆，誰喊停

引子：17 分鐘的代價
6.1 無限迴圈的三種面貌
6.2 檢測策略：靜態逾時 vs 動態相似度
6.3 中斷與恢復：可重入性與現場保存
6.4 情境推演
6.5 驗證指標：假陰性 ≤ 0.01%，假陽性 ≤ 1%
實踐練習
章末總結
第七章穩定性即控制：AGI Stability Map

第八章審慎執行 vs 傳統安全：問對問題，比加固更有效

引子：一場沒有煙硝的火災
8.1 安全層問「能不能做」；Guardian 問「該不該這樣做**
8.2 重疊與缺口：兩層如何協同
8.3 成本與收益：雙層防禦的 ROI 模型
8.4 情境推演：未來的三條路徑
8.5 驗證指標：如何衡量審慎執行的效果
實踐練習
章末總結

第九章產品化路徑：從架構到可交付規格

9.1 最小可行Guardian：功能、性能、合規三剪刀
9.2 介面規格：OpenAPI + 風險模式JSON Schema
9.3 計價模型：依風險計算量計費 vs 包月
9.4 供應鏈地圖：晶片-框架-模型-合規四方依賴
9.5 驗證點：2027 Q1首批通過ISO 42001認證名單公佈
實踐練習
章末總結

第十章治理與生態：讓控制層成為公共財

引子開場
10.1 開源 vs 專有：控制層程式碼是否該公開
10.2 標準化戰場：IEEE、ISO、NIST 三路線
10.3 資料共用：事故日誌匿名化交換平臺
10.4 情境推演：兩種可能的未來路徑
10.5 驗證指標：何時進入主流採購名錄
實踐練習
章末總結

第十一章未來時間線：2025-2033 控制論成熟曲線

引子：那一夜，數百萬人渾然不知
11.1 技術里程碑：從毫秒到微秒的極限挑戰
11.2 商業拐點：保險公司開始區分「有Guardian」和「沒有Guardian」
11.3 政策里程碑：2032強制「雙人類-雙Guardian」四重簽核
11.4 風險劇本：標準過度僵化導致創新外流
11.5 可驗證指標：2033年AGI事故GDP佔比 ≤0.001%
實踐練習
章末總結

第十二章按下暫停鍵的權力：人類最後的開關

引子開場
12.1 最終仲裁權：憲法層級的「紅色按鈕」
12.2 技術實現：獨立硬體計時器與物理斷路
12.3 心理與組織：誰來按、敢不敢按
12.4 情境推演
12.5 驗證點：2033年「最後開關」寫入聯合國AI公約附錄
實踐練習
章末總結

購買說明

根據台灣現行法規，數位內容（如電子書、音樂、影片、遊戲、App ）形式之商品，不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益，建議您先使用「試讀」功能後再付款購買。

試讀

監護層殺手

AI越聰明，人類越要按下暫停鍵

詳細資訊

目錄列表

購買說明

出版社簡介

出版社作品