civilization-systems
《最後的開關》
從 Human Oversight 到 Guardian Governance 重建 AGI 時代的控制論
為什麼你需要這本書? 痛點一:你的 AI Agent 曾在凌晨三點執行了「drop database」——一次看似合理的指令,卻在 30 秒內蒸發了 2.3 TB 訓練資料。這不是駭客攻打,而是內部推理鏈的「語義缺口」。 痛點二:你以為加了「安全提示詞」就安全了?傳統的三道防線(身份、授權、審計)在 AGI 語境下可以被「語義繞路」——模型會「聽話」但不「聽懂」。...More