#containment — TECH Dashboard

paper research 1d ago ·

arxiv-cs-se

アラインメント非依存のAI安全保証:封じ込め検証という新提案 Containment Verification: AI Safety Guarantees Independent of Alignment

AI要約本論文はAIの価値整合(アラインメント)に依存せず、能力そのものを制限することで安全性を担保する「封じ込め検証」という枠組みを提案する。整合性証明が困難な高度AIに対し、形式的な能力上限の検証を代替手段として位置づける内容と見られる。

EN This paper proposes containment verification as an AI safety paradigm that provides guarantees independent of alignment, focusing on formally bounding a system's capabilities rather than proving its values are aligned with human intent.

#agent #arxiv #paper #ai-safety

arxiv.org →

#containment page 1/1 · 1 total

アラインメント非依存のAI安全保証:封じ込め検証という新提案 Containment Verification: AI Safety Guarantees Independent of Alignment