LCO: 実世界タスクにおけるエージェント型LLMの安全性向上のためのLLMベース制約最適化 LCO: LLM-based Constraint Optimization for Safer Agentic LLMs in Real-world Tasks
自律エージェントとして動作するLLMの安全性を高めるため、LLMベースの制約最適化フレームワーク「LCO」を提案した研究論文。
English summary
- arXiv:2605.27375v1 Announce Type: new Abstract: Large Language Models (LLMs) are increasingly acting as autonomous agents, but their continuous interaction with the environment can lead to in-context
大規模言語モデル(LLM)は自律エージェントとして環境と継続的にやり取りするケースが増えているが、その過程でコンテキスト内の情報蓄積や予期しない行動が安全上のリスクをもたらす可能性がある。本論文はこの課題に対し、制約最適化の枠組みをLLM自体に適用する「LCO」アプローチを提案している。
LCOは実世界タスクにおけるエージェントの行動を安全制約の観点から最適化することを目的としており、エージェントの自律性を損なわずに安全性を高める手法として位置づけられる。詳細な実験設定や評価結果については原文(arXiv:2605.27375)を参照されたい。
As LLMs increasingly serve as autonomous agents, their continuous interaction with external environments introduces risks such as in-context information accumulation and unintended actions. Addressing these safety concerns is a growing priority in agentic AI research.
The LCO framework applies LLM-based constraint optimization to guide agent behavior within safe boundaries during real-world task execution. The approach aims to balance autonomy with safety without severely restricting the agent's capabilities.
This paper was published on arXiv (2605.27375) and represents applied safety research for agentic systems. Specific experimental results, benchmarks, and the precise mechanism of constraint optimization should be verified at the source, as only the abstract-level description is available here.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (arxiv.org) をご確認ください。