Cursor、Computer Use対応のCloud Agentsを発表 Cloud Agents with Computer Use
- CursorがCloud Agentsにコンピュータ操作機能を追加した。
- エージェントがブラウザやGUIアプリを直接操作できるようになり、コーディング以外のタスクも自動化可能となる。
- リモート環境で動作するため、ローカル環境を占有しない。
English summary
- Cloud agents can now use the software they create to test changes and demo their work.
Cursorは、クラウド上で動作するエージェント機能「Cloud Agents」にコンピュータ操作(Computer Use)能力を追加したことを発表した。これにより、エージェントは単にコードを書くだけでなく、ブラウザやGUIアプリケーションを直接操作してタスクを完遂できるようになる。
Cloud Agentsはリモート環境で実行されるため、ユーザーのローカルマシンのリソースを占有せず、複数のタスクを並列に走らせられる点が特徴とされる。Computer Use機能の追加によって、Webサイトでの情報収集、ダッシュボードの操作、UIのテストといった、純粋なコード編集の枠を越えた作業もエージェントに委任できる可能性が広がる。これは、開発作業に付随する周辺タスク(外部サービスの設定、認証フロー、視覚的な検証など)を自動化する上で意義が大きいと見られる。
背景として、Computer Useは2024年にAnthropicがClaudeで先行して公開したパラダイムで、LLMがスクリーンショットを解釈しマウスやキーボードを操作するアプローチが業界で広がっている。OpenAIのOperatorやGoogleのProject Marinerなど、各社がエージェントによるブラウザ操作の実用化を競っている状況だ。Cursorはこの流れをIDEに統合し、開発ワークフロー内で自然に呼び出せる形で提供する点に独自性があると考えられる。
エージェントがブラウザやGUIアプリを直接操作できるようになり、コーディング以外のタスクも自動化可能となる。
一方で、Computer Useには実行速度、操作の正確性、認証情報の取り扱いなど課題も残されており、実運用での信頼性は今後の改善に依存するだろう。Cursorがクラウド側のサンドボックスでこれらをどこまで安全に処理できるかが、採用の鍵となりそうだ。
Cursor has announced that its Cloud Agents now support computer use, allowing agents running in remote environments to interact directly with browsers and GUI applications rather than being limited to pure code editing.
Cloud Agents are Cursor's offering for offloading work to remote sandboxes, freeing the developer's local machine and enabling tasks to run in parallel. By layering computer use on top, the agents can now handle workflows that previously required a human at the keyboard: navigating web dashboards, filling out forms, exercising a UI to verify behavior, or pulling information from sites without proper APIs. In effect, the boundary of what an IDE-bound agent can accomplish expands well beyond the source tree.
The approach builds on a paradigm popularized by Anthropic's computer use feature for Claude, released in late 2024, in which a model interprets screenshots and emits mouse and keyboard actions. Since then, OpenAI's Operator and Google's Project Mariner have pushed similar agentic-browser concepts into the mainstream. Cursor's contribution is to embed this capability in the developer's daily tool, so that a coding agent can seamlessly cross over into operational tasks like configuring third-party services, handling auth flows, or running visual checks against a deployed app.
Running in the cloud also has practical advantages. A remote VM with a virtual display can host the browser session without disturbing the developer's own machine, and multiple agents can be dispatched concurrently. This is particularly relevant for long-running tasks where computer use tends to be slow due to the screenshot-and-act loop.
That said, computer use as a technique still has known limitations. Latency, brittle visual grounding, and the careful handling of credentials in shared environments remain open challenges across the industry. How robustly Cursor's sandboxed environments isolate sessions, manage secrets, and recover from failed UI interactions will likely determine how willing teams are to trust these agents with production-adjacent work. For now, the feature appears positioned as an incremental but meaningful expansion of what cloud-based coding agents can do, and it fits a broader trend of IDE vendors converging on full-stack agent platforms rather than pure code completion.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (cursor.com) をご確認ください。