Claude in Chrome MCPとCowork、CLIからブラウザを操る2つの方法——実測で分かった使い分け A hands-on comparison of two ways to control a browser from Claude Code CLI—Cowork and the…
- Claude Code(CLI)からブラウザを操作する手段として、Coworkに加えてClaude in Chrome MCPが利用可能になった。
- 本記事では両者を実際に動かして比較し、それぞれの得意領域と使い分けの指針を整理している。
English summary
- A hands-on comparison of two ways to control a browser from Claude Code CLI—Cowork and the Claude in Chrome MCP—covering practical differences and guidance on when to use each.
Claude Code(CLI)からブラウザを直接操作できる環境が整いつつある。その選択肢として注目されるのが、Anthropicのデスクトップアプリを経由する「Cowork」と、Chrome拡張として動作する「Claude in Chrome MCP」の2つだ。
CoworkはClaude Desktop上のエージェント連携機能を利用し、デスクトップ環境全体を視野に入れたブラウザ操作が得意とされる。一方、Claude in Chrome MCPはChrome拡張として常駐し、MCPプロトコル経由でCLIから直接タブ操作・DOM取得・スクリプト実行などを行う仕組みだ。拡張機能として動くため、Chromeが起動していれば追加のデスクトップアプリを必要とせず、セットアップの手軽さという点でメリットがある。
実測した結果として記事が示すのは、単純なページ情報取得やフォーム操作のような軽量タスクではClaude in Chrome MCPのレスポンスが速く、スクリプト実行の自由度も高い点だ。対してCoworkはデスクトップ全体のコンテキストを扱えるため、スクリーンショットを交えた確認作業や複数アプリをまたぐ複合タスクで強みを発揮する可能性がある。
背景として押さえておきたいのは、MCP(Model Context Protocol)がAnthropicによって提唱されたオープンな標準規格であり、ツールやリソースをLLMエージェントに接続するための共通インターフェースを定義している点だ。2024年末の公開以来、ブラウザ・ファイルシステム・外部APIなど多様なMCPサーバーが登場しており、Claude in Chrome MCPもその流れの中に位置づけられる。PlaywrightやPuppeteerを使ったヘッドレスブラウザ操作とは異なり、実際のChromeセッションをそのまま使う点が特徴で、ログイン済みセッションや拡張機能の状態を維持したまま自動化できるという実用上の利点がある。
Claude Code(CLI)からブラウザを操作する手段として、Coworkに加えてClaude in Chrome MCPが利用可能になった。
類似のアプローチとしては、MicrosoftがEdgeとCopilotを統合するかたちでブラウザ操作エージェントの研究を進めており、オープンソース側ではbrowser-useやStagehandといったライブラリが注目を集めている。これらと比較すると、Claude in Chrome MCPはAnthropicのエコシステム内で完結しやすい反面、Chrome以外のブラウザへの対応は現時点では限定的と見られる。
用途に応じた使い分けの目安として、CLIから素早くChrome操作を自動化したい場合はClaude in Chrome MCP、デスクトップ全体を含む複雑なワークフローを組むならCowork、という整理が実測ベースで示されている。どちらもまだ発展途上のツールであり、今後のアップデートによって差異が縮まる可能性もある点は留意しておきたい。
The tooling for controlling a browser directly from Claude Code's CLI is maturing quickly, and developers now have two distinct options to choose from: Cowork, which routes through Anthropic's Claude Desktop application, and the Claude in Chrome MCP, a Chrome extension that exposes browser control via the Model Context Protocol.
Cowork leverages Claude Desktop's agent integration layer, giving it awareness of the broader desktop environment. This makes it well-suited for tasks that combine browser activity with other desktop context—think confirmation steps that involve screenshots, or workflows that jump between a web interface and a local file. The trade-off is that Claude Desktop must be running as a prerequisite, which adds some overhead to the setup.
Claude in Chrome MCP takes a lighter approach. Installed as a Chrome extension, it runs an MCP server locally and accepts tool calls from Claude Code over the protocol directly. This means tab management, DOM inspection, JavaScript execution, and form interaction are all available from the CLI without launching any additional desktop software beyond Chrome itself. In hands-on testing, this approach reportedly yields faster round-trip times for lightweight tasks and offers considerable flexibility for scripting.
Understanding where each tool shines requires a bit of context about MCP itself. The Model Context Protocol is an open standard introduced by Anthropic in late 2024 to give LLM agents a consistent interface for connecting to external tools, resources, and data sources. Since then, the ecosystem has grown rapidly, with MCP servers covering everything from file systems and databases to browser automation and third-party APIs. Claude in Chrome MCP sits squarely in this wave, but its defining characteristic is that it operates inside a real, live Chrome session—not a headless instance. That means the automation inherits whatever state the browser already holds: cookies, logged-in sessions, installed extensions, and so on.
This is a meaningful distinction from tools like Playwright or Puppeteer, which typically spin up isolated browser contexts. For tasks that require authentic user state—automating a SaaS dashboard you're already logged into, for instance—the live-session approach removes a whole class of authentication friction.
The broader competitive landscape is worth noting. Microsoft has been deepening the integration between Edge and Copilot for agentic browsing scenarios, while open-source projects like browser-use and Stagehand are gaining traction as framework-agnostic alternatives. Claude in Chrome MCP has the advantage of tight integration with Anthropic's toolchain, though its Chrome-only scope is a limitation compared to cross-browser solutions.
Based on the hands-on findings reported in the article, a reasonable heuristic emerges: reach for Claude in Chrome MCP when you want fast, scriptable browser automation from the CLI and your workflow lives inside Chrome; lean on Cowork when the task is more complex, involves desktop-wide context, or benefits from Claude Desktop's richer agent orchestration. Both tools are still evolving, and the gap between them could narrow—or widen—as Anthropic iterates on each. For now, knowing the strengths of each approach is the most practical edge a developer can have.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (qiita.com) をご確認ください。