全PJのコードを横断ベクトル検索: SQLite-vec + bge-m3 で自前code-ragを作った(vault-rag兄弟版) 全PJのコードを横断ベクトル検索: SQLite-vec + bge-m3 で自前code-ragを作った(vault-rag兄弟版)
全PJのコードを横断ベクトル検索: SQLite-vec + bge-m3 で自前code-ragを作った(vault-rag兄弟版) Claude Code の使用ログを集計したら、Bash 82% / Read 18% という数字が出た
複数プロジェクトのコードベース全体を横断してセマンティック検索できる自前の rag">code-RAG システムを構築した実装記事。ベクトルストアには軽量組み込み型の SQLite-vec、埋め込みモデルには多言語対応の bge-m3 を採用している。以前公開した vault-rag(ノート横断検索)の兄弟版と位置づけられており、同じアーキテクチャをコード検索へ応用した構成となっている。
著者が Claude Code の使用ログを集計したところ、Bash ツール呼び出しが 82%・Read が 18% という内訳が判明している。こうした利用実態を背景に、MCP サーバー経由で Claude Code がプロジェクトをまたいだコード検索を行えるよう整備したと推察される。詳細な実装手順・インデックス設計・性能評価については元記事を直接参照されたい。
This article details building a personal rag">code-RAG system capable of cross-project semantic search across multiple local codebases. The author selected SQLite-vec as a lightweight, embeddable vector store and bge-m3 as a multilingual embedding model, combining the two to index and query source code at scale. The project is positioned as a sibling to a previously published vault-rag setup, applying the same vector-search pipeline to code rather than personal notes.
A concrete data point surfaced in the context is that the author's Claude Code usage logs broke down as Bash 82% and Read 18%, indicating that tool-call activity skews heavily toward execution over file reading. The rag">code-RAG is likely surfaced via an MCP server so Claude Code can perform cross-project lookups during active development sessions. Specific implementation steps, indexing strategies, and performance figures should be confirmed at the original Zenn article.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (zenn.dev) をご確認ください。