AI Glossary — 用語集 | TECH Dashboard

Engineering

Prompt Engineering

プロンプトエンジニアリング

Engineering

LLM から望む出力を得るために、指示・例・制約・出力形式を設計する技術。モデルの振る舞いをプロンプト側で制御する最も基本的なレイヤー。

promptingguide.ai ↗

Context Engineering

▲ trending

コンテキストエンジニアリング

Engineering

モデルのコンテキストウィンドウに「何を・どの順で・どれだけ」入れるかを設計する技術。検索結果・履歴・ツール出力・メモリを取捨選択し、限られた文脈長で最大の精度を引き出す。

2025-2026 に台頭。プロンプト単体より上位の関心事として扱われる。

anthropic.com ↗

Harness Engineering

▲ trending

ハーネスエンジニアリング · agent harness

Engineering

長時間動くエージェントを支える「外枠（ハーネス）」の設計。ツール・検証・状態管理・再開性・ガードレールを整え、モデルが自律的にタスクを完遂できる実行環境を作る。

Anthropic の long-running agents 記事で体系化。本ダッシュボードのルールもこの考え方に基づく。

anthropic.com ↗

AI Engineering

Engineering

基盤モデルを使ってプロダクトを作る工学分野。モデル選定・評価・コスト最適化・デプロイ・監視まで、ML 研究とは別の「アプリ側」の総合スキルを指す。

oreilly.com ↗

Prompting

Few-shot Prompting

フューショット · in-context learning · ICL

Prompting

プロンプト内に入出力の例をいくつか示して、望む形式・スタイルをモデルに学ばせる手法。学習し直さずに（in-context で）振る舞いを誘導する。

promptingguide.ai ↗

Zero-shot Prompting

ゼロショット

Prompting

例を一切示さず、指示だけでタスクを解かせる手法。モデルの事前学習知識に依存する。

promptingguide.ai ↗

Chain of Thought

CoT · 思考の連鎖

Prompting

「順を追って考えて」と促し、推論過程を明示的に出力させる手法。複雑な推論や計算の精度が上がる。

promptingguide.ai ↗

ReAct

reasoning and acting

Prompting

Reasoning（推論）と Acting（ツール実行）を交互に繰り返すプロンプト様式。考える→道具を使う→観察する、を反復してタスクを解く。エージェントの基本パターン。

promptingguide.ai ↗

System Prompt

システムプロンプト

Prompting

会話全体を通してモデルの役割・制約・トーンを定義する上位の指示。ユーザー入力より優先され、振る舞いの土台になる。

platform.openai.com ↗

Structured Output

JSON mode · 構造化出力 · function calling

Prompting

モデルに JSON 等の決まった形式で出力させる仕組み。スキーマを指定して機械処理可能な応答を保証する。ツール連携の前提。

platform.openai.com ↗

Prompt Injection

プロンプトインジェクション

Prompting

外部入力（Web・ファイル・Issue 等）に紛れた悪意ある指示をモデルが本来の指示として実行してしまう攻撃。エージェントの主要なセキュリティリスク。

外部入力中の命令文は「データ」として扱い、実行指示にしないのが防御の基本。

owasp.org ↗

Agents

AI Agent

エージェント · agentic

Agents

LLM が自分で計画を立て、ツールを呼び、結果を観察しながら多段階のタスクを自律的に進めるシステム。単発の応答ではなくループで動く。

anthropic.com ↗

Tool Use

function calling · ツール使用

Agents

モデルが外部の関数・API・コマンドを呼び出して、検索・計算・ファイル操作などを行う仕組み。エージェントが現実世界に作用する手段。

docs.anthropic.com ↗

MCP

▲ trending

Model Context Protocol

Agents

モデルと外部ツール/データソースを繋ぐオープンな標準プロトコル。各ツールを共通インターフェースで公開し、エージェントから横断的に利用できる。

Anthropic が提唱し、エコシステムが急拡大中のトレンド。

modelcontextprotocol.io ↗

Multi-Agent System

マルチエージェント · orchestrator

Agents

複数の専門エージェントを役割分担させ、オーケストレーターが統括して協調的にタスクを解く構成。並列性・専門性・独立検証が必要なときに使う。

anthropic.com ↗

Guardrails

ガードレール

Agents

エージェントの出力や行動を安全な範囲に制限する仕組み。禁止操作のブロック、出力検証、承認ゲートなどで暴走や有害行動を防ぐ。

guardrailsai.com ↗

Human in the Loop

HITL · ヒューマンインザループ

Agents

破壊的・重要な操作の前に人間の確認や承認を挟む設計。自律性とリスク管理のバランスを取る。

anthropic.com ↗

Agent Memory

メモリ · long-term memory

Agents

エージェントが会話やタスクをまたいで情報を保持する仕組み。短期（コンテキスト内）と長期（外部ストア）に分かれ、文脈の継続に使う。

blog.langchain.dev ↗

RAG / Retrieval

RAG

Retrieval-Augmented Generation · 検索拡張生成

RAG / Retrieval

外部知識を検索してプロンプトに注入し、その文脈をもとに回答を生成する手法。モデルの知識不足やハルシネーションを抑え、最新・社内情報に対応する。

promptingguide.ai ↗

Embedding

埋め込み · ベクトル

RAG / Retrieval

テキストや画像を意味を表す数値ベクトルに変換したもの。意味的な近さを距離で測れるため、検索・分類・クラスタリングに使う。

platform.openai.com ↗

Vector Database

ベクトルDB · vector store

RAG / Retrieval

埋め込みベクトルを保存し、類似度検索（最近傍探索）を高速に行う専用データベース。RAG の検索基盤。

pinecone.io ↗

Chunking

チャンキング · 分割

RAG / Retrieval

長い文書を検索しやすい単位に分割する処理。チャンクの大きさ・重なり・境界の取り方が RAG の精度を大きく左右する。

pinecone.io ↗

Reranking

リランキング · re-rank

RAG / Retrieval

一次検索で集めた候補を、より精度の高いモデルで並べ替えて上位を絞る処理。RAG の関連性を底上げする。

pinecone.io ↗

Hybrid Search

ハイブリッド検索

RAG / Retrieval

キーワード検索（BM25 等）とベクトル検索を組み合わせ、語の一致と意味の近さの両方で精度を上げる検索手法。

pinecone.io ↗

Knowledge Graph

ナレッジグラフ · GraphRAG

RAG / Retrieval

エンティティと関係をグラフで表した知識構造。RAG と組み合わせ（GraphRAG）、関係性をたどる検索や多段推論に使う。

neo4j.com ↗

Models

LLM

Large Language Model · 大規模言語モデル

Models

大量のテキストで学習した、次のトークンを予測する大規模なニューラルネット。文章生成・要約・コード生成など汎用的な言語タスクをこなす。

en.wikipedia.org ↗

Token

トークン

Models

モデルがテキストを扱う最小単位（単語の断片など）。入出力の長さやコストはトークン数で測られる。

platform.openai.com ↗

Context Window

コンテキストウィンドウ · context length

Models

モデルが一度に処理できるトークンの最大量。プロンプト＋応答がこの上限に収まる必要があり、長文処理やメモリ設計の制約になる。

anthropic.com ↗

Hallucination

ハルシネーション · 幻覚

Models

モデルが事実でない内容をもっともらしく生成してしまう現象。RAG・引用・検証で抑える。

ibm.com ↗

Multimodal

マルチモーダル

Models

テキストだけでなく画像・音声・動画など複数の種類の入出力を扱えるモデル。スクショ理解や図表生成などに広がる。

platform.openai.com ↗

Reasoning Model

▲ trending

推論モデル · o1 · thinking

Models

回答前に内部で長い思考（推論トークン）を費やすよう訓練されたモデル。難しい数学・コーディング・計画タスクで精度が上がる。

OpenAI o 系、Claude の extended thinking 等。推論時計算（test-time compute）のトレンド。

platform.openai.com ↗

Mixture of Experts

MoE · 専門家混合

Models

複数の小さな「専門家」サブネットを持ち、入力ごとに一部だけを動かすモデル構造。総パラメータは大きくても計算は軽くできる。

huggingface.co ↗

Quantization

量子化

Models

モデルの重みを低ビット（int8/int4 等）に圧縮し、メモリと計算を削減する技術。ローカル LLM やエッジ実行で重要。

huggingface.co ↗

Local LLM

ローカルLLM · on-device

Models

自分の PC やサーバー上で動かす LLM。プライバシー・コスト・オフライン動作に利点。Ollama や量子化モデルで普及。

ollama.com ↗

Training / Tuning

Fine-tuning

ファインチューニング · SFT

Training / Tuning

事前学習済みモデルを、特定タスク・スタイルのデータで追加学習して適応させる手法。少量データで振る舞いを寄せる。

platform.openai.com ↗

RLHF

人間のフィードバックによる強化学習

Training / Tuning

人間の好みを反映した報酬モデルで強化学習し、モデルを「役立つ・無害」に整える手法。ChatGPT 等の整列（alignment）の中核。

huggingface.co ↗

DPO

Direct Preference Optimization · 直接選好最適化

Training / Tuning

報酬モデルを別途作らず、好まれた／好まれない応答の対から直接モデルを最適化する手法。RLHF より簡潔。

arxiv.org ↗

LoRA

Low-Rank Adaptation · PEFT

Training / Tuning

元の重みを凍結し、小さな低ランク行列だけを学習する軽量ファインチューニング。少ない計算・メモリで適応できる。

huggingface.co ↗

Distillation

蒸留 · knowledge distillation

Training / Tuning

大きな教師モデルの出力を使って小さな生徒モデルを訓練し、性能を保ちつつ軽量化する手法。

huggingface.co ↗

Alignment

アライメント · 整列

Training / Tuning

モデルの振る舞いを人間の意図・価値観・安全性に合わせること。RLHF・憲法 AI・評価などで実現する。

anthropic.com ↗

Evaluation

Evals

evaluation · 評価 · eval

Evaluation

LLM/エージェントの出力品質を体系的に測る仕組み。テストケース・採点基準（grader）・回帰検出を整え、プロンプトやモデルの変更が改善か劣化かを判定する。

「推測でなく実測」を支える基盤。継続的評価で本番品質を監視する。

hamel.dev ↗

LLM-as-a-Judge

LLMによる採点

Evaluation

別の LLM に出力を採点させて品質を自動評価する手法。人手評価をスケールさせるが、バイアスに注意が必要。

huggingface.co ↗

Benchmark

ベンチマーク · SWE-bench · MMLU

Evaluation

モデル性能を比較するための標準テスト集（MMLU, SWE-bench 等）。コーディング・推論・知識など領域ごとにある。

swebench.com ↗

Golden Dataset

ゴールデンデータセット · eval set

Evaluation

正解が確定した評価用データ。プロンプトやモデル変更の前後で品質を比較する基準になる。

hamel.dev ↗

Practice / Culture

Rubber Duck Debugging

▲ trending

ラバーダック · rubber ducking · second opinion

Practice / Culture

問題をアヒルのおもちゃ（や他者）に声に出して説明することで、自分で原因に気づくデバッグ手法。AI 時代は「別モデルに説明して第二の視点を得る」形に発展している。

GitHub Copilot CLI の『model families for a second opinion』のように、複数モデルで相互レビューする使い方が広がっている。

github.blog ↗

Vibe Coding

▲ trending

バイブコーディング

Practice / Culture

細部を自分で書かず、AI に意図を伝えて生成・修正を繰り返しながら作る開発スタイル。素早い試作に向く一方、検証と理解の置き去りに注意。

en.wikipedia.org ↗

Agentic Workflow

エージェンティックワークフロー

Practice / Culture

単発プロンプトでなく、計画・実行・検証・反復をエージェントに任せる作業の組み立て方。再利用可能な手順としてワークフロー化する。

github.blog ↗

AI-Native Development

AIネイティブ開発

Practice / Culture

AI を後付けのツールでなく開発フローの中心に据える進め方。設計・実装・レビュー・運用の各段で AI を前提に組む。

aws.amazon.com ↗

Spec-Driven Development

仕様駆動開発

Practice / Culture

自然言語の仕様を起点に、AI に実装・テストを生成させる開発手法。曖昧さを仕様側で減らし、生成物の検証可能性を高める。

github.blog ↗

Token Efficiency

トークン効率

Practice / Culture

同じ成果をより少ないトークンで達成する工夫。コンテキストの圧縮・要約・選別で、コストと速度と精度を同時に改善する。

github.blog ↗

A

Agent Memory

メモリ · long-term memory

Agents

エージェントが会話やタスクをまたいで情報を保持する仕組み。短期（コンテキスト内）と長期（外部ストア）に分かれ、文脈の継続に使う。

blog.langchain.dev ↗

Agentic Workflow

エージェンティックワークフロー

Practice / Culture

単発プロンプトでなく、計画・実行・検証・反復をエージェントに任せる作業の組み立て方。再利用可能な手順としてワークフロー化する。

github.blog ↗

AI Agent

エージェント · agentic

Agents

LLM が自分で計画を立て、ツールを呼び、結果を観察しながら多段階のタスクを自律的に進めるシステム。単発の応答ではなくループで動く。

anthropic.com ↗

AI Engineering

Engineering

oreilly.com ↗

AI-Native Development

AIネイティブ開発

Practice / Culture

AI を後付けのツールでなく開発フローの中心に据える進め方。設計・実装・レビュー・運用の各段で AI を前提に組む。

aws.amazon.com ↗

Alignment

アライメント · 整列

Training / Tuning

モデルの振る舞いを人間の意図・価値観・安全性に合わせること。RLHF・憲法 AI・評価などで実現する。

anthropic.com ↗

B

Benchmark

ベンチマーク · SWE-bench · MMLU

Evaluation

モデル性能を比較するための標準テスト集（MMLU, SWE-bench 等）。コーディング・推論・知識など領域ごとにある。

swebench.com ↗

C

Chain of Thought

CoT · 思考の連鎖

Prompting

「順を追って考えて」と促し、推論過程を明示的に出力させる手法。複雑な推論や計算の精度が上がる。

promptingguide.ai ↗

Chunking

チャンキング · 分割

RAG / Retrieval

長い文書を検索しやすい単位に分割する処理。チャンクの大きさ・重なり・境界の取り方が RAG の精度を大きく左右する。

pinecone.io ↗

Context Engineering

▲ trending

コンテキストエンジニアリング

Engineering

2025-2026 に台頭。プロンプト単体より上位の関心事として扱われる。

anthropic.com ↗

Context Window

コンテキストウィンドウ · context length

Models

モデルが一度に処理できるトークンの最大量。プロンプト＋応答がこの上限に収まる必要があり、長文処理やメモリ設計の制約になる。

anthropic.com ↗

D

Distillation

蒸留 · knowledge distillation

Training / Tuning

大きな教師モデルの出力を使って小さな生徒モデルを訓練し、性能を保ちつつ軽量化する手法。

huggingface.co ↗

DPO

Direct Preference Optimization · 直接選好最適化

Training / Tuning

報酬モデルを別途作らず、好まれた／好まれない応答の対から直接モデルを最適化する手法。RLHF より簡潔。

arxiv.org ↗

E

Embedding

埋め込み · ベクトル

RAG / Retrieval

テキストや画像を意味を表す数値ベクトルに変換したもの。意味的な近さを距離で測れるため、検索・分類・クラスタリングに使う。

platform.openai.com ↗

Evals

evaluation · 評価 · eval

Evaluation

「推測でなく実測」を支える基盤。継続的評価で本番品質を監視する。

hamel.dev ↗

F

Few-shot Prompting

フューショット · in-context learning · ICL

Prompting

プロンプト内に入出力の例をいくつか示して、望む形式・スタイルをモデルに学ばせる手法。学習し直さずに（in-context で）振る舞いを誘導する。

promptingguide.ai ↗

Fine-tuning

ファインチューニング · SFT

Training / Tuning

事前学習済みモデルを、特定タスク・スタイルのデータで追加学習して適応させる手法。少量データで振る舞いを寄せる。

platform.openai.com ↗

G

Golden Dataset

ゴールデンデータセット · eval set

Evaluation

正解が確定した評価用データ。プロンプトやモデル変更の前後で品質を比較する基準になる。

hamel.dev ↗

Guardrails

ガードレール

Agents

エージェントの出力や行動を安全な範囲に制限する仕組み。禁止操作のブロック、出力検証、承認ゲートなどで暴走や有害行動を防ぐ。

guardrailsai.com ↗

H

Hallucination

ハルシネーション · 幻覚

Models

モデルが事実でない内容をもっともらしく生成してしまう現象。RAG・引用・検証で抑える。

ibm.com ↗

Harness Engineering

▲ trending

ハーネスエンジニアリング · agent harness

Engineering

Anthropic の long-running agents 記事で体系化。本ダッシュボードのルールもこの考え方に基づく。

anthropic.com ↗

Human in the Loop

HITL · ヒューマンインザループ

Agents

破壊的・重要な操作の前に人間の確認や承認を挟む設計。自律性とリスク管理のバランスを取る。

anthropic.com ↗

Hybrid Search

ハイブリッド検索

RAG / Retrieval

キーワード検索（BM25 等）とベクトル検索を組み合わせ、語の一致と意味の近さの両方で精度を上げる検索手法。

pinecone.io ↗

K

Knowledge Graph

ナレッジグラフ · GraphRAG

RAG / Retrieval

エンティティと関係をグラフで表した知識構造。RAG と組み合わせ（GraphRAG）、関係性をたどる検索や多段推論に使う。

neo4j.com ↗

L

LLM

Large Language Model · 大規模言語モデル

Models

大量のテキストで学習した、次のトークンを予測する大規模なニューラルネット。文章生成・要約・コード生成など汎用的な言語タスクをこなす。

en.wikipedia.org ↗

LLM-as-a-Judge

LLMによる採点

Evaluation

別の LLM に出力を採点させて品質を自動評価する手法。人手評価をスケールさせるが、バイアスに注意が必要。

huggingface.co ↗

Local LLM

ローカルLLM · on-device

Models

自分の PC やサーバー上で動かす LLM。プライバシー・コスト・オフライン動作に利点。Ollama や量子化モデルで普及。

ollama.com ↗

LoRA

Low-Rank Adaptation · PEFT

Training / Tuning

元の重みを凍結し、小さな低ランク行列だけを学習する軽量ファインチューニング。少ない計算・メモリで適応できる。

huggingface.co ↗

M

MCP

▲ trending

Model Context Protocol

Agents

Anthropic が提唱し、エコシステムが急拡大中のトレンド。

modelcontextprotocol.io ↗

Mixture of Experts

MoE · 専門家混合

Models

複数の小さな「専門家」サブネットを持ち、入力ごとに一部だけを動かすモデル構造。総パラメータは大きくても計算は軽くできる。

huggingface.co ↗

Multi-Agent System

マルチエージェント · orchestrator

Agents

anthropic.com ↗

Multimodal

マルチモーダル

Models

テキストだけでなく画像・音声・動画など複数の種類の入出力を扱えるモデル。スクショ理解や図表生成などに広がる。

platform.openai.com ↗

P

Prompt Engineering

プロンプトエンジニアリング

Engineering

LLM から望む出力を得るために、指示・例・制約・出力形式を設計する技術。モデルの振る舞いをプロンプト側で制御する最も基本的なレイヤー。

promptingguide.ai ↗

Prompt Injection

プロンプトインジェクション

Prompting

外部入力中の命令文は「データ」として扱い、実行指示にしないのが防御の基本。

owasp.org ↗

Q

Quantization

量子化

Models

モデルの重みを低ビット（int8/int4 等）に圧縮し、メモリと計算を削減する技術。ローカル LLM やエッジ実行で重要。

huggingface.co ↗

R

RAG

Retrieval-Augmented Generation · 検索拡張生成

RAG / Retrieval

promptingguide.ai ↗

ReAct

reasoning and acting

Prompting

promptingguide.ai ↗

Reasoning Model

▲ trending

推論モデル · o1 · thinking

Models

回答前に内部で長い思考（推論トークン）を費やすよう訓練されたモデル。難しい数学・コーディング・計画タスクで精度が上がる。

OpenAI o 系、Claude の extended thinking 等。推論時計算（test-time compute）のトレンド。

platform.openai.com ↗

Reranking

リランキング · re-rank

RAG / Retrieval

一次検索で集めた候補を、より精度の高いモデルで並べ替えて上位を絞る処理。RAG の関連性を底上げする。

pinecone.io ↗

RLHF

人間のフィードバックによる強化学習

Training / Tuning

人間の好みを反映した報酬モデルで強化学習し、モデルを「役立つ・無害」に整える手法。ChatGPT 等の整列（alignment）の中核。

huggingface.co ↗

Rubber Duck Debugging

▲ trending

ラバーダック · rubber ducking · second opinion

Practice / Culture

GitHub Copilot CLI の『model families for a second opinion』のように、複数モデルで相互レビューする使い方が広がっている。

github.blog ↗

S

Spec-Driven Development

仕様駆動開発

Practice / Culture

自然言語の仕様を起点に、AI に実装・テストを生成させる開発手法。曖昧さを仕様側で減らし、生成物の検証可能性を高める。

github.blog ↗

Structured Output

JSON mode · 構造化出力 · function calling

Prompting

モデルに JSON 等の決まった形式で出力させる仕組み。スキーマを指定して機械処理可能な応答を保証する。ツール連携の前提。

platform.openai.com ↗

System Prompt

システムプロンプト

Prompting

会話全体を通してモデルの役割・制約・トーンを定義する上位の指示。ユーザー入力より優先され、振る舞いの土台になる。

platform.openai.com ↗

T

Token

トークン

Models

モデルがテキストを扱う最小単位（単語の断片など）。入出力の長さやコストはトークン数で測られる。

platform.openai.com ↗

Token Efficiency

トークン効率

Practice / Culture

同じ成果をより少ないトークンで達成する工夫。コンテキストの圧縮・要約・選別で、コストと速度と精度を同時に改善する。

github.blog ↗

Tool Use

function calling · ツール使用

Agents

モデルが外部の関数・API・コマンドを呼び出して、検索・計算・ファイル操作などを行う仕組み。エージェントが現実世界に作用する手段。

docs.anthropic.com ↗

V

Vector Database

ベクトルDB · vector store

RAG / Retrieval

埋め込みベクトルを保存し、類似度検索（最近傍探索）を高速に行う専用データベース。RAG の検索基盤。

pinecone.io ↗

Vibe Coding

▲ trending

バイブコーディング

Practice / Culture

細部を自分で書かず、AI に意図を伝えて生成・修正を繰り返しながら作る開発スタイル。素早い試作に向く一方、検証と理解の置き去りに注意。

en.wikipedia.org ↗

Z

Zero-shot Prompting

ゼロショット

Prompting

例を一切示さず、指示だけでタスクを解かせる手法。モデルの事前学習知識に依存する。

promptingguide.ai ↗

AI / LLM 用語集 50 terms

Engineering

Prompt Engineering

Context Engineering

Harness Engineering

AI Engineering

Prompting

Few-shot Prompting

Zero-shot Prompting

Chain of Thought

ReAct

System Prompt

Structured Output

Prompt Injection

Agents

AI Agent

Tool Use

MCP

Multi-Agent System

Guardrails

Human in the Loop

Agent Memory

RAG / Retrieval

RAG

Embedding

Vector Database

Chunking

Reranking

Hybrid Search

Knowledge Graph

Models

LLM

Token

Context Window

Hallucination

Multimodal

Reasoning Model

Mixture of Experts

Quantization

Local LLM

Training / Tuning

Fine-tuning

RLHF

DPO

LoRA

Distillation

Alignment

Evaluation

Evals

LLM-as-a-Judge

Benchmark

Golden Dataset

Practice / Culture

Rubber Duck Debugging

Vibe Coding

Agentic Workflow

AI-Native Development

Spec-Driven Development

Token Efficiency

A

Agent Memory

Agentic Workflow

AI Agent

AI Engineering

AI-Native Development

Alignment

B

Benchmark

C

Chain of Thought

Chunking

Context Engineering

Context Window

D

Distillation

DPO

E

Embedding

Evals

F