RAGとは？ChatGPTに社内データを繋ぐ仕組みをやさしく解説

「RAGって、ふつうのAIチャットと何が違うの?」
「なぜ社内文書の質問に答えられるの?」
「ファインチューニングとどう使い分ける?」

「AIは物知りなのに、うちの社内規程は知らない」。この当然のズレを埋める仕掛けが、RAGです。誤解を一つ、先に正しておきます。

RAGとは、AIが回答する前に外部の文書を検索し、その内容を根拠にして答えを作る仕組みです。Retrieval-Augmented Generation（検索拡張生成）の略で、知識をAIの外に置いたまま参照させるのが要点です。あなたが持ち帰るべき芯は、「AIに覚え込ませる」のではなく「その場で調べさせる」という発想の切り替えです。

この記事では、まずRAGが必要になったLLMの弱点を押さえ、検索・付加・生成の3ステップを図でたどります。さらにファインチューニングとの使い分けを表で整理し、業務での注意点まで示します。

1 1. RAGとは何か
2 2. なぜRAGが必要か
3 3. RAGの3ステップ
4 4. ファインチューニングとの使い分け
5 5. 業務での使いどころと注意点
- 5.1 次のステップ

1. RAGとは何か

ふつうのAIチャットは、学習済みの知識だけを頼りに答えます。対してRAGは、質問を受けるとまず関連しそうな文書を探し、その中身を手元に置いてから回答を組み立てます。答えの根拠が、AIの記憶ではなく「検索してきた文書」に置き換わるわけです。

たとえるなら、参考書の持ち込みが許された試験です。暗記だけで挑む試験では、うろ覚えの箇所は当てずっぽうになります。ところが参考書を開いてよいなら、該当ページを引いてから正確に答えられます。RAGがAIにさせているのは、まさにこの「調べてから答える」という段取りです。

この一手間があるおかげで、RAGはAIが学習していない情報にも答えられます。昨日更新された社内規程でも、公開直後のニュースでも、検索先に置いておけば回答の根拠になります。土台となるAI本体の仕組みは LLM（大規模言語モデル）とはで確認しておくと、RAGの立ち位置がはっきりします。

2. なぜRAGが必要か

RAGが広まった理由は、LLM単体が抱える2つの弱点を素直に埋めるからです。1つは知識の古さ。もう1つは、事実でない内容をもっともらしく作ってしまう現象です。

知識の古さは、LLMの仕組みそのものから来ます。モデルは学習した時点までの情報しか持たず、その後に起きた出来事は知りません。まして、社外に公開されていないあなたの会社の規程や在庫データは、学習のしようがありません。ここでモデルを作り直すのは費用も時間も重い。だからこそ、知識を外に置いて必要なときだけ参照させるRAGが現実的な答えになります。

もう一方の「それらしい嘘」はハルシネーションと呼ばれます。RAGは根拠となる文書を先に渡すので、AIが記憶だけで作文する余地が減り、事実からの逸脱を抑えられます。ただし検索してきた文書自体が間違っていれば、答えも間違います。仕組みの詳しい中身はハルシネーションとはで押さえておくと、RAGの効き目と限界の両方が見えます。

3. RAGの3ステップ

RAGの内側は、大きく3ステップで動きます。図で一連の流れを見てください。

順に言うと、①質問に関連する文書を検索し、②見つけた文書を質問文に付け足してAIへ渡し、③AIがその文書を根拠に回答を生成します。ここで1段目の検索が外すと、AIにはずれた資料が渡り、答えもずれます。RAGの質は、生成の賢さより先に、検索の精度で決まる——あなたが覚えておくと役立つ勘所です。

この3段構えを知っておくと、RAGがうまく答えない原因の切り分けが速くなります。的外れな回答が返るとき、多くは③の生成でなく①の検索でつまずいています。質問に対して正しい文書を拾えているか——あなたがまずそこを疑うだけで、改善の当たりがつきます。文書の置き方や区切り方を見直すのが、実務での最初の一手です。

4. ファインチューニングとの使い分け

AIに独自の知識を持たせる方法には、RAGのほかにファインチューニングがあります。両者は競合ではなく、目的で選び分けます。

観点	RAG（検索で外付け）	ファインチューニング（再学習）
知識の持たせ方	外部文書を都度参照	モデル自体に学習させる
情報の更新	文書を差し替えるだけで即反映	学習をやり直す必要がある
得意なこと	最新・社内の事実を答える	特定の口調・形式を身につける

選び分けの軸はシンプルです。変わり続ける事実を答えさせたいならRAG、振る舞い方そのものを覚えさせたいならファインチューニング。あなたの用途が「最新の在庫や規程を答える」ならRAG、「自社らしい文体で書かせる」ならファインチューニングが向きます。再学習側の詳細はファインチューニングとはで確認できます。

5. 業務での使いどころと注意点

RAGは、社内文書を土台にしたチャットや問い合わせ対応、製品マニュアルの検索窓口など、正確さと最新性が求められる場面で力を発揮します。あなたが導入を考えるとき、成果を分けるのは次の3点です。

元になる文書の質と鮮度: 古い・誤った文書を置けば、答えも同じだけ劣化する
検索の精度: 質問の意図に合う文書を拾えるかが、回答の当たり外れを決める
出典を示す設計: 根拠の文書を提示すれば、利用者が答えの真偽を確かめられる

生成AIパスポートやG検定では、「ハルシネーションを抑える手法」「外部知識を参照して回答する仕組み」としてRAGが問われます。ファインチューニングとの違い——知識を外付けするか、モデルに焼き付けるか——を言い分けられれば、選択問題で迷いません。プロンプト側の工夫と組み合わせる話はプロンプトエンジニアリングとはにもつながります。

RAGの限界も、あわせて覚えておくと安心です。RAGは「渡した文書の範囲でしか正確になれない」仕組みで、検索先に無い情報は答えられませんし、拾った文書が古ければ答えも古びます。万能の解決策ではなく、良い文書を良い形で用意して初めて効く道具——あなたがこの前提を持っておくと、過度な期待でつまずかずに済みます。

次のステップ

生成AIの用語を体系立てて押さえたいなら、生成AIパスポートの試験範囲と勉強法ガイドを起点にすると、RAGが他のキーワードとどうつながるかが見通せます。

理解を得点に変えるなら、生成AIパスポートプロンプト・RAGの問題集で、実際の出題を解きながら、要点を腕にしみ込ませてください。