Foundation Modelとは?LLMとの違いを解説

Foundation Modelとは?LLMとの違いを解説

Foundation Modelという言葉を初めて聞いて戸惑う初心者
「Foundation Modelって、何のこと?」
「LLMと同じ意味なの?違うの?」
「試験で出るって聞いたけど、どこを押さえれば?」

そんな疑問を持つ、AI初心者のあなたへ。

結論から言えば、
Foundation Model(基盤モデル)は、大量データで土台を学び、後から様々なタスクに使える汎用AIモデル
です。LLMはその「言語特化版」にあたります。

 

日本語では「基盤モデル」と訳され、事前学習とファインチューニングの2段階で作られます。

 

この記事では、Foundation Model の定義、LLM との関係、作られ方、代表的な種類を、初心者のあなた向けにやさしくまとめました。生成AIパスポート対策にも役立ちます。

 

1. Foundation Modelとは(基盤モデル)

Foundation Modelの定義をノートにまとめる様子

あなたが「Foundation Model」という言葉に出会ったとき、まず押さえたいのは大量・多様なデータで事前学習された、汎用的な土台のAIモデルという定義です。

 

日本語に直すと「基盤モデル」。後から色々なタスクに応用できる土台(基盤)となるモデルを指します。

 

ここでイメージしてほしいのが、基礎工事が済んだ土地です。同じ土地の上に、家を建てることも、店を構えることも、倉庫を置くこともできる。Foundation Model がやっていることは、この「基礎工事」に近いです。

 

従来のAIは「翻訳専用」「画像分類専用」のように、タスクごとに別々のモデルを作っていました。

 

1つの大きなモデルを土台として学習しておき、翻訳・要約・画像生成・音声認識など様々なタスクへ枝分かれさせる。これが Foundation Model の核となる発想です。

 

2. LLMとの関係

Foundation ModelとLLMの関係を整理するオフィスワーク

あなたが Foundation Model と LLM の関係でつまずきやすいのは、両者が同じ文脈で語られるからです。結論を先に出すと、LLM は Foundation Model の一種です。

 

Foundation Model は上位概念で、そこに「言語特化版」として LLM(大規模言語モデル)が位置づきます。包含関係を整理します。

 

観点 Foundation Model LLM
扱うデータ 言語 / 画像 / 音声 / 動画など多様 主に言語(テキスト)
位置づけ 上位の汎用概念 Foundation Model の一種
代表的な使い道 翻訳・画像生成・音声認識など幅広く 会話・文章生成・要約

 

図的に書くと「Foundation Model ⊃ LLM」。LLM はどれも Foundation Model に含まれますが、Foundation Model のほうは LLM だけに限らない、という関係です。

 

画像生成や音声認識のモデルも、大量データで事前学習された汎用的な土台であれば Foundation Model に含まれます。

 

→ LLM をもう一歩詳しく知りたい時は、LLMとは で押さえられます。

 

3. どう作られるか — 2段階の仕組み

事前学習とファインチューニングの2段階を分析する様子

あなたが Foundation Model の作り方を一度で押さえたいなら、「事前学習」と「ファインチューニング」の2段階で分けて見るのがいちばん早いです。

 

ここでイメージしてほしいのが、ひとりの学生です。学生時代に膨大な本を読んで広い知識の土台を作り、社会に出てから職業ごとの専門訓練を受ける。Foundation Model の作り方は、この流れにとてもよく似ています。

 

STEP 1: 事前学習(土台づくり)

インターネット上のテキスト、論文、書籍、画像など、膨大で多様なデータをモデルに読み込ませます。言葉の使い方や画像の特徴といった「土台」を身につける工程です。

 

巨大な計算資源と数週間〜数ヶ月の時間がかかります。ここまでで作られたものが、いわゆる Foundation Model の素体です。

 

STEP 2: ファインチューニング・プロンプトエンジニアリング(個別タスクへ)

事前学習で土台ができたモデルに、用途に応じた追加調整をかけます。代表的な手法は2つです。

  • ファインチューニング: 個別タスク用のデータで追加学習し、モデルの中身を専門化する
  • プロンプトエンジニアリング: モデルはそのまま、指示文の工夫だけで望む出力を引き出す

 

同じ Foundation Model を土台に、カスタマーサポート向け / 法律文書向け / 医療向けといった具合に、用途別の専門モデルへ枝分かれさせられる点が最大の強みです。

 

→ ファインチューニングを深掘りしたい時は、ファインチューニングとは もあわせて読むと立体的に理解できます。

 

4. 種類と例(2024〜2025年時点)

テキスト・画像・音声など多様な用途で活躍する様子

あなたが Foundation Model の全体像を掴むなら、扱うデータの種類で分けて見るのが分かりやすいです。代表的なのは、次の4つの軸です。

 

イメージは、万能の料理人です。同じ料理人が、和食・洋食・中華・スイーツの注文に応じて専門料理を仕上げる。Foundation Model の世界も、これに近い広がり方をしています。

 

主な用途 代表例
テキスト系 会話・文章生成・要約 GPT 系(OpenAI 等)
画像系 画像生成・画像認識 Stable Diffusion 系
音声系 音声認識・音声合成 (音声特化モデル各種)
マルチモーダル系 言語+画像+音声を一緒に扱う (マルチモーダル対応モデル各種)

 

テキスト系の代表が、ChatGPT などでおなじみのGPT 系です。画像系では Stable Diffusion 系のモデルが、テキストから画像を生成する用途で広く使われています。

 

音声・マルチモーダル系は、固有名詞より「言語以外も扱える広がり」を押さえておけば試験で迷いません。

 

→ 言語と画像を同時に扱う種類は、マルチモーダルとは で深掘りできます。

 

5. まとめ: 今日からできる、最初の一歩

Foundation Modelの理解が完成した様子

ここまで読んだあなたは、Foundation Model の輪郭をしっかり押さえられたはずです。要点を4つに整理します。

 

  1. Foundation Model = 基盤モデル: 大量データで土台を学び、後から様々なタスクに使える汎用AIモデル
  2. LLM は Foundation Model の一種: 言語に特化した部分集合という関係
  3. 2段階で作られる: 事前学習で土台 → ファインチューニング等で個別タスクへ
  4. 種類: テキスト系・画像系・音声系・マルチモーダル系の4軸

 

Foundation Model は、生成AIパスポート 領域1 生成AIの技術の中核概念です。LLM・ファインチューニング・マルチモーダルといった頻出語の親にあたるため、ここを押さえると周辺概念が一気に整理されます。

 

あなたが今日からできる、最初の一歩を3つ用意しました。

 

  1. 用語整理: Foundation Model と LLM の関係を、1行メモにまとめる(3分)
  2. 関連記事: LLM の解説記事に進み、言語特化版の中身を押さえる(5分)
  3. 試験全体俯瞰: 生成AIパスポート 試験全体概要に戻り、領域1での位置づけを確認(2分)

 

たった10分で、Foundation Model は輪郭のある概念に変わります。完璧に覚えてから動くより、まず関連記事を1本読んでみる。それが、あなたにとっていちばん速い学び方です。

 

次のステップ