生成AIパスポートモデルの種類・学習技法問題集｜過去問形式で8問

生成AIのモデルは、生まれてすぐ賢いわけではありません。大量のデータで土台を作り、用途に合わせて仕上げ、使うときにさらに工夫する——という時間の流れを経て役立つ道具になります。生成AIパスポート「モデルの種類・学習技法」の練習問題8問は、この育ちの各段階で登場する用語を問う分野です。まず全体を1本の流れで押さえましょう。

モデルは「事前学習→調整→推論の工夫」の順に育つ

技法の名前をばらばらに覚えると、どれが「学習し直す話」でどれが「その場の指示の話」か混乱します。モデルが育つ時間軸に沿って並べると、役割がはっきりします。

段階①：事前学習 … 膨大なデータでモデルの土台を作ります。ここで言語や画像の一般的なパターンを身につけます。画像生成で使われる拡散モデルや、文章・画像・音声など複数種のデータを扱うマルチモーダルのモデルも、この段階で基礎ができます。
段階②：追加学習（調整） … 用途に合わせてモデル自体を再調整するのがファインチューニングです。専門分野の受け答えを覚えさせるなど、モデルの中身を書き換える点がポイントです。
段階③：推論時の工夫（プロンプト技法） … 学習し直さず、使うときの指示で能力を引き出します。例を与えないZero-Shot、少数の例を添えるFew-Shot、思考の手順を書かせるChain-of-Thoughtがこれにあたります。

受託の現場で15年以上開発を見てきた立場からいうと、実務でまず試すのは③のプロンプト技法で、それでも足りないときに②のファインチューニングを検討します。「学習をやり直すのか、その場の指示で済ませるのか」の線引きは、試験でも実務でも要になります。この時間軸を意識して、8問に挑んでみてください。

押さえたい用語
・拡散モデル … ノイズから徐々に画像を生成するモデル。画像生成AIの中心的な方式。
・マルチモーダル … テキスト・画像・音声など、異なる種類のデータをまとめて扱えること。
・Zero-Shot／Few-Shot … 例を与えずに解かせるか、少数の例を添えて解かせるかの違い。
・Chain-of-Thought … 途中の考える手順を書かせ、複雑な問題の精度を高める指示のしかた。

Q1. 画像生成でよく使われる拡散モデル（Diffusion Model）の説明として、もっとも適切なものはどれですか？

A. 文章を単語ごとに区切って数値に変換するだけの仕組み

B. ノイズだらけの状態から少しずつノイズを取り除くように学習し、画像などを生成する手法

C. 完成した画像を圧縮して保存するためのファイル形式

D. 既存の画像をそのままコピーして並べるだけの処理

回答

解説

正解は「B」です。

拡散モデルは、画像にノイズを少しずつ加えていく過程を学習し、その逆をたどってノイズを取り除きながら画像を生成する手法とされています。画像生成 AI で広く使われています。砂嵐のような状態から、徐々に絵が浮かび上がってくるイメージに近いといえます。

A は数値変換だけ、C はファイル形式、D は単なるコピーという説明で、いずれもノイズ除去を学習して生成する拡散モデルとは異なるため誤りです。

拡散モデルとはを見る

Q2. マルチモーダル AI の説明として、もっとも適切なものはどれですか？

A. テキスト・画像・音声など複数の種類の情報をまとめて扱える AI

B. テキストだけしか入力できない AI

C. 複数の利用者が同時にログインできることだけを指す機能

回答

解説

正解は「A」です。

マルチモーダル AIは、テキスト・画像・音声といった複数の種類（モダリティ）の情報をまとめて扱える AI を指します。たとえば画像を見せて内容を説明させる、といった使い方ができます。目と耳と言葉を合わせて状況をつかむ人の理解の仕方に近いイメージです。

B はテキスト限定、C は同時ログイン機能という説明で、いずれも複数種類の情報を扱うマルチモーダルの定義とは異なるため誤りです。

マルチモーダルとはを見る

Q3. ファインチューニングの説明として、もっとも適切なものはどれですか？

A. モデルをゼロから新しく作り直すこと

B. 利用者が入力する指示文だけを工夫すること

C. モデルの出力を人手でひとつずつ書き換える作業

D. 事前学習済みのモデルに、特定の目的のデータを追加で学習させて適応させること

回答

解説

正解は「D」です。

ファインチューニングは、すでに事前学習されたモデルに対して、特定の目的に合わせたデータを追加で学習させ、その用途に適応させる手法です。土台を作り直さずに済むため、効率よく専門性を高められます。基礎ができた人に、特定分野の研修を受けてもらうようなイメージです。

A はゼロから作り直すこと、B は指示文の工夫（プロンプト）、C は人手での書き換えで、いずれも追加学習で適応させるファインチューニングとは異なるため誤りです。

ファインチューニングとはを見る

Q4. Few-Shot 学習（Few-Shot Learning）の説明として、もっとも適切なものはどれですか？

A. 大量のラベル付きデータを使い、長時間かけてゼロから学習させること

B. 例をいっさい示さずに、モデルの内部構造を書き換えること

C. プロンプトの中に少数の例を示して、モデルにタスクのやり方を伝える方法

回答

解説

正解は「C」です。

Few-Shot 学習は、プロンプト（指示文）の中に少数の例を示すことで、モデルにタスクの進め方を伝える方法です。モデルの内部を学習し直すのではなく、例を見せて期待する形式を理解させます。お手本をいくつか見せてから本番をお願いする進め方に近いイメージです。

A はゼロからの大規模学習、B は例を示さず内部を書き換える説明で、いずれも少数の例を提示する Few-Shot 学習とは異なるため誤りです。

Few-Shot 学習とはを見る

Q5. Chain-of-Thought（思考の連鎖）の説明として、もっとも適切なものはどれですか？

A. 答えを出すまでの途中の考え方を順を追って書き出させ、複雑な問題の精度を高めようとする手法

B. 複数のモデルを鎖のようにつないで同じ計算を繰り返させる仕組み

C. 出力結果を1単語だけに短く要約させるルール

D. モデルの学習データを時系列順に並べ替える前処理

回答

解説

正解は「A」です。

Chain-of-Thought（思考の連鎖）は、答えにたどり着くまでの途中の考え方を順を追って書き出させることで、推論を要する問題の精度を高めようとするプロンプト技法とされています。いきなり結論ではなく、途中式を書いてから答えを出す解き方に近いイメージです。

B はモデルの連結、C は1単語要約、D は学習データの並べ替えという説明で、いずれも途中の推論過程を書き出させる手法とは異なるため誤りです。

Chain-of-Thought とはを見る

Q6. 例を示さずに指示だけでタスクをこなさせる Zero-Shot の説明として、もっとも適切なものはどれですか？

A. 数十個の例を示すことを前提にタスクを実行させる方法

B. 例を示さず、指示文（プロンプト）だけでタスクをこなさせる方法

C. モデルの重みを毎回ゼロに初期化してから使う方法

回答

解説

正解は「B」です。

Zero-Shotは、例を示さずに、指示文（プロンプト）だけでタスクをこなさせる方法です。少数の例を添える Few-Shot と対になる考え方で、手軽に試せる一方、難しいタスクでは例を添えたほうが精度が上がる場合もあります。お手本なしでいきなり本番をお願いする進め方にあたります。

A は多数の例を示す Few-Shot 寄りの説明、C は重みの初期化という説明で、いずれも例なしで指示だけ与える Zero-Shot とは異なるため誤りです。

Few-Shot 学習とはを見る

Q7. マルチモーダル AI の応用例として、もっとも適切なものはどれですか？

A. テキストの文字数を数えて表示するだけの機能

B. パソコンの電源を入れ直す再起動の操作

C. 写真をアップロードして「何が写っているか」を文章で説明させる

回答

解説

正解は「C」です。

マルチモーダル AIは複数種類の情報を扱えるため、画像を入力して内容を文章で説明させるといった、種類をまたいだ応用ができます。写真の内容説明は、画像（入力）とテキスト（出力）という異なるモダリティを組み合わせた代表例です。見たものを言葉で伝える、という橋渡しにあたります。

A は文字数カウント、B は再起動という、単一の種類の情報だけで完結する操作で、いずれもモダリティをまたぐ応用例とはいえないため誤りです。

マルチモーダルとはを見る

Q8. ファインチューニングとプロンプトによる調整の使い分けの説明として、もっとも適切なものはどれですか？

A. どちらもモデル内部の重みを書き換える手法であり、効果は同じである

B. ファインチューニングは指示文の工夫だけを指し、データは使わない

C. プロンプトの工夫は、どんな場合もファインチューニングより高い精度になる

D. ファインチューニングはデータで追加学習し内部を調整、プロンプトの工夫は学習せず指示で振る舞いを変える、という違いがある

回答

解説