生成AIパスポート モデルの種類・学習技法「拡散モデル・マルチモーダル・ファインチューニング・Few-Shot・Chain-of-Thought・Zero-Shot・マルチモーダルの応用・追加学習の使い分け」の練習問題8問です。解けなかった問題は、各問の解説末尾のリンクから対応する解説記事に進んでください。
Q1. 画像生成でよく使われる拡散モデル(Diffusion Model)の説明として、もっとも適切なものはどれですか?
回答
解説
正解は「B」です。
拡散モデルは、画像にノイズを少しずつ加えていく過程を学習し、その逆をたどってノイズを取り除きながら画像を生成する手法とされています。画像生成 AI で広く使われています。砂嵐のような状態から、徐々に絵が浮かび上がってくるイメージに近いといえます。
A は数値変換だけ、C はファイル形式、D は単なるコピーという説明で、いずれもノイズ除去を学習して生成する拡散モデルとは異なるため誤りです。
Q2. マルチモーダル AI の説明として、もっとも適切なものはどれですか?
回答
解説
正解は「A」です。
マルチモーダル AIは、テキスト・画像・音声といった複数の種類(モダリティ)の情報をまとめて扱える AI を指します。たとえば画像を見せて内容を説明させる、といった使い方ができます。目と耳と言葉を合わせて状況をつかむ人の理解の仕方に近いイメージです。
B はテキスト限定、C は同時ログイン機能という説明で、いずれも複数種類の情報を扱うマルチモーダルの定義とは異なるため誤りです。
Q3. ファインチューニングの説明として、もっとも適切なものはどれですか?
回答
解説
正解は「D」です。
ファインチューニングは、すでに事前学習されたモデルに対して、特定の目的に合わせたデータを追加で学習させ、その用途に適応させる手法です。土台を作り直さずに済むため、効率よく専門性を高められます。基礎ができた人に、特定分野の研修を受けてもらうようなイメージです。
A はゼロから作り直すこと、B は指示文の工夫(プロンプト)、C は人手での書き換えで、いずれも追加学習で適応させるファインチューニングとは異なるため誤りです。
Q4. Few-Shot 学習(Few-Shot Learning)の説明として、もっとも適切なものはどれですか?
回答
解説
正解は「C」です。
Few-Shot 学習は、プロンプト(指示文)の中に少数の例を示すことで、モデルにタスクの進め方を伝える方法です。モデルの内部を学習し直すのではなく、例を見せて期待する形式を理解させます。お手本をいくつか見せてから本番をお願いする進め方に近いイメージです。
A はゼロからの大規模学習、B は例を示さず内部を書き換える説明で、いずれも少数の例を提示する Few-Shot 学習とは異なるため誤りです。
Q5. Chain-of-Thought(思考の連鎖)の説明として、もっとも適切なものはどれですか?
回答
解説
正解は「A」です。
Chain-of-Thought(思考の連鎖)は、答えにたどり着くまでの途中の考え方を順を追って書き出させることで、推論を要する問題の精度を高めようとするプロンプト技法とされています。いきなり結論ではなく、途中式を書いてから答えを出す解き方に近いイメージです。
B はモデルの連結、C は1単語要約、D は学習データの並べ替えという説明で、いずれも途中の推論過程を書き出させる手法とは異なるため誤りです。
Q6. 例を示さずに指示だけでタスクをこなさせる Zero-Shot の説明として、もっとも適切なものはどれですか?
回答
解説
正解は「B」です。
Zero-Shotは、例を示さずに、指示文(プロンプト)だけでタスクをこなさせる方法です。少数の例を添える Few-Shot と対になる考え方で、手軽に試せる一方、難しいタスクでは例を添えたほうが精度が上がる場合もあります。お手本なしでいきなり本番をお願いする進め方にあたります。
A は多数の例を示す Few-Shot 寄りの説明、C は重みの初期化という説明で、いずれも例なしで指示だけ与える Zero-Shot とは異なるため誤りです。
Q7. マルチモーダル AI の応用例として、もっとも適切なものはどれですか?
回答
解説
正解は「C」です。
マルチモーダル AIは複数種類の情報を扱えるため、画像を入力して内容を文章で説明させるといった、種類をまたいだ応用ができます。写真の内容説明は、画像(入力)とテキスト(出力)という異なるモダリティを組み合わせた代表例です。見たものを言葉で伝える、という橋渡しにあたります。
A は文字数カウント、B は再起動という、単一の種類の情報だけで完結する操作で、いずれもモダリティをまたぐ応用例とはいえないため誤りです。
Q8. ファインチューニングとプロンプトによる調整の使い分けの説明として、もっとも適切なものはどれですか?
回答
解説
正解は「D」です。
ファインチューニングは追加データで学習し、モデル内部を目的に合わせて調整します。一方、プロンプトの工夫は学習を行わず、指示の与え方で振る舞いを変えます。手軽さでは指示の工夫、用途への深い適応では追加学習が向く、というように目的に応じて使い分けるとされています。研修で力をつけるか、その場の指示でやり方を変えてもらうか、の違いにたとえられます。
A は効果が同じ、B はファインチューニングがデータを使わない、C はプロンプトがどんな場合も高精度という断定で、いずれも両者の違いの説明として誤りです。
試験全体の流れを俯瞰したい時は、生成AIパスポート 試験全体概要 に戻れます。