生成AIパスポート LLM・基盤技術問題集｜過去問題形式で8問

大規模言語モデル（LLM）を「巨大な辞書」や「検索エンジン」だと思っていると、この分野の問題でつまずきます。LLMは次に来る言葉の確からしさを予測して文章を紡ぐ仕組みで、答えをどこかから引いてくるわけではありません。生成AIパスポート「LLM・基盤技術」の練習問題8問に入る前に、仕組みへのよくある誤解をQ&Aで解いておきましょう。

LLMは「物知りな辞書」ではない？仕組みから誤解を解く

用語の丸暗記より、「その言葉は仕組みのどこを指すのか」を押さえるほうが、あなたは選択肢の言い換えに強くなれます。核になる3つの疑問を先に解消します。

Q. LLMは巨大なデータベースから答えを検索している？
A. いいえ。膨大なテキストで事前学習し、入力に続く単語を確率的に予測して出力します。検索ではないため事実の正確さは保証されず、もっともらしい誤り（ハルシネーション）が起こりえます。
Q. Transformerの「Attention（自己注意）」は何をしている？
A. 文中の各単語が、他のどの単語に注目すべきかを重み付けする仕組みです。離れた語どうしの関係も捉えられるようになり、長い文脈の扱いが一気に進みました。
Q. パラメータやデータを増やせば、いくらでも賢くなる？
A. モデルの規模（パラメータ数・データ量・計算量）を増やすほど性能が伸びるという経験則がスケーリング則です。ただし「増やせば無条件に」ではなく、あくまで大きな傾向を表す法則です。

これらの土台を押さえると、Transformer・基盤モデル・トークンといった用語が一本の線でつながります。それでは、8問で理解を確かめていきましょう。

混同しやすい用語3つ
・トークンとパラメータ … トークンは文章を区切った処理単位、パラメータは学習で調整されるモデル内部の重み。別物。
・基盤モデル（foundation model）… 大量データで事前学習し、多くの用途に転用できる大元のモデル。個別用途に調整する前の土台。
・事前学習と追加学習 … 事前学習は汎用の土台づくり、ファインチューニングなどの追加学習は用途に合わせた調整。

Q1. LLM（大規模言語モデル）の説明として、もっとも適切なものはどれですか？

A. 大量のテキストデータから言語のパターンを学習し、文章の生成や要約などを行うモデル

B. 画像を分類することだけを目的に設計された専用モデル

C. あらかじめ用意された定型文だけを返す検索プログラム

回答

解説

正解は「A」です。

LLM（Large Language Model: 大規模言語モデル）は、大量のテキストデータから単語のつながりや文脈のパターンを学習し、文章生成・要約・翻訳・質問応答など幅広い言語タスクをこなすモデルです。膨大な文章を読み込んで言葉の使い方を身につけた、言葉で動くアシスタントのようなものと考えると分かりやすくなります。

B は画像専用モデルの説明、C は定型応答の検索プログラムの説明で、いずれも幅広い言語タスクを学習する LLM とは異なるため誤りです。

LLM とはを見る

Q2. 多くの LLM の基盤になっている Transformer の特徴として、もっとも適切なものはどれですか？

A. 単語を1つずつ順番にしか処理できず、並列計算ができない

B. 画像専用に設計され、文章の処理には使えない

C. 学習をいっさい必要とせず、ルールを人手で書き込んで動かす

D. Attention（注意機構）を使い、文中の離れた単語どうしの関係も捉えながら効率よく処理する

回答

解説

正解は「D」です。

Transformerは、2017年に提案されたニューラルネットワークの構造で、現在の多くの LLM の基盤になっているとされています。Attention（注意機構）によって、文中で離れた位置にある単語どうしの関係も同時に捉えられるのが特徴です。文章全体を見渡しながら大事な語に注目する読み方に近いイメージです。

A は並列処理ができる点と矛盾し、B の画像専用、C のルール手書きという説明も Transformer の特徴とは異なるため誤りです。

Transformer とはを見る

Q3. Attention（注意機構）が果たす役割として、もっとも適切なものはどれですか？

A. 学習に使うデータの量をあらかじめ制限する

B. 入力された文の中で、どの単語に重みを置いて注目するかを決める

C. 完成した文章を画像ファイルに変換して保存する

回答

解説

正解は「B」です。

Attention（注意機構）は、入力された文の中で、出力を決めるときにどの単語をどれだけ重視するかという重みを計算する仕組みです。文脈上の重要な語に注目できるため、離れた位置にある語の関係も捉えられます。長い文章を読むとき、キーワードに目を留めながら意味をつかむ動作に近いといえます。

A はデータ量の制限、C は画像変換の説明で、どちらも注目度を計算する Attention の役割とは異なるため誤りです。

Attention 機構とはを見る

Q4. 基盤モデル（Foundation Model）の説明として、もっとも適切なものはどれですか？

A. 1つの特定の作業だけのために、ゼロから個別に学習させた小規模なモデル

B. 学習済みの重みを持たず、毎回ルールを書き換えて動かすモデル

C. 大量かつ多様なデータで事前学習され、さまざまな下流タスクに応用できる土台となるモデル

D. インターネットに接続しているときだけ動作する検索エンジン

回答

解説

正解は「C」です。

基盤モデル（Foundation Model）は、大量かつ多様なデータで事前学習され、その後さまざまな用途（下流タスク）に応用できる土台となるモデルを指します。1つ作っておけば、追加学習や指示の工夫で翻訳・要約・分類など多くの作業に転用できる点が特徴です。一台で多くの料理に使える基本の調理器具のような位置づけです。

A は単一タスク専用、B は学習済みの重みを持たない、D は検索エンジンという説明で、いずれも幅広く応用できる基盤モデルの定義とは異なるため誤りです。

基盤モデルとはを見る

Q5. スケーリング則（Scaling Laws）が示す傾向として、もっとも適切なものはどれですか？

A. モデルの規模・データ量・計算量を増やすほど、性能が一定の傾向で向上しやすいとされる

B. モデルを大きくするほど、性能はかえって下がっていく

C. モデルの規模と性能の間には、まったく関係がない

回答

解説

正解は「A」です。

スケーリング則は、モデルのパラメータ数・学習データ量・計算量を増やすほど、性能が一定の傾向で向上しやすいという経験的な関係を指します。LLM が大規模化してきた背景には、この傾向が知られていることがあるとされています。練習量を増やすほど上達しやすい、という関係に近いイメージです。

B は性能が下がる、C は無関係という説明で、いずれも規模を増やすほど性能が向上しやすいという傾向とは反対のため誤りです。

スケーリング則とはを見る

Q6. LLM の事前学習（pre-training）の説明として、もっとも適切なものはどれですか？

A. 利用者が入力した質問を、その都度ルールに従って手作業で分類する工程

B. 完成したモデルを利用者に配布したあと、性能を測る評価工程

C. モデルの計算結果を画像として保存する工程

D. 大量のテキストから、次に来る単語を予測するなどの方法で言語の一般的なパターンを学ぶ工程

回答

解説

正解は「D」です。

事前学習は、特定の用途を決める前に、大量のテキストを使って言語の一般的なパターンを学ぶ工程です。代表的には、文章の次に来る単語を予測するといった方法で進められます。ここで言葉の土台を作っておき、その後の用途ごとの調整につなげます。基礎体力をつけてから競技ごとの練習に入る流れに似ています。

A の手作業分類、B の評価工程、C の画像保存は、いずれも大量テキストで言語パターンを学ぶ事前学習の説明とは異なるため誤りです。

LLM とはを見る

Q7. LLM における「トークン」と「パラメータ」の説明として、もっとも適切なものはどれですか？

A. トークンはモデルの内部設定値、パラメータは入力テキストを区切った単位を指す

B. トークンもパラメータも、どちらも利用料金を表す単位である

C. トークンはテキストを処理する際の最小単位、パラメータは学習で調整されるモデル内部の値を指す

回答

解説

正解は「C」です。

トークンは、LLM がテキストを処理するときに区切る最小単位で、単語や単語の一部などにあたります。一方のパラメータは、学習によって調整されるモデル内部の数値で、規模を表す目安にもなります。トークンは文章を区切る「マス目」、パラメータはモデルが覚えた「調整つまみの数」とたとえると整理しやすくなります。

A はトークンとパラメータの説明が入れ替わっており、B は両方を料金単位とする点が誤りです。

LLM とはを見る

Q8. 自己注意（Self-Attention）の説明として、もっとも適切なものはどれですか？

A. 別々の2つの文章を比べて、共通する単語だけを抜き出す仕組み

B. 同じ入力文の中で、各単語が他の単語とどれだけ関係するかを計算する仕組み

C. 利用者が手動で重要語を指定しないと動かない検索機能

回答

解説

正解は「B」です。

自己注意（Self-Attention）は、同じ入力文の中で、各単語が他の単語とどれだけ関係しているかを計算する仕組みです。Transformer の中核で、これにより文脈に応じて語の意味をとらえやすくなります。たとえば「それ」が文中のどの語を指すかを、文全体を見渡して判断する働きにあたります。

A は別々の文の比較、C は手動指定が前提という説明で、いずれも同一文内の関係を自動で計算する自己注意とは異なるため誤りです。

Attention 機構とはを見る

試験全体の流れを俯瞰したい時は、生成AIパスポート試験全体概要に戻れます。

学習の全体像と次に進む分野は、生成AIパスポート学習ロードマップで確認できます。

生成AIパスポート LLM・基盤技術 問題集｜過去問題形式で8問

LLMは「物知りな辞書」ではない？仕組みから誤解を解く

Q1. LLM（大規模言語モデル）の説明として、もっとも適切なものはどれですか？

解説

Q2. 多くの LLM の基盤になっている Transformer の特徴として、もっとも適切なものはどれですか？

解説

Q3. Attention（注意機構）が果たす役割として、もっとも適切なものはどれですか？

解説

Q4. 基盤モデル（Foundation Model）の説明として、もっとも適切なものはどれですか？

解説

Q5. スケーリング則（Scaling Laws）が示す傾向として、もっとも適切なものはどれですか？

解説

Q6. LLM の事前学習（pre-training）の説明として、もっとも適切なものはどれですか？

解説

Q7. LLM における「トークン」と「パラメータ」の説明として、もっとも適切なものはどれですか？

解説

Q8. 自己注意（Self-Attention）の説明として、もっとも適切なものはどれですか？

解説

生成AIパスポート LLM・基盤技術問題集｜過去問題形式で8問