G検定機械学習の概要問題集｜過去問題形式で10問

「正解率95%のモデル」と聞くと優秀に思えますが、実は使いものにならないこともあります。G検定「機械学習の概要」で問われる評価指標は、この数字のからくりを見抜けるかが勝負です。練習問題10問に入る前に、具体的な数値で指標の計算をたどり、なぜ正解率だけでは足りないのかを腹落ちさせておきましょう。

機械学習の性能は数字で測る（正解率・適合率・再現率・F値）

分類モデルの成績は、混同行列という表から計算します。1000人を検査し、実際の陽性は100人・陰性は900人。あるモデルの判定結果が次のようになったとしましょう。

	モデル：陽性と判定	モデル：陰性と判定
実際に陽性（100人）	80人（真陽性 TP）	20人（偽陰性 FN）
実際に陰性（900人）	30人（偽陽性 FP）	870人（真陰性 TN）

この表から4つの指標を計算します。正解率（Accuracy）＝当たった数÷全体＝(80＋870)÷1000＝95%。数字だけ見れば優秀です。ところが再現率（Recall）＝実際の陽性を拾えた割合＝80÷100＝80%。つまり本当に陽性の20人を見逃しています。さらに適合率（Precision）＝陽性と判定した中で本当に陽性だった割合＝80÷110＝約73%。適合率と再現率のバランスを1つにまとめたF値は、両者の調和平均で約76%になります。正解率が高く見えたのは、数の多い陰性（900人）を正しく当てたおかげで、見逃しの深刻さが薄まっていたからです。病気の検査のように「見逃し」が重いなら再現率を、誤検知の負担が重いなら適合率を重視する——この使い分けが問われます。

受託開発で15年以上モデルの評価に立ち会ってきた経験からいうと、実務でも「正解率が高い＝良いモデル」という早合点が最も多い落とし穴です。陽性と陰性の数が偏ったデータでは、正解率は当てになりません。この計算の感覚を持って、10問に取り組んでみてください。

取り違えやすい3点
・学習の3種類 … 教師あり（正解ラベルあり）・教師なし（ラベルなしで構造を見つける／クラスタリング等）・強化学習（報酬で試行錯誤）。
・過学習と汎化 … 訓練データに合わせすぎて新しいデータに弱くなるのが過学習、未知のデータへの対応力が汎化。検証・テストデータで見分ける。
・適合率と再現率 … 適合率は「陽性判定の正しさ」、再現率は「本物の陽性の拾い上げ」。トレードオフの関係にある。

機械学習は「学び方3タイプ」と「評価のものさし」で整理する

機械学習の概要は、細かい手法名を丸暗記しようとすると迷子になります。土台になるのは、学び方の3タイプです。教師あり学習は正解ラベル付きデータで予測を学ぶ（回帰＝数値、分類＝カテゴリ）、教師なし学習はラベルなしで構造を見つける（クラスタリング・次元削減）、強化学習は報酬を手がかりに試行錯誤で行動を学ぶ。まずどのタイプの話かを見分け、その上に個々の手法を載せていくと、知識が枝分かれして整理できます。

もう一つの軸が、モデルの良し悪しを測るものさしです。過学習と汎化、訓練/検証/テストの分割、正解率・適合率・再現率・F値の使い分け。ここは「見落としが致命的な検査では再現率」「空振りを避けたいときは適合率」のように、どんな場面で何を重視するかとセットで覚えると、応用問題に対応できます。現場で機械学習に触れてきた運営者（SE歴15年以上）の目線でも、実務で効くのはこの”場面と指標の対応づけ”です。

見分けの決め手
・教師あり／なしの分かれ目 … 正解ラベルがあるかどうか。ラベルありなら予測、なしならグループ分けや圧縮。
・回帰と分類 … 予測するのが連続した数値なら回帰、決められたカテゴリなら分類。
・適合率と再現率 … 「予測した陽性の的中度」が適合率、「本物の陽性の取りこぼしにくさ」が再現率。

学び方3タイプの見分けと、評価指標の使い分け。この2軸で10問を読み解いてみてください。どちらの軸が甘いかは、解答後に振り返ると見えてきます。甘かった軸の問題は、解説ページのリンクから学習手法や評価指標の記事へ進んで補えます。

Q1. 「教師あり学習」の説明として、もっとも適切なものはどれですか？

A. 正解ラベルのないデータから、データに潜む構造やまとまりを見つけ出す学習

B. 入力と正解ラベルがそろったデータを使い、入力から正解を予測できるように学習する方法

C. 試行錯誤の結果として得られる報酬を手がかりに、よりよい行動を学習する方法

D. 人がルールを直接書き込み、学習をいっさい行わずに動かす方法

回答

解説

正解は「B」です。

教師あり学習は、入力データとその正解（ラベル）がペアでそろったデータを使い、入力から正解を予測できるようにモデルを学習させる方法です。問題と答えがそろった問題集で練習するイメージに近く、画像の分類や売上の予測などに広く使われます。

A は教師なし学習、C は強化学習の説明です。D は学習を行わないため、機械学習である教師あり学習とは異なります。

機械学習とは（詳しい解説）を見る

Q2. 「教師なし学習」が得意とするタスクとして、もっとも適切なものはどれですか？

A. 正解ラベル付きの過去データから、メールが迷惑メールかどうかを判定する

B. ゲームで高い得点が得られる操作を、報酬を頼りに身につける

C. 過去の気温データから、明日の正確な気温（数値）を予測する

D. 大量の顧客データを、似た傾向をもつグループに自動でまとめる

回答

解説

正解は「D」です。

教師なし学習は、正解ラベルのないデータから、データに潜む構造やまとまりを見つけ出す方法です。似た顧客を自動でグループ分けするクラスタリングはその代表例で、ラベルがなくてもデータの傾向だけでまとめられます。

A は正解ラベルを使う分類、C は数値を予測する回帰で、いずれも教師あり学習にあたります。B は強化学習の例で、教師なし学習とは異なります。

機械学習とは（詳しい解説）を見る

Q3. 「強化学習」の仕組みを説明したものとして、もっとも適切なものはどれですか？

A. 行動の結果として得られる報酬を手がかりに、報酬がより多く得られる行動を試行錯誤しながら学習する

B. 入力と正解ラベルのペアを大量に与え、正解との誤差を小さくするように学習する

C. ラベルのないデータを似たもの同士でグループに分ける

D. データの特徴量の数を減らし、扱いやすい形に圧縮する

回答

解説

正解は「A」です。

強化学習は、ある状況で行動を選び、その結果として得られる報酬を手がかりに、より多くの報酬が得られる行動を試行錯誤しながら学んでいく方法です。ゲームの攻略やロボットの制御などに使われます。ほめられた行動を繰り返し、しかられた行動を避けて上達していく学び方に似ています。

B は教師あり学習、C はクラスタリング（教師なし学習）、D は次元削減の説明で、いずれも強化学習とは異なります。

強化学習とは（詳しい解説）を見る

Q4. 教師あり学習における「回帰」と「分類」の違いとして、もっとも適切なものはどれですか？

A. 回帰はラベルなしデータ、分類はラベルありデータを扱う

B. 回帰は画像だけ、分類は文章だけを対象にする

C. 回帰は連続した数値を予測し、分類はあらかじめ決めたカテゴリのどれに当てはまるかを予測する

D. 回帰は学習を行い、分類は学習をいっさい行わない

回答

解説

正解は「C」です。

どちらも教師あり学習ですが、予測する対象が違います。回帰は売上や気温のような連続した数値を予測し、分類は「猫か犬か」「合格か不合格か」のように、あらかじめ決めたカテゴリのどれに当てはまるかを予測します。

A はどちらもラベル付きデータを使うため誤り、B は扱うデータの種類で区別する説明ではないため誤りです。D は分類も学習を行うため誤りです。

機械学習とは（詳しい解説）を見る

Q5. 「過学習（オーバーフィッティング）」の説明として、もっとも適切なものはどれですか？

A. 訓練データにも未知のデータにも、まったく当てはまらない状態

B. 訓練データに当てはまりすぎて、未知のデータに対する予測がかえって悪くなる状態

C. 学習に使うデータ量が多すぎて、計算が終わらなくなる状態

D. 訓練データと未知のデータの両方に、ちょうどよく当てはまる理想的な状態

回答

解説

正解は「B」です。

過学習（オーバーフィッティング）は、モデルが訓練データに当てはまりすぎて細かい特徴まで覚え込んでしまい、まだ見ていない未知のデータに対する予測がかえって悪くなる状態です。過去問の答えを丸暗記したせいで、少し違う本番の問題に対応できないのに似ています。未知のデータにもうまく対応できる力を汎化と呼びます。

A は訓練データにも当てはまらない未学習（アンダーフィッティング）に近い説明、C は計算量の話、D は理想的な状態の説明で、いずれも過学習とは異なります。

過学習とは（詳しい解説）を見る

Q6. データを「訓練データ・検証データ・テストデータ」に分けて使う主な理由として、もっとも適切なものはどれですか？

A. データを3つに分けると、合計のデータ量が自動的に増えるから

B. 学習にかかる計算時間を、きっかり3分の1に短縮できるから

C. データを分けないと、そもそも機械学習を実行できない決まりがあるから

D. 学習に使っていない未知のデータで性能を確かめ、過学習を防いだり本当の実力を測ったりするため

回答

解説

正解は「D」です。

訓練データはモデルの学習に、検証データは学習の途中で設定を調整したり過学習をチェックしたりするために、テストデータは最後に本当の実力を測るために使います。学習に使っていない未知のデータで確かめることで、丸暗記ではない実力を評価できます。

A はデータを分けても総量は増えないため誤り、B は計算時間がそのように短縮されるわけではないため誤りです。C のような決まりはなく、データを分けるのは性能を正しく測るための工夫です。

モデル評価とは（詳しい解説）を見る

Q7. 分類モデルの評価指標「適合率（精度・Precision）」の説明として、もっとも適切なものはどれですか？

A. モデルが「陽性」と予測したもののうち、実際に陽性だった割合

B. 実際に陽性であるもののうち、モデルが正しく陽性と予測できた割合

C. 全データのうち、陽性・陰性を問わず予測が当たった割合

D. 適合率と再現率の調和平均をとった指標

回答

解説

正解は「A」です。

適合率（Precision）は、モデルが「陽性」と予測したもののうち、実際に陽性だった割合を表します。「陽性と判断した予測が、どれだけ信頼できるか」を測る指標で、誤って陽性と判定する空振りを減らしたいときに重視されます。

B は再現率（Recall）、C は正解率（Accuracy）、D はF値（F1スコア）の説明で、いずれも適合率とは別の指標です。

統計の基礎とはを見る

Q8. 「再現率（Recall）」を特に重視すべき場面として、もっとも適切なものはどれですか？

A. 広告メールを送る相手を選ぶとき、無関係な人への誤送信をできるだけ減らしたい場面

B. 計算量を減らすために、できるだけ少ないデータで学習を終わらせたい場面

C. 病気の見落としを避けたい検査のように、本当に陽性の人を取りこぼしたくない場面

D. モデルの保存ファイルの容量を、できるだけ小さくしたい場面

回答

解説

正解は「C」です。

再現率（Recall）は、実際に陽性であるもののうち、モデルが正しく陽性と予測できた割合です。病気の検査のように「本当は陽性なのに見逃す」ことの害が大きい場面では、取りこぼしを減らす再現率が重視されます。

A は誤検出を減らしたい場面で適合率が重視されるため誤りです。B の計算量や D のファイル容量は、評価指標とは関係のない話です。

統計の基礎とはを見る

Q9. 評価指標「F値（F1スコア）」が用いられる主な理由として、もっとも適切なものはどれですか？

A. 学習にかかる時間を直接短くできるから

B. 適合率と再現率はトレードオフの関係になりやすく、両者をバランスよく一つの数値でまとめて評価できるから

C. 正解ラベルがまったくないデータでも評価できる唯一の指標だから

D. 数値がいつも100になり、モデル同士を比べる必要がなくなるから

回答

解説

正解は「B」です。

F値（F1スコア）は、適合率と再現率の調和平均をとった指標です。適合率を上げようとすると再現率が下がりやすいといったトレードオフの関係があるため、両者をバランスよく一つの数値でまとめて評価したいときに使われます。

A の学習時間とは無関係で、C のように正解ラベルなしで使える指標でもありません。D のように数値が100に固定されることもないため、いずれも誤りです。

統計の基礎とはを見る

Q10. 機械学習における「次元削減」を行う主な目的として、もっとも適切なものはどれですか？

A. データの特徴量（変数）の数を減らし、重要な情報を保ちつつ扱いやすく可視化しやすくする

B. データの件数（行数）そのものを意図的に水増しして増やす

C. 正解ラベルを自動で付け直し、データをまとめて陽性に変える

D. モデルの予測結果を、人が手作業で一つずつ修正する

回答

解説

正解は「A」です。

次元削減は、データが持つ特徴量（変数）の数を減らし、重要な情報をできるだけ保ったまま、扱いやすく可視化しやすい形にまとめる手法です。主成分分析（PCA）が代表例で、たくさんの観点を少数のまとまりに整理するイメージです。計算が軽くなったり、データの傾向が見やすくなったりします。

B はデータの水増し、C はラベルの操作、D は手作業の修正で、いずれも特徴量の数を減らす次元削減とは異なります。

機械学習とは（詳しい解説）を見る

試験全体の流れを俯瞰したい時は、G検定試験全体概要に戻れます。

学習の全体像と次に進む分野は、G検定学習ロードマップで確認できます。

G検定 機械学習の概要 問題集｜過去問題形式で10問

機械学習の性能は数字で測る（正解率・適合率・再現率・F値）

機械学習は「学び方3タイプ」と「評価のものさし」で整理する

Q1. 「教師あり学習」の説明として、もっとも適切なものはどれですか？

解説

Q2. 「教師なし学習」が得意とするタスクとして、もっとも適切なものはどれですか？

解説

Q3. 「強化学習」の仕組みを説明したものとして、もっとも適切なものはどれですか？

解説

Q4. 教師あり学習における「回帰」と「分類」の違いとして、もっとも適切なものはどれですか？

解説

Q5. 「過学習（オーバーフィッティング）」の説明として、もっとも適切なものはどれですか？

解説

Q6. データを「訓練データ・検証データ・テストデータ」に分けて使う主な理由として、もっとも適切なものはどれですか？

解説

Q7. 分類モデルの評価指標「適合率（精度・Precision）」の説明として、もっとも適切なものはどれですか？

解説

Q8. 「再現率（Recall）」を特に重視すべき場面として、もっとも適切なものはどれですか？

解説

Q9. 評価指標「F値（F1スコア）」が用いられる主な理由として、もっとも適切なものはどれですか？

解説

Q10. 機械学習における「次元削減」を行う主な目的として、もっとも適切なものはどれですか？

解説

G検定機械学習の概要問題集｜過去問題形式で10問