G検定 問題集|過去問題

G検定 数理・統計 問題集|過去問題形式で8問

G検定「確率(条件付き確率・ベイズの定理)・統計量(平均・分散・標準偏差・正規分布)・線形代数(ベクトル・行列)・微分と勾配・相関と因果・仮説検定・情報理論(エントロピー)」の練習問題8問です。解けなかった問題は、各問の解説末尾のリンクから対応する解説記事に進んでください。

 

Q1. データの「分散」と「標準偏差」が表すものとして、もっとも適切なものはどれですか?

回答

解説

正解は「D」です。

分散は、各データが平均値からどれくらい離れているかを2乗して平均した値で、データの散らばり具合を表します。標準偏差は分散の平方根で、もとのデータと同じ単位で散らばりを示せるのが利点です。値が大きいほどデータが広く散らばっていることを意味します。

A はデータ数、B は最頻値、C は中央値の説明で、いずれも散らばりを表す分散・標準偏差とは異なります。

統計の基礎(詳しい解説)を見る

 

Q2. 「正規分布」の特徴の説明として、もっとも適切なものはどれですか?

回答

解説

正解は「B」です。

正規分布は、平均値を中心に左右対称な釣り鐘(ベル)型をしている分布です。平均付近にデータが多く集まり、平均から離れるほどデータが少なくなります。身長やテストの点数など、自然界や社会の多くのデータが近い形になるとされ、統計の基礎として重要です。

A はどの値も等確率な一様分布、D は2値のみを取る分布の説明です。C のように確率が増え続ける形にはなりません。

統計の基礎(詳しい解説)を見る

 

Q3. 「条件付き確率」が表すものとして、もっとも適切なものはどれですか?

回答

解説

正解は「A」です。

条件付き確率とは、「ある出来事 A が起きた」という条件のもとで、「別の出来事 B が起きる」確率のことです。たとえば「雨が降っているとき、傘を持っている人の割合」のように、前提となる状況を絞ったうえでの確率を考えるときに使います。

B は条件を考えていない点、C は条件によらないという逆の意味になっている点、D は確率ではなく代表値の話である点で、いずれも誤りです。

統計の基礎(詳しい解説)を見る

 

Q4. 「ベイズの定理」が役立つ場面の説明として、もっとも適切なものはどれですか?

回答

解説

正解は「C」です。

ベイズの定理は、新しい観測データ(証拠)が得られたときに、もともと考えていた確率(事前確率)を更新し、より確からしい確率(事後確率)を求めるための考え方です。迷惑メールの判定や病気の検査など、情報を得るたびに判断を見直す場面で広く使われます。

A は線形代数、B は微分、D は散らばりの比較の話で、いずれもベイズの定理が扱う「確率の更新」とは異なります。

統計の基礎(詳しい解説)を見る

 

Q5. 機械学習の最適化で使われる「微分(勾配)」の役割として、もっとも適切なものはどれですか?

回答

解説

正解は「B」です。

微分はある点での関数の傾き(変化の向きと大きさ)を求める計算で、その傾きをまとめたものを勾配と呼びます。機械学習では、誤差を表す関数の勾配を手がかりに、誤差が小さくなる方向へパラメータを少しずつ調整します。坂道の傾きを見て、低い方へ一歩ずつ下りていくイメージです(勾配降下法)。

A の並べ替え、C の合計、D の文章の区切りは、いずれも微分・勾配の役割とは異なります。

勾配降下法とは(詳しい解説)を見る

 

Q6. 「相関関係」と「因果関係」の違いについての説明として、もっとも適切なものはどれですか?

回答

解説

正解は「A」です。

相関関係は、2つの値が一緒に増えたり減ったりする傾向があることを表すだけで、片方がもう片方の原因だとは限りません。一方、因果関係は「一方が原因で他方が結果」という関係です。たとえば、別の要因(隠れた共通原因)によって両方が動いているだけのこともあるため、データ分析では両者を混同しないことが重要です。

B は相関をそのまま因果と結びつけている点、C は因果と相関の説明が入れ替わっている点、D は両者を同一視している点で、いずれも誤りです。

統計の基礎(詳しい解説)を見る

 

Q7. 統計的な「仮説検定」の基本的な進め方の説明として、もっとも適切なものはどれですか?

回答

解説

正解は「C」です。

仮説検定は、まず「差がない」「効果がない」といった仮説(帰無仮説)を立て、実際に得られたデータがその仮説のもとでどれくらい起こりにくいかを確率で評価する手続きです。起こりにくいと判断されれば、もとの仮説を退けて「差がありそうだ」と考えます。

A はデータを使わない点、B は手続きを過度に限定している点、D は完全な証明だと言い切る点で誤りです。仮説検定はあくまで確率にもとづく判断で、ものごとを完全に証明するものではありません。

統計の基礎(詳しい解説)を見る

 

Q8. 情報理論における「エントロピー」が表すものとして、もっとも適切なものはどれですか?

回答

解説

正解は「D」です。

情報理論におけるエントロピーは、ある事象がどれくらい予測しにくいか、すなわち不確実さ(情報の乱雑さ)の大きさを表す量です。どの結果も同じくらい起こりそうで予測しにくいほどエントロピーは大きく、結果がほぼ決まっていれば小さくなります。機械学習では、分類の損失関数(交差エントロピー)などで使われます。

A の物理的な大きさ、B の発熱量、C の通信速度は、いずれも情報量としてのエントロピーの意味とは異なります。

統計の基礎(詳しい解説)を見る

 

試験全体の流れを俯瞰したい時は、G検定 試験全体概要 に戻れます。