DP-900 総合模試｜過去問題形式で40問

Microsoft Azure Data Fundamentals（DP-900）の4つのドメインを横断した総合模擬試験40問です。データの主要概念・リレーショナルデータ・非リレーショナルデータ・分析ワークロードを本番形式でまとめて確認できます。解けなかった問題は、各問の解説末尾のリンクから対応する解説記事に進んでください。

Q1. 決まったスキーマ（項目）に従い、どのデータも同じフィールドを持つデータの分類はどれですか？

A. 半構造化データ

B. 非構造化データ

C. 構造化データ

D. ストリームデータ

回答

解説

正解は「C」です。

構造化データは、決まったスキーマに従い、どのデータも同じフィールド（項目）を持つデータです。多くの場合は行と列からなる表（テーブル）で表され、複数のテーブルがキーで参照し合うリレーショナルモデルで保存されます。

A の半構造化データは項目に多少のばらつきを許す形式、B の非構造化データは決まった構造を持たないデータ、D のストリームデータは到着し続けるデータの流れを指す言葉で、いずれも固定スキーマに従う分類ではありません。

構造化・半構造化・非構造化データとは（詳しい解説）を見る

Q2. 顧客ごとにメールアドレスが複数あったりなかったりするなど、項目にばらつきがあっても柔軟に表せるデータの分類はどれですか？

A. 半構造化データ

B. 構造化データ

C. 非構造化データ

D. リレーショナルデータ

回答

解説

正解は「A」です。

半構造化データは、ある程度の構造を持ちながら、データ1件ごとに項目のばらつきを許す形式です。Microsoft の教材では代表例として JSON が挙げられ、顧客ごとに連絡先の数が違っても無理なく表せます。

B の構造化データはどのデータも同じ項目を持つ固定スキーマ、C の非構造化データは決まった構造を持たないデータ、D のリレーショナルデータは構造化データを表で扱う考え方で、いずれも項目のばらつきを前提とした分類ではありません。

構造化・半構造化・非構造化データとは（詳しい解説）を見る

Q3. 次のうち、非構造化データの例としてもっとも適切なものはどれですか？

A. どの行も同じ列を持つリレーショナルテーブル

B. 項目つきの JSON ドキュメント

C. 主キーと外部キーで関連づけた表のデータ

D. 音声ファイルや動画ファイル

回答

解説

正解は「D」です。

非構造化データは、文書・画像・音声・動画・バイナリファイルのように、特定の構造を持たないデータです。表の形にも、項目つきのドキュメントの形にも当てはまりにくいのが特徴です。

A は構造化データ、B は半構造化データ、C も構造化データ（リレーショナル）の例で、いずれも構造を持たないデータの例ではありません。

構造化・半構造化・非構造化データとは（詳しい解説）を見る

Q4. Microsoft の教材で、データを保存する場所として大きく2つに分けられているものはどれですか？

A. ホットストレージとコールドストレージ

B. ファイルストアとデータベース

C. リージョンと可用性ゾーン

D. OLTP と OLAP

回答

解説

正解は「B」です。

Microsoft の教材では、データを保存する場所を大きく ファイルストアとデータベースの2種類に分けて説明しています。ファイルストアはファイルをそのまま保管する場所、データベースは検索や更新がしやすいよう整理して保存する仕組みです。

A はストレージのアクセス階層の話、C はリソースの物理的な配置の話、D はデータの処理方式の分類で、いずれもデータストアを2つに大別したものではありません。

データベースとは（詳しい解説）を見る

Q5. 1件1件は小さく、件数の多い取引（送金や決済など）を素早く記録する処理は、一般に何と呼ばれますか？

A. トランザクション処理（OLTP）

B. 分析処理（OLAP）

C. バッチ処理

D. データ可視化

回答

解説

正解は「A」です。

トランザクション処理（OLTP）は、送金や決済のような取引（トランザクション）を記録する処理です。件数が多く、データには素早くアクセスできる必要があり、読み取りと書き込みの両方に最適化されます。データの作成・取得・更新・削除（CRUD）を扱います。

B の OLAP は大量の履歴データを集計する分析処理、C のバッチ処理はデータをまとめて処理する方式、D の可視化は分析結果を見せる工程で、いずれも小さな取引を素早く記録する処理ではありません。

OLTP と OLAP の違いとは（詳しい解説）を見る

Q6. OLTP の ACID 特性のうち、「確定した取引は、システムを再起動しても消えずに残る」ことを意味するものはどれですか？

A. 原子性（Atomicity）

B. 一貫性（Consistency）

C. 永続性（Durability）

D. 分離性（Isolation）

回答

解説

正解は「C」です。

永続性（Durability）は、いったん確定（コミット）した取引はそのまま残り続けるという特性です。口座振替が完了したあとは、たとえデータベースの電源が切れても、再び動かしたときに振替後の残高が反映されます。

A の原子性は全部成功か全部失敗か、B の一貫性は正しい状態から正しい状態へ移すこと、D の分離性は同時に走る取引が互いに干渉しないことを指し、いずれも「確定後も消えない」を意味する特性ではありません。

OLTP と OLAP の違いとは（詳しい解説）を見る

Q7. 読み取りが中心で、大量の履歴データや業務指標を集計してレポートやダッシュボードに使う処理は、一般に何と呼ばれますか？

A. CRUD 操作

B. 分析処理（OLAP）

C. トランザクション処理（OLTP）

D. 正規化

回答

解説

正解は「B」です。

分析処理（OLAP）は、読み取り中心（または読み取りが大半）のシステムで、大量の履歴データや業務指標を集計して分析する処理です。あらかじめ集計したデータを使うことで、レポート・可視化・ダッシュボード向けの問い合わせを素早く返せます。

A の CRUD はデータの作成・取得・更新・削除という操作の総称、C の OLTP は小さな取引を記録する処理、D の正規化はリレーショナルデータの重複をなくす設計手法で、いずれも分析向けの処理そのものではありません。

OLTP と OLAP の違いとは（詳しい解説）を見る

Q8. データの取り込みパイプラインの構築や、クレンジング・変換、システム間のデータ連携を主に担う職種はどれですか？

A. データアナリスト

B. データベース管理者（DBA）

C. 業務利用者（ビジネスユーザー）

D. データエンジニア

回答

解説

正解は「D」です。

データエンジニアは、組織全体のデータ統合の基盤とプロセスを管理する役割です。データの取り込みパイプライン、クレンジングや変換の処理、システム間のデータ移動などを設計・実装し、リレーショナル／非リレーショナルデータベースやファイルストアなど幅広い技術を扱います。

A のデータアナリストは分析と可視化、B の DBA はデータベースの運用と安全、C の業務利用者は集計済みのレポートを見る側で、いずれもデータ連携の基盤づくりを主に担う職種ではありません。

データに関わる職種（データベース管理者・データエンジニア・データアナリスト）とは（詳しい解説）を見る

Q9. データベースの設計・保守を行い、バックアップや復元、アクセス権の付与など、運用と安全を主に担う職種はどれですか？

A. データエンジニア

B. データベース管理者（DBA）

C. データアナリスト

D. ネットワーク管理者

回答

解説

正解は「B」です。

データベース管理者（DBA）は、データベースの設計・実装・保守・運用を担い、可用性や性能を保つ役割です。バックアップと復旧の計画、ユーザーへのアクセス権の付与や拒否といった、データのセキュリティ管理も担当します。

A のデータエンジニアはデータ連携の基盤づくり、C のデータアナリストは分析と可視化が中心です。D のネットワーク管理者はこの分野で挙げられる主要なデータ職種ではありません。

データに関わる職種（データベース管理者・データエンジニア・データアナリスト）とは（詳しい解説）を見る

Q10. データベースに対する「作成・取得・更新・削除」という基本操作の総称はどれですか？

A. CRUD

B. ETL

C. ACID

D. SLA

回答

解説

正解は「A」です。

CRUDは、データの作成（Create）・取得（Retrieve）・更新（Update）・削除（Delete）という基本操作の頭文字をとった総称です。OLTP システムはこれらの操作を、データの整合性を保ちながら処理します。

B の ETL はデータを抽出・変換・読み込みする工程、C の ACID は取引の整合性を保つ4つの性質、D の SLA はサービス品質の取り決めで、いずれも基本操作の総称ではありません。

データベースとは（詳しい解説）を見る

Q11. データの保存先として、ファイルストアではなくリレーショナルデータベースが向いている場面として、もっとも適切なものはどれですか？

A. 撮影した写真や動画を、加工せずそのまま大量に置いておきたい場面

B. 1つのファイルを、いっさい検索せずに保管だけしておきたい場面

C. 音声ファイルを再生用にそのまま配信したい場面

D. キーで関連づけた構造化データを整理し、SQL で問い合わせたい場面

回答

解説

正解は「D」です。

リレーショナルデータベースは、構造化データをテーブルに保存し、主キーで各データを一意に識別して、ほかのテーブルから参照できます。重複を取り除く正規化ができ、データは SQL で管理・問い合わせできます。キーでつながった構造化データを扱う場面に向いています。

A と C は構造を持たないファイル、B は検索の必要がない単純な保管で、いずれもファイルストアが向く場面です。

データベースとは（詳しい解説）を見る

Q12. リレーショナルデータベースのテーブルで、1件分のデータ（たとえば1人の顧客）を表すものはどれですか？

A. 列（カラム）

B. データ型

C. 行（ロウ）

D. インデックス

回答

解説

正解は「C」です。

リレーショナルデータベースでは、実世界の対象（エンティティ）をテーブルとして表します。テーブルは行（ロウ）を含み、1つの行が1件分のデータ（たとえば1人の顧客、1件の注文）を表します。

A の列は属性（名前・価格など）を表す縦の項目、B のデータ型は各列に入る値の種類、D のインデックスは検索を速くする仕組みで、いずれも1件分のデータを表す単位ではありません。

データベースとは（詳しい解説）を見る

Q13. リレーショナルデータベースの設計で行う「正規化」の主な目的として、もっとも適切なものはどれですか？

A. データの重複を減らし、データの整合性を保つこと

B. 同じ情報をあえて複数の場所にコピーして増やすこと

C. 画像や動画をそのまま保存できるようにすること

D. データベースへのログインを不要にすること

回答

解説

正解は「A」です。

正規化は、データの重複を最小限にし、整合性を保つためのスキーマ設計の手法です。エンティティごとにテーブルを分け、属性ごとに列を分け、主キーで各行を識別し、外部キーで関連づけます。たとえば顧客の住所変更が、1か所の修正で済むようになります。

B は重複を増やすという正規化と逆の説明、C は非構造化データの保存、D はログインの話で、いずれも正規化の目的ではありません。

SQL と正規化とは（詳しい解説）を見る

Q14. あるテーブルが別のテーブルの行を参照するために、参照先の主キーを保存する列を指す言葉はどれですか？

A. 主キー

B. インデックス

C. ビュー

D. 外部キー

回答

解説

正解は「D」です。

外部キーは、あるエンティティが別のエンティティを参照するときに、参照先の主キーを保存する列です。たとえば注文テーブルに顧客の主キーを外部キーとして持たせると、注文から顧客の情報をたどれます。データベースは外部キーで参照整合性を保ち、存在しない顧客への注文を防げます。

A の主キーは各行を一意に識別する列、B のインデックスは検索を速くする仕組み、C のビューは問い合わせ結果を表のように見せる仮想テーブルで、いずれも参照先を指す列ではありません。

SQL と正規化とは（詳しい解説）を見る

Q15. テーブルからデータを取得（問い合わせ）するときに使う SQL ステートメントはどれですか？

A. INSERT

B. SELECT

C. DELETE

D. UPDATE

回答

解説

正解は「B」です。

SELECTは、テーブルからデータを取得（問い合わせ）するための SQL ステートメントです。条件で絞り込んだり、必要な列だけを選んだりして、目的のデータを読み出せます。

A の INSERT はデータの追加、C の DELETE はデータの削除、D の UPDATE はデータの更新に使うステートメントで、いずれもデータの取得そのものを行うものではありません。

SQL と正規化とは（詳しい解説）を見る

Q16. OS やサーバーの管理をできるだけ Azure に任せ、フルマネージドな PaaS としてリレーショナルデータベースを使いたい場合に適した Azure SQL ファミリーの製品はどれですか？

A. SQL Server on Azure Virtual Machines

B. Azure Blob Storage

C. Azure SQL Database

D. Azure Cosmos DB

回答

解説

正解は「C」です。

Azure SQL Databaseは、Azure 上でフルマネージドに提供されるリレーショナルデータベース（DBaaS）で、業界区分としては PaaS にあたります。OS やデータベースエンジンの管理・パッチ適用・バックアップを Azure が引き受けるため、新しいクラウドアプリの開発に向いています。

A の SQL Server on Azure Virtual Machines は OS まで管理できる IaaS、B はオブジェクトストレージ、D は非リレーショナル（NoSQL）データベースで、いずれもフルマネージドな PaaS のリレーショナルデータベースの説明とは異なります。

Azure SQL Database とは（詳しい解説）を見る

Q17. OS レベルまで自分で制御でき、オンプレミスの SQL Server をほぼそのまま移行したい場合に適した IaaS 型の選択肢はどれですか？

A. Azure SQL Database（単一データベース）

B. Azure Table Storage

C. Azure Files

D. SQL Server on Azure Virtual Machines

回答

解説

正解は「D」です。

SQL Server on Azure Virtual Machinesは、Azure の仮想マシン上で SQL Server を動かす IaaS 型の選択肢です。OS と SQL Server の両方を自分で制御でき、オンプレミスの SQL Server とほぼ同じ環境を保てるため、既存システムをそのまま移行したい場面に向きます。自由度が高い反面、管理の責任も利用者側に多く残ります。

A の Azure SQL Database はフルマネージドな PaaS、B はキー値型の NoSQL ストレージ、C はファイル共有サービスで、いずれも OS まで制御できる IaaS のリレーショナルデータベースではありません。

Azure SQL Database とは（詳しい解説）を見る

Q18. PaaS の利点を保ちながら、SQL Server とのほぼ完全な機能互換が必要で、既存システムを少ない変更で移行したい場合に適した Azure SQL ファミリーの製品はどれですか？

A. Azure SQL Managed Instance

B. Azure Cosmos DB

C. Azure Blob Storage

D. Azure Queue Storage

回答

解説

正解は「A」です。

Azure SQL Managed Instanceは、業界区分としては PaaS にあたり、SQL Server とほぼ完全な機能互換を備えた、フルマネージドのインスタンスです。Azure SQL Database の PaaS の利点に加え、インスタンス単位の機能や仮想ネットワーク対応などを持ち、オンプレミスの SQL Server を少ない変更で移行したい場面に向きます。

B は非リレーショナル（NoSQL）データベース、C はオブジェクトストレージ、D はメッセージング用のキューで、いずれも SQL Server と高い互換性を持つマネージドインスタンスではありません。

Azure SQL Database とは（詳しい解説）を見る

Q19. Azure 上でオープンソースのリレーショナルデータベースをマネージドで使いたい場合に該当するサービスとして、もっとも適切なものはどれですか？

A. Azure Cosmos DB for NoSQL

B. Azure Blob Storage

C. Azure Database for PostgreSQL

D. Azure Service Health

回答

解説

正解は「C」です。

Azure Database for PostgreSQLは、オープンソースの PostgreSQL を Azure 上でマネージドに提供するサービスです。Azure には同じく MySQL を提供する Azure Database for MySQL もあり、既存のオープンソース資産を活かしつつ運用負担を減らせます。

A は非リレーショナルの NoSQL データベース、B はオブジェクトストレージ、D はサービスの稼働状況を確認する機能で、いずれもオープンソースのリレーショナルデータベースのマネージドサービスではありません。

Azure SQL Database とは（詳しい解説）を見る

Q20. 1つ以上のテーブルへの問い合わせ結果を、あたかも1つの表のように見せる仮想的なデータベースオブジェクトはどれですか？

A. 主キー

B. ビュー

C. インデックス

D. ストアドプロシージャ

回答

解説

正解は「B」です。

ビューは、1つ以上のテーブルへの問い合わせ（SELECT）の結果を、あたかも1つの表のように見せる仮想的なデータベースオブジェクトです。よく使う問い合わせに名前を付けて再利用したり、必要な列だけを見せたりするのに役立ちます。

A の主キーは各行を一意に識別する列、C のインデックスは検索を速くする仕組み、D のストアドプロシージャはまとめて実行できる処理のかたまりで、いずれも問い合わせ結果を表のように見せる仮想オブジェクトではありません。

SQL と正規化とは（詳しい解説）を見る

Q21. 画像・動画・バックアップなどの非構造化データを、大規模なオブジェクトとして保存するのに適した Azure ストレージサービスはどれですか？

A. Azure Blob Storage

B. Azure SQL Database

C. Azure Queue Storage

D. Azure Table Storage

回答

解説

正解は「A」です。

Azure Blob Storageは、テキストやバイナリなどの非構造化データを大規模に保存・アクセスできる、Azure のオブジェクトストレージです。画像や動画の配信、バックアップや復元、分析用データの保管などに向いています。

B はリレーショナルデータベース、C はメッセージング用のキュー、D はキー値型の NoSQL ストレージで、いずれも大容量の非構造化オブジェクトの保存を主目的としたサービスではありません。

Azure Blob Storage とは（詳しい解説）を見る

Q22. めったにアクセスしないデータをもっとも安く保存でき、読み出すには階層を変える操作（リハイドレート）が必要なオフラインの Blob アクセス階層はどれですか？

A. ホット（Hot）

B. アーカイブ（Archive）

C. クール（Cool）

D. コールド（Cold）

回答

解説

正解は「B」です。

アーカイブ（Archive）階層は、めったにアクセスしないデータを保存するオフラインの階層で、保存コストがもっとも低い一方、取り出しには時間とコストがかかります。読み出すには、いったんオンライン階層へ戻すリハイドレートが必要です。長期バックアップやコンプライアンス用データの保管などに向きます。

A のホットは頻繁にアクセスするデータ向け、C のクールと D のコールドはアクセス頻度が低いデータ向けですが、いずれもすぐ読み出せるオンライン階層で、オフラインのアーカイブとは異なります。

Azure Blob Storage とは（詳しい解説）を見る

Q23. SMB や NFS プロトコルで、複数のマシンから共有してマウントできる、フルマネージドなファイル共有サービスはどれですか？

A. Azure Blob Storage

B. Azure Cosmos DB

C. Azure Queue Storage

D. Azure Files

回答

解説

正解は「D」です。

Azure Filesは、業界標準の SMB プロトコルや NFS プロトコルでアクセスできる、フルマネージドなクラウドファイル共有サービスです。複数の仮想マシンから同じファイルを共有でき、オンプレミスのファイルサーバーの置き換えや、ファイル共有を使うアプリのクラウド移行に向きます。

A は非構造化データ向けのオブジェクトストレージ、B は NoSQL データベース、C はメッセージング用のキューで、いずれも共有ファイルサーバー用途のサービスではありません。

Azure ストレージサービスとは（詳しい解説）を見る

Q24. スキーマレスで、キーと属性の組み合わせとして構造化データを保存できる、Azure の NoSQL ストレージサービスはどれですか？

A. Azure Files

B. Azure Blob Storage

C. Azure Table Storage

D. Azure Queue Storage

回答

解説

正解は「C」です。

Azure Table Storageは、構造化データをスキーマレス（決まった列を固定しない設計）で保存できる、キー値型の NoSQL ストアです。Web アプリのユーザーデータ、住所録、デバイス情報などの柔軟なデータセットの保存に向きます。

A はファイル共有、B は非構造化データ向けのオブジェクトストレージ、D はメッセージング用のキューで、いずれもキー値型の NoSQL ストアではありません。

Azure ストレージサービスとは（詳しい解説）を見る

Q25. グローバルに分散でき、1桁ミリ秒台の応答を狙える、フルマネージドな NoSQL データベースサービスはどれですか？

A. Azure SQL Database

B. Azure Cosmos DB

C. Azure Files

D. SQL Server on Azure Virtual Machines

回答

解説

正解は「B」です。

Azure Cosmos DBは、フルマネージドな NoSQL データベースサービスです。世界各地のリージョンへのデータ分散（ターンキーのグローバル分散）と、1桁ミリ秒台の応答時間を狙え、ドキュメント・キー値・グラフ・テーブルなど複数のデータモデルを扱えます。世界規模で低遅延が求められるアプリに向きます。

A はリレーショナルの PaaS、C はファイル共有、D は IaaS のリレーショナルデータベースで、いずれもグローバル分散の NoSQL データベースの説明とは異なります。

Azure Cosmos DB とは（詳しい解説）を見る

Q26. Azure Cosmos DB で新規アプリを作るときに、ドキュメントデータを扱う既定（ネイティブ）の API として推奨されているものはどれですか？

A. API for Apache Gremlin（グラフ）

B. API for Apache Cassandra

C. API for NoSQL

D. API for Table

回答

解説

正解は「C」です。

API for NoSQLは、Azure Cosmos DB のネイティブな API で、ドキュメントデータを扱います。SQL に似た問い合わせと自動インデックス付けに対応し、新規アプリで最も速く機能を使えるため、Microsoft は新しいアプリで多くの場合これを推奨しています。

A の Gremlin はグラフ、B の Cassandra は列ファミリー、D の Table はキー値型のデータモデル向けの API で、いずれも他のデータベースとの互換性を主目的にしたもので、ネイティブな既定 API ではありません。

Azure Cosmos DB とは（詳しい解説）を見る

Q27. ノード（頂点）とエッジ（つながり）で表す、関係性が重要なグラフデータを扱いたい場合に適した Azure Cosmos DB の API はどれですか？

A. API for Apache Gremlin

B. API for Table

C. API for NoSQL

D. API for MongoDB

回答

解説

正解は「A」です。

API for Apache Gremlinは、ノード（頂点）とエッジ（つながり）で表すグラフデータを扱うための、Azure Cosmos DB の API です。Gremlin というグラフ探索の言語を使い、人と人のつながりや推薦のような、関係性をたどる問い合わせに向きます。

B の Table はキー値、C の NoSQL はドキュメント、D の MongoDB はドキュメント（MongoDB 互換）のデータモデル向けで、いずれもグラフを主目的とした API ではありません。

Azure Cosmos DB とは（詳しい解説）を見る

Q28. 元データを「抽出し、変換してから、読み込む」という分析向けの処理工程を指す言葉はどれですか？

A. CRUD

B. ACID

C. SLA

D. ETL（抽出・変換・読み込み）

回答

解説

正解は「D」です。

ETLは、元データを抽出（Extract）し、変換（Transform）してから、保存先に読み込む（Load）という工程です。分析の前段で、業務システムのデータを集めて整える役割を担います。先に読み込んでから変換する ELT という順序も、近年のレイクハウスでよく使われます。

A の CRUD は基本操作の総称、B の ACID は取引の整合性を保つ性質、C の SLA はサービス品質の取り決めで、いずれもデータを抽出・変換・読み込みする工程ではありません。

データウェアハウスとデータレイクとは（詳しい解説）を見る

Q29. 大量のファイルベースのデータを、形式を問わずそのまま集めて保管・分析できる、分析向けのデータの保存先はどれですか？

A. リレーショナルの OLTP データベース

B. メッセージキュー

C. データレイク

D. リソースグループ

回答

解説

正解は「C」です。

データレイクは、大量のファイルベースのデータを集めて分析する大規模分析のシナリオでよく使われる保存先です。構造化・半構造化・非構造化のデータを形式を問わずそのまま蓄積でき、後からさまざまな分析に使えます。

A の OLTP データベースは日々の取引を記録する仕組み、B のメッセージキューはコンポーネント間の連携用、D のリソースグループは Azure のリソースをまとめる管理単位で、いずれも分析向けの大規模なデータの保存先ではありません。

データウェアハウスとデータレイクとは（詳しい解説）を見る

Q30. レポートやデータ可視化のための問い合わせに最適化された、リレーショナルなスキーマで読み取り向けにデータを保存する分析用の仕組みはどれですか？

A. データウェアハウス

B. メッセージキュー

C. オブジェクトストレージ

D. 仮想ネットワーク

回答

解説

正解は「A」です。

データウェアハウスは、リレーショナルなスキーマでデータを保存し、読み取り（主にレポートや可視化を支える問い合わせ）に最適化された、確立された分析用の仕組みです。整理済みのデータに対して、集計や分析を素早く行えます。

B のメッセージキューは連携用、C のオブジェクトストレージは非構造化データの保管先、D の仮想ネットワークはネットワークの土台で、いずれも読み取り向けに最適化された分析用のリレーショナルな保存先ではありません。

データウェアハウスとデータレイクとは（詳しい解説）を見る

Q31. 複数のデータをいったんためておき、スケジュールなどのタイミングでまとめて処理する方式はどれですか？

A. ストリーム処理

B. バッチ処理

C. トランザクション処理（OLTP）

D. 正規化

回答

解説

正解は「B」です。

バッチ処理は、新しく届くデータをいったんためておき、グループ全体をまとめて1つの処理として扱う方式です。実行のタイミングは、毎時などのスケジュール、一定量たまったとき、あるいは何らかのイベントで決められます。クレジットカードの利用を月1回の請求にまとめるのが身近な例です。

A のストリーム処理はデータが届くたびにすぐ処理する方式、C の OLTP は取引を記録する処理、D の正規化はリレーショナル設計の手法で、いずれもデータをためてまとめて処理する方式ではありません。

バッチ処理とストリーム処理とは（詳しい解説）を見る

Q32. データが届くたびに1件ずつ、リアルタイムに近い低遅延で処理していく方式はどれですか？

A. バッチ処理

B. 正規化

C. データ可視化

D. ストリーム処理

回答

解説

正解は「D」です。

ストリーム処理は、新しいデータが届くたびに、それぞれを個々の単位としてリアルタイムに処理する方式です。次のバッチを待たずに処理でき、遅延は秒単位やミリ秒単位と小さいため、火災検知のような即時の応答が必要な場面に向きます。

A のバッチ処理はデータをためてまとめて処理する方式、B の正規化はリレーショナル設計の手法、C の可視化は結果を見せる工程で、いずれも届いたデータを1件ずつ即時に処理する方式ではありません。

バッチ処理とストリーム処理とは（詳しい解説）を見る

Q33. バッチ処理とストリーム処理の違いの説明として、もっとも適切なものはどれですか？

A. バッチ処理は遅延が大きめで大量データの処理に向き、ストリーム処理は遅延が小さく1件ずつの即時処理に向く

B. ストリーム処理は遅延が大きく、バッチ処理はつねに遅延がゼロである

C. どちらも遅延は同じで、扱うデータ量にも違いはない

D. バッチ処理は1件ずつ即時に処理し、ストリーム処理はためてからまとめて処理する

回答

解説

正解は「A」です。

Microsoft の教材では、バッチ処理は遅延が数時間程度になることが多く、大きなデータセットをまとめて効率よく処理するのに向くとされます。一方のストリーム処理は、届いたデータをすぐ処理し、遅延は秒単位やミリ秒単位で、個々のレコードや少量のマイクロバッチの即時処理に向きます。

B と D はバッチとストリームの説明を入れ替えた誤り、C は両者に違いがないとする誤りで、いずれも適切ではありません。

バッチ処理とストリーム処理とは（詳しい解説）を見る

Q34. データに接続して、レポートやダッシュボードとして可視化・共有するための、Microsoft のビジネス分析サービスはどれですか？

A. Azure Blob Storage

B. Azure Cosmos DB

C. Azure Files

D. Microsoft Power BI

回答

解説

正解は「D」です。

Microsoft Power BIは、データを実用的な洞察に変えるための Microsoft のビジネス分析プラットフォームです。さまざまなデータソースに接続し、対話的なレポートやダッシュボードとして可視化し、組織内で共有できます。

A は非構造化データのストレージ、B は NoSQL データベース、C はファイル共有で、いずれもデータ可視化・BI のためのサービスではありません。

Power BI とは（詳しい解説）を見る

Q35. Power BI で、データのモデリングやレポート作成を主に行うための、Windows 向けアプリはどれですか？

A. Power BI Mobile

B. Power BI サービス（service）

C. Power BI Desktop

D. Azure Portal

回答

解説

正解は「C」です。

Power BI Desktopは、データのモデリングとレポート作成を主に行うための Windows 向けアプリです。100 以上のデータソースに接続し、データを整形・モデリングして、対話的なレポートを作成できます。

B の Power BI サービスは、作ったレポートを公開・共有・共同作業するためのクラウドプラットフォーム、A の Power BI Mobile はモバイル端末で閲覧するためのアプリ、D の Azure Portal は Azure 全般の管理ポータルで、いずれもレポート作成を主目的とする Windows アプリではありません。

Power BI とは（詳しい解説）を見る

Q36. ストレージ・データエンジニアリング・データウェアハウス・レポートなどの機能を1つのワークスペースにまとめた、Microsoft の統合分析プラットフォームはどれですか？

A. Azure Blob Storage

B. Microsoft Fabric

C. Azure Queue Storage

D. Azure Table Storage

回答

解説

正解は「B」です。

Microsoft Fabricは、ストレージ・データエンジニアリング・データウェアハウス・レポートなどの機能を1つのワークスペースにまとめた、SaaS 型の統合分析プラットフォームです。データの取り込みから分析・レポートまでを一貫して扱える位置づけのサービスです。

A・C・D はいずれも Azure ストレージの個別サービスで、分析機能を1つにまとめた統合プラットフォームではありません。

Microsoft Fabric とは（詳しい解説）を見る

Q37. 大規模なデータエンジニアリングやデータサイエンス向けに作られた、Apache Spark ベースのクラウド分析プラットフォームはどれですか？

A. Azure Files

B. Azure Queue Storage

C. Azure SQL Managed Instance

D. Azure Databricks

回答

解説

正解は「D」です。

Azure Databricksは、大規模なデータエンジニアリングやデータサイエンスのために作られた、Apache Spark ベースのクラウド分析プラットフォームです。標準のストレージ形式として Delta Lake を使い、大量データの処理や分析に向きます。

A はファイル共有、B はメッセージング用のキュー、C はリレーショナルのマネージドインスタンスで、いずれも Spark ベースの大規模分析プラットフォームではありません。

Azure Databricks とは（詳しい解説）を見る

Q38. あらかじめ集計したデータを、地域→都市→住所のように階層で掘り下げ（ドリルダウン）して素早く見られる、分析向けの保存形式はどれですか？

A. メッセージキュー

B. OLAP モデル（セマンティックモデル）

C. リソースグループ

D. 仮想ネットワーク

回答

解説

正解は「B」です。

OLAP モデル（セマンティックモデル）は、分析ワークロード向けに最適化された、集計済みのデータ保存形式です。さまざまな次元・階層であらかじめ集計されているため、地域→都市→住所のように掘り下げる（ドリルダウン）操作や、集計値の問い合わせを素早く返せます。

A のメッセージキューは連携用、C のリソースグループは管理単位、D の仮想ネットワークはネットワークの土台で、いずれも集計済みの分析向け保存形式ではありません。

OLTP と OLAP の違いとは（詳しい解説）を見る

Q39. 分析のアーキテクチャの中で、データウェアハウスのテーブルに直接問い合わせて、複雑なレポートや可視化を作ることが多い職種はどれですか？

A. データアナリスト

B. データベース管理者（DBA）

C. ネットワーク管理者

D. セキュリティ管理者

回答

解説

正解は「A」です。

Microsoft の教材では、分析のアーキテクチャの各段階で異なる職種が関わるとされます。データアナリストは、データウェアハウスのテーブルに直接問い合わせて、複雑なレポートや可視化を作ることが多い職種です。なお、データサイエンティストはデータレイクのファイルを直接扱って探索・モデリングを行い、業務利用者は集計済みのレポートやダッシュボードを見ます。

B の DBA、C のネットワーク管理者、D のセキュリティ管理者は、この分析の段階でレポートや可視化を主に作る職種として挙げられていません。

データに関わる職種（データベース管理者・データエンジニア・データアナリスト）とは（詳しい解説）を見る

Q40. 多くの大規模分析ソリューションが、バッチ処理とストリーム処理の両方を組み合わせて使う理由として、もっとも適切なものはどれですか？

A. リアルタイム処理は不要で、つねにバッチだけで十分だから

B. ストリームだけを使えば、過去データの分析はまったくできなくなるから

C. 過去データの分析とリアルタイムの分析の両方を1つのソリューションで扱えるから

D. バッチとストリームは同時に使うとデータがかならず壊れるから

回答

解説

正解は「C」です。

多くの大規模分析ソリューションは、バッチ処理とストリーム処理を組み合わせて使います。これにより、リアルタイムのデータをダッシュボードで見せつつ、処理した結果をデータストアに残して過去データの分析にも使えます。両方を1つのソリューションで扱えるのが利点です。

A はリアルタイムを不要とする偏った説明、B はストリームだけで過去分析ができなくなるという誤り、D はデータが壊れるという誤りで、いずれも併用する理由として適切ではありません。

バッチ処理とストリーム処理とは（詳しい解説）を見る

試験全体の流れを俯瞰したい時は、Azure Data Fundamentals（DP-900）試験全体概要に戻れます。

学習の全体像と次に進む分野は、Azure Data Fundamentals（DP-900）学習ロードマップで確認できます。