Azure の資格を全部とった話の本編はこちら
Azure のデータベースに関する Fundamentals 試験、DP-900 を受けて来ました。 既に上位試験となる DP-200/201/300 は受験し合格しています。 今回、DP-900 を受験した理由は2つあり、1つ目は元々 AZ-140 を受験することを決めていた中せっかくテストセンター行くのでであればついでに DP-900 と AI-900 も受けようと考えました。 2つ目の理由は他の人に DP-900がお勧めだよ、と言いたい時に実体験をもとにしてメリットや受験の前提となる知識レベルを明確に伝えることができるだろうという期待がありました。
目次
DP-900 の概要
DP-900 は試験の名称です。この試験に合格すると Microsoft Certified: Azure Data Fundamentals に認定されます。 認定によっては複数の試験の合格が前提となるものもありますし、今回の Azure Data Fundamentals のように1つの試験だけで認定されるものもあります。
試験の概要は以下の公式ページの通りですが、リレーショナル データと非リレーショナル データの概念、およびトランザクションや分析などのさまざまなタイプのデータ ワークロードの知識を問われる試験となります。 リレーショナルと非リレーショナルと言う通り、SQL Server や MySQL / PostgreSQL などのリレーショナルなデータベースについても問われますし、Document 型のCosmos DB や NoSQL な Table Storage 、その他 Graph なども、Azure が提供するデータベースの概要や使い分けが問われます。 あとは OLTP/OLAP の概念なども。
Skills outline
試験の出題範囲は認定・資格に関する公式ページにある認定資格スキルのアウトラインから確認可能です。
この skills outline ですが、英語のみの提供です。 今回は手抜きですが、Google ドキュメントの翻訳機能を利用し、日本語化(PDFファイルを Google ドキュメントで開き、Google ドキュメントの翻訳機能で一括翻訳)したものをベースに紹介します。 Google 翻訳の結果をこちらで多少修正していますが、おかしいと思ったときは原文を確認ください。
まず、試験は大きく以下のブロックで提供されます。 %は出題全体に占める割合です。
試験DP-900:Microsoft Azureデータの基礎
コアデータの概念を説明する(15〜20%)
コアデータワークロードの種類を説明する
∙ バッチデータを説明する
∙ ストリーミングデータについて説明する
∙ バッチデータとストリーミングデータの違いを説明する
∙ リレーショナルデータの特徴を説明する
データ分析のコアコンセプトを説明する
∙ データの視覚化について説明する(例:視覚化、レポート、ビジネスインテリジェンス(BI))
∙ 棒グラフや円グラフなどの基本的なグラフの種類を説明する
∙ 分析手法を説明する(例、記述的、診断的、予測的、規範的、 認知)
∙ ELTおよびETL処理について説明する
∙ データ処理の概念を説明する
Azure 上のリレーショナルデータとの仕事に方法の説明 (25〜30%)
リレーショナルデータのワークロード
∙ リレーショナルワークロードのための右のデータ提供を識別
∙ (例えば、テーブルは、インデックス、ビュー)リレーショナルデータ構造を記述
Azureのデータサービスのリレーショナル
∙ PaaS、IaaS、およびSaaSソリューションの比較
∙Azure SQLデータベース、AzureSQLマネージドインスタンス、Azure仮想マシン上のなどのAzureSQLデータベースサービスについて
∙SQLServer∙AzureSynapse Analytics
∙ PostgreSQL、MariaDB、MySQL
リレーショナルデータのための基本的な管理タスクを特定
∙ プロビジョニングとリレーショナル・データ・サービスの展開
∙ Azureのポータルなどの展開方法を説明
∙Azureのリソースマネージャテンプレート、AzureのPowerShellの、およびAzureのコマンドラインインターフェイス (CLI)
∙ 特定データセキュリティコンポーネント(例:ファイアウォール、認証)
∙ 基本的な接続の問題を特定する(例:オンプレミスからのアクセス、AC Azure VNetでのアクセス、インターネットからのアクセス、認証、ファイアウォール)
∙ クエリツールの特定(Azure Data Studio、SQL Server Management Studio、sqlcmdユーティリティなど)
SQL言語を使用したデータのクエリ手法の説明
∙ データ定義言語(DDL)の比較)とデータ操作言語(DML)の比較
∙ Azure SQLデータベース、PostgreSQL用Azureデータベース、MySQL用Azureデータベースでリレーショナルデータをクエリする
非リレーショナルデータを操作する方法を説明する(25〜30%)
非リレーショナルデータのワークロードを説明する
∙ 非リレーショナルデータの特性を記述するが
∙ 非リレーショナルとのNoSQLデータの種類を説明
∙ 正しいデータストア
∙ 非リレーショナルデータを使用する場面
Azureの上の非リレーショナル・データ・オファリング
∙ 非リレーショナルなワークロードの特定
∙ Cosomos DB API
∙ テーブル・ストレージ
∙BLOBストレージ
∙ File Storage
非リレーショナルデータのための基本的な管理タスクを識別
∙ 非リレーショナルデータサービスのプロビジョニングと展開
∙ Azureポータル、Azure Resource Managerテンプレート、Azure PowerShell、Azureコマンドラインインターフェイス(CLI)などの展開方法
∙ データセキュリティコンポーネント(ファイアウォール、認証、暗号化など特定する)
∙ 基本的な接続の問題を特定する(たとえば、オンプレミスからのアクセス、Azure VNetを使用したアクセス、インターネットからのアクセス、認証、ファイアウォール)
∙ 非リレーショナルデータの管理ツールを特定する
Azureの分析ワークロードを説明する(25〜30%)
分析ワークロードの説明
∙ トランザクションワークロードを記述する
∙ トランザクション間の差を説明および分析はワークロード ∙ バッチと実時間との差を記述する
∙ ワークロードを倉庫データを記述します
∙ データ・ウェアハウス・ソリューションを必要とされる時を決定
Modern Dataware Houser の構成要素
∙ Azure Data Lake、Azure Synapse Analytics、AzureDatabric、HDInsight
∙ DWHのアーキテクチャやワークロード
データの ingestion と processing
∙データ読み込みのための共通プラクティス
∙ Azure Data Factory(例えば、パイプライン、活動、など)のコンポーネントを説明
∙ データ処理のオプション(例えば、HDInsight、Databricks、Synapse Analytics、Data Factory)
PowerBIでのデータの視覚化を説明
∙ ページ分割報告の役割
∙ インタラクティブなレポートの役割
∙ ダッシュボードの役割
∙ ワークフロー
試験について
試験は 60分、問題数は40数問(正確には覚えていない)でした。 日本語での受験も可能で、今回の試験については特に日本語がおかしいところもなく英語分を確認することはありませんでした。
設問は文章も短く、サクサクと進めることが可能です。 15分位で終了することが出来ました。 と言いつつ、結果は 850 点と結構間違えています。
以下、試験結果のレポートです。 テストセンターで受験終了後に印刷されたものをいつも渡されていたのですが、実は PearsonVUE の Web サイトからいつでも PDF としてダウンロードできることを本日知りましたので、スクリーンショットで紹介します。
Azure での分析ワークロードの説明だけが80% を下回っています。まあ、ここは実際の経験が不足している領域でもあるので自分の実感とも一致します。
当方のスキル・経験と試験の対策
約1年前に DP-200/201 は合格し、昨年9月に DP-300 も合格しています。 リレーショナルなデータベースは長い SE 経験の中でそれなりの数の提案、設計・構築、運用を行ってきました。 非リレーショナルはここ数年扱うことが増えて来ています。
今回の試験にあたってはアウトラインを確認し、Azure のプロダクト・サービスで何が出来るかの確認を行いました。準備時間としては1時間位でしょうか。 ただ、上記のとおりスコアは 850 点あまりとよくありませんでした。
そんな中で言えることは、基本は Skills outline に書かれていることで概要を説明できないものが無ければ試験自体はクリア出来ると考えます。 概要ですのでリレーショナルと非リレーショナルの違いとは?に対して一言二言で説明出来ればOKなレベル感です。 あとは Azure のデータベース関連製品の名称は覚えておく必要がありますし、それらがリレーショナルなのか、非リレーショナルなのか、非リレーショナルな場合はまたどのタイプなのかも把握しておく必要はあります。 その上で利用シーンごとの使い分けも出来る必要があります。 分析系は OLAP の概念や Azure の製品ラインナップ、そして PowerBI を抑えておけば大丈夫でしょう。 私は PowerBI は使ったことが無くあまり勉強しなかったのでここは不正解が多かったはずです。
仮に一から DP-900 の対策を進める場合ですが、マイクロソフトより無償の教育コンテンツが提供されています。先ほど、ざっくりと眺めてみましたが図や具体的なデータを用いた説明がふんだんにありかなり有用な内容です。この実施だけで DP-900 に必要な情報は網羅出来ていると考えます。 8時間あれば以下の4つすべて学習できる分量も丁度良い感じです。(8時間は長いですが、わからないところだけ重点的に確認することで2分の1、3分の1で進められると思います)
この試験・認定のメリット
まず、 データベースとは何か、その概要を理解し、例を交えながら人に伝えることが出来るようになります。 コンピュータは乱暴に言ってしまえばデータを入れて、処理して、データを出してくれます。 そう意味ではデータベースは常にコンピュータというかシステムのど真ん中にあるものになります。
昔はリレーショナルなデータベースでシステムを構築することがほとんどだった訳ですが、昨今のビッグデータ、IoTなどはそのデータ特性やデータの使い方(分析)からリレーショナルは不適で、NoSQL が活躍します。 この時、DP-900 の知識があればどうして NoSQL が適するのか理解は出来るでしょうし、リレーショナルが不適な理由も腹落ちできると思います。
もちろん、実際にデータベースを使いこなすには DP-900 の知識だけでは不十分です。 マイクロソフトは次のステップとして DP-200/201やDP-300 も用意していますのでデータベースに興味がある方はこの DP-900 が足掛かりになると思います。
以上