MENU
Archives

Azure Synapse Analytics とは? 特徴、Azure SQL Data Warehouse との違いを解説!

「データ分析をしたい!」そんな時、まずは分析するデータが必要となります。
ただデータだけを集めるだけではなく、”分析できる”データにするための処理や””分析ができる””環境(BIツールやデータの保存・蓄積場所)にしていくことも大切です。

“分析ができる”環境(BIツールやデータの保存・蓄積場所)と聞くと
「オンプレ/クラウド含めて、いろいろあってどれが良いのか分からない。」
「料金が高くなりそう。。。」
といった方も多いのではないでしょうか。

本記事では、Microsoft AzureやAWS、GCPを活用し、BIツールでのデータの可視化や分析、業務効率化を行い、その他データ活用に関する多くの知見のある株式会社KUIXが、これまでの経験をもとにMicrosoft Azureのサービスの1つで分析プラットフォームであるAzure Synapse Analyticsにフォーカスし、Azure Synapse Analyticsの概要や特徴、料金体系を解説いたします。

目次

Azure Synapse Analytics とは

Azure Synapse Analyticsを一言で表すと、「データ分析に必要な機能が備わっている分析プラットフォーム」です。
一般的に、データ分析をする際には、大きく以下の4つのステップがありますが、それぞれのステップを別々のサービスやツールを利用することなく、全てを実現できるサービスとなっています。
①データ収集・蓄積
②ETLツールなどによるデータの抽出・加工
③構造化されたデータをデータウェアハウスに蓄積
④BIツールでの可視化や機械学習に利用

なお、Azure Synapse Analyticsは、Microsoft社が提供するクラウドプラットフォームサービスであるMicrosoft Azureのサービスの1つであり、Azure SQL Data Warehouseの後継サービスになります。
そのため、エンタープライズのDWHで使用されるSQLテクノロジーやビッグデータ処理のためのSparkテクノロジー、データ統合のためのPipelines、Power BI、CosmosDB、AzureMLなど、他のMicrosoft Azureサービスとの連携に適しています。

※Microsoft Azureについての詳細は、下記記事にて詳しく解説しています。

Azure SQL Data Warehouse との違い

Azure SQL Data Warehouseは、後継サービスであるAzure SQL Data Warehouseで提供されていたペタバイト級のデータを並列処理できるデータウェアハウス機能に加え、ビッグデータ解析機能とサーバーレスSQLプール機能が追加されています。

SQLプールとは、SQLの前処理結果を保存して処理時間を短縮するための領域のことで、ストレージを持たないサーバーレスSQLプールを使用することで、課金対象は処理のために読み込んだデータだけとなるため、従来の専用SQLプールよりコストが抑えられるようになります。

また、前述の通り、ビッグデータ解析を実施するために、データウェアハウスやETLツール、データレイク、ビッグデータ解析ツールをそれぞれ準備(調達)し、データをそれぞれのツールに連携させる必要がありましたが、Azure Synapse Analyticsは、それら全てを実現できるサービスのため、ワンストップで対応できるようになっています。

Azure Synapse Analytics の特徴

Azure Synapse Analyticsがどんなサービスか理解できたところで、ここではAzure Synapse Analyticsの主な5つの特徴を解説いたします。

無限のスケールで分析ができる

まず、1つ目は、無限のスケールで分析ができることです。
Azure Synapse Analyticsでは、企業内の部署単位で収集・蓄積している比較的小規模なデータから、企業全体で収集・蓄積しているビッグデータまですべてのデータを無限のスケールで分析することができます。

通常、データウェアハウス(構造化データ)とビッグデータ(非構造データ)を1つに統合することは各システム・サービスの役割や操作方法が異なるため難しいですが、Azure Synapse Analyticsは、データウェアハウス(構造化データ)とビッグデータ(非構造データ)をシームレスに結合できるため、全てのデータから分析をすることができます。
また、扱うことができるデータ容量はペタバイト規模で、構造化データおよび非構造データへの大規模データへアクセスすることができます。

使い慣れたプログラム言語を使うことができる

2つ目は、使い慣れたプログラム言語を使うことができることです。
新しいシステムやサービスを利用する際に、今までの操作方法から何もかも変わってしまうと覚え直す必要がありますよね?
データ分析に関しても同様に、データの加工などのプログラミング言語を用いますが、今まで利用していたプログラミング言語が利用できない場合は、別のプログラミング言語を習得する必要がありますが、Azure Synapse Analyticsでは、以下のプログラミング言語を利用することができます。

・.NET
・Node.js
・Python
・Java
など

※サポートされているプログラミング言語に関する最新/詳細情報は、Microsoft公式ページを参照ください。
Azure Functions でサポートされている言語
https://learn.microsoft.com/ja-jp/azure/azure-functions/supported-languages#languages-by-runtime-version

BIと機械学習を統合して分析ができる

3つ目は、BIと機械学習を統合して分析ができることです。
一般的にBIツールと機械学習(ML)は、別々のシステム・サービスですが、Azure Synapse Analyticsは、同じMicrosoft AzureサービスであるAzure Data Factory(ETLツール)によって抽出・加工されたデータを
Azure Synapse Analyticsに統合し、同じく機械学習(ML)であるAzure Machine LearnigやBIツールであるPower BIと連携することで、スムーズなデータ連携やデータ分析をすることができます。

リアルタイムでの分析ができる

4つ目は、リアルタイムでの分析ができることです。
リアルタイムにデータを分析する場合、常に収集・蓄積される元となるデータとBIツールから接続するデータウェアハウスのデータが一致している必要があり、運用時のデータ処理が複雑になったり、コストが高くなりますが、Azure Synapse Analyticsは、Azure Cosmos DBのAzure Synapse Linkを利用することで、運用中のデータストアからリアルタイムでデータ分析をすることができるようになります。

オンプレミスとの連携で柔軟な運用ができる

最後は、オンプレミスとの連携で柔軟な運用ができることです。
Azure Synapse Analytics自体は、Microsoft Azureのサービスであるため、クラウドサービスとなりますが、オンプレミスと連携することもできます。

そのため、企業によっては、コンプライアンス的にデータをオンプレミスに保存しなければならない場合などもあると思いますが、オンプレミスのデータウェアハウスの運用を維持しながら、高負荷のデータ処理などをAzure Synapse Analyticsに移行することで、データ処理の待機時間などを削減し業務を効率化することもできます。

Azure Synapse Analyticsの料金体系

Azure Synapse Analyticsの料金体系は、2023年8月現在で以下の7つのプランがあります。
利用用途に応じて、複数のプランを選択して契約します。

①事前購入プラン
②データ統合プラン
③データウェアハウスプラン
④ビッグデータ分析プラン
⑤ログ及びテレメトリ分析プラン
⑥専用SQLプールプラン
⑦Azure Synapse Linkプラン

※Azure Synapse Analyticsの料金体系に関する最新/詳細情報は、Microsoft公式ページを参照ください。
Azure Synapse Analytics の価格
https://azure.microsoft.com/ja-jp/pricing/details/synapse-analytics/

事前購入プラン

Azure Synapse Analytics コミット ユニット (SCU) を事前に購入することで、通常料金と比べて最大28%OFFになります。

SCUは、Azure Synapse Analyticsで利用できるすべての製品に対して利用することができ、Azure Synapse Analytics利用料に対して、優先して使用され、すべて消費、もしくは12か月間が有効期限となります。

データ統合プラン

データの取り込みやデータの加工を行う際に必要となるプランです。
データの作成、読み取り、更新、削除、監視などのデータ操作の実行数と実行時間によって従量課金されます。

データウェアハウスプラン

対話型、バッチ、ストリーミング、予測型のデータ分析を行う際に必要となるプランです。

サーバーレスと専用領域の2種類から選択でき、専用領域の場合、1年予約で最大37%、3年予約で最大65%のディスカウントが適用されます。
なお、サーバーレスでは、処理データ量、専用領域では稼働した時間数によって従量課金されます。

ビッグデータ分析プラン

サーバーレスSparkプールを使用してビッグデータ分析を行う際に必要となるプランです。
ビッグデータ処理タスクの実行時間によって従量課金されます。

ログ及びテレメトリ分析プラン

対話型クエリを使用して、時系列、ログ、テレメトリのデータから分析情報を取得する際に必要となるプランです。

構造化/非構造化データ問わず、フリーテキストおよび正規表現検索などを行うことができます。
Azure Synapse データ エクスプローラー使用時のみ従量課金となり、データ量と稼働した時間数によって従量課金されます。

専用SQLプールプラン

専用のSQLプールを作成し、対話型、バッチ、ストリーミング、予測型のデータ分析を行う際に必要となるプランです。1年予約で最大37%、3年予約で最大65%のディスカウントが適用されます。

コンピューティング(処理領域)とストレージ(データ格納領域)を別々にすることで、データ量に関係なく、コンピューティングをスケーリングできるようになります。
稼働した時間数によって従量課金されます。

Azure Synapse Linkプラン

ETLツールで行われるデータの抽出・変換・読み込みという比較的時間のかかるプロセスを省略し、SQLデータベースから自動的にデータを移動する際に必要となるプランです。
リアルタイム同期をすることもでき、稼働した時間数によって従量課金されます。

まとめ

Microsoft Azureのサービスの1つで分析プラットフォームであるAzure Synapse Analyticsについて、概要や特徴、料金体系などをご紹介しました。

オンプミスのデータウェアハウスの拡張や、データウェアハウスのクラウド構築を検討している情報システム担当者の方で、
「サーバーのランニングコストを最適化したい」
「Microsoft Azureサービスと連携させたい」
といった方は、Azure Synapse Analyticsの導入を検討してはいかがでしょうか。

KUIXではただ導入・開発するだけでなく、導入後の利活用を実現することに着眼した、データレイク・DWH・データマート・BIツールの選定・導入からレポート作成、運用、啓蒙・展開までトータルのコンサルテーションなどを行っています。
「データマート/データレイク/DWH/BIツールを導入したい」
「すでに導入しているがデータ活用、展開が進んでいない」など
お困りの方は、ぜひお気軽にご連絡ください!お問い合わせはこちらから

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次