MENU
Archives

Amazon Athenaとは?特徴や利用方法、Amazon Redshiftとの比較について

現代のビジネスにおいて、データ分析は重要な戦略的要素となっています。その中でもAWSが提供する「Amazon Athena」は、シンプルな操作性と柔軟なクエリ処理により、データ分析のハードルを下げるツールです。

本記事では、Athenaの基本的な特徴や利用方法、デメリット、Amazon Redshiftとの比較などについて解説します。

目次

Amazon Ahtenaとは

「Amazon Athena」は、AWSのクラウドプラットフォーム上で動作する、サーバレスなクエリサービスです。

従来のデータベースのようなインフラストラクチャの設定や管理が不要でありながら、S3に保存されたデータをSQLクエリを通じて効率的に分析できるのが特徴です。データ分析の時間とリソースを削減し、迅速な意思決定を支援します。

AmazonAthenaの特徴

AWSには他にもAmazon RedshiftというDWHのサービスがあります。どちらかというとDWHとしてメジャーなのはRedshiftかと思いますが用途によってはAthenaのほうが優れている場合があります。

以下で説明しますがAthenaはAWSのファイルストレージであるS3のファイルと直接接続ができる点やサーバレスかつ従量課金のサービスのため使った分だけ払えば良いのでログファイルなどソースデータがファイル形式の分析などで限られた方がスポットで利用するような用途に最もFITすると言えます。以下にそれぞれの特徴を記載します。

サーバレス

AWSのRDSやRedshiftといった同様のサービスは、運用のためのサーバー管理やスケーリングが必要です。(Redshiftに関しては現在サーバレスのサービスもでています。)

しかし、Athenaはサーバレスなので、インフラストラクチャの管理から解放され、専念できる分析に注力できます。要は分析用途によってサーバのスペックを判断したり、といったことが必要なく、事前準備なしにすぐ利用開始が可能です。

従量課金

Athenaはクエリ実行時間とデータスキャン量に基づいて課金されます。必要な分だけ支払うため、無駄なコストを削減できます。また、コストを意識しながらデータを分析できるメリットがあります。

料金は以下サイトより確認いただけます。
https://aws.amazon.com/jp/athena/pricing/

S3のファイルを直接扱える

Athenaは、S3に保存されたデータを直接扱えます。煩雑なデータ移行プロセスが不要であり、データのクエリや分析を素早く行える便益があります。ファイル形式もCSVやJSONの他様々なものを扱えます。

例えばログファイルなどをS3に発行するようにしておけばAthenaを経由してBIツールなどで簡単に分析を行うことができるのです。

Amazon Athenaの利用方法

次にAthenaの利用方法を見ていきましょう。

S3にデータを保存する

まず、分析対象のデータをAmazon S3にアップロードします。様々なフォーマットに対応しており、選択肢が広がります。

データのアップロードが完了したら、Athenaでクエリを実行する準備が整います。もちろんS3以外のデータソースとの接続も可能です。(ただ、後述の通り、その他のDWH製品と比較するとデータソースの接続性はあまり高くありません。)

テーブルを定義する

Athenaでは、S3上のデータに対してクエリを投げた結果を保存するテーブルを定義できます。これにより、分析した結果を蓄積しBIなどとの連携が可能となります。

SQLを発行する

S3上のファイルなどに対してSQLクエリを発行してデータを抽出します。SQLの知識があれば、容易にデータの抽出や集計が行えます。使い慣れたSQLを活用して、データから有益な情報を引き出しましょう。

Amazon Athenaのデメリット

次にAthenaのデメリットを紹介します。

大量のバッチ処理は苦手

AthenaはS3のファイルに直接クエリ発行できるなど便利な一方、大規模なデータに対する一括の処理には向いていません。処理時間がかかるため、リアルタイム性を要求されるケースには注意が必要です。

接続先の自由度が少ない

Athenaは主にS3と統合されています。他のデータソースへの接続は限定的であり、特定のシナリオに対応するための工夫が必要です。

間にGlueなどのETLを挟むことで解消することも出来ますが構成が複雑になりがちなため、大規模なデータ統合基盤などを考える場合はRedshiftやAWS以外のBigQuery, SnowFlake, Data Bricksなどを検討するのが良いかと思います。

Amazon Redshiftとの比較

次に同様にAWSの類似サービスであるRedshiftとの比較をご紹介します。

大規模なDWHには向いていない

Athenaはクエリ処理に特化しており、大規模なデータウェアハウス(データの保管場所)には向いていません。処理速度やパフォーマンスが限定的であるため、大量のデータを扱う際は検討が必要です。

高速性、安定性に劣る

専用のハードウェアを活用するAmazon Redshiftと比べると、Athenaはクエリの速度や安定性に劣ることがあります。高速性を求める場合には、他の解決策も検討する価値があります。

費用を抑えることが可能

Athenaは従量課金モデルを採用しており、使用量に応じてコストが発生します。一方で、Redshiftは固定コストがかかりますが、適切なシナリオにおいてはコスト効率的な選択肢となります。分析ボリュームによって判断しましょう。

おわりに

Amazon Athenaは、そのシンプルな操作性と柔軟なクエリ処理により、データ分析を簡素化する強力なツールです。

ビジネスの意思決定を支援し、効率的な戦略策定をサポートするために活用してみましょう。

株式会社KUIXではAWSを用いたシステムの開発やコンサルティングを行っています。本格的なAWS環境の構築・導入をご検討される際は、ぜひ一度ご連絡ください!お問い合わせはこちらから

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次