「機械学習」「AI」といった言葉に興味はあるけれど、実態がどういうものなのか分からないという方は多いのではないでしょうか。
本記事では様々な企業においてAIや機械学習といった要素を使ったプロジェクトを経験してきた株式会社KUIXが、分かりやすくご紹介いたします。
機械学習(AI)とは
世の中にあふれる「機械学習」や「AI」といった言葉は大体同じと考えてよいと思います。ただ、「AI」という言葉の方が受けがいいため「AI」を切り口にサービス、製品の売り込みをしている企業が多いです。「AI」と聞いたら実態は「機械学習」にて実現しているものだと考えましょう。
では、「機械学習」っていったい何なのか?ですが、一言でいうと大量のデータから傾向を掴んでその傾向をその他のデータにも利用できる「計算ロジック」にすることです。

実際に機械学習を行った結果は学習済みのファイル(学習モデル)として出力され、その中身は計算ロジックの塊です。とてもシンプルにいうと「Y=AX+B」のような1次方程式をイメージすると分かりやすいかもしれません。この式のAやBといった係数や切片を決めるのが機械学習です。過去のデータの傾向から一番過去データの傾向を表すA, Bを求める、という計算を機械学習で行い、結果として「Y=AX+B」という計算ロジックを出力します。今後はこの計算ロジックを使えば新しいXの値を入れるとそれに従ったYが出てくるので事前に予測ができるということです。

ちなみにこのケースにおいてYは将来的に得たい結果(予測結果)ですよね。これは目的変数と呼ばれます。また、Xは予測結果を得るために使われる、つまり手元で得ることが出来るデータで、これは説明変数と呼ばれます。
機械学習の種類
では機械学習にはどのような種類があるのでしょうか?一般的には3つの種類に大別されます。それでは以下でその3つをご紹介していきます。
教師あり学習
教師あり学習は過去データを用いて学習を行い、学習モデルを生成する手法です。上述のY=AX+Bの例も過去データからモデルを生成するため教師あり学習です。教師あり学習は「予測」に利用されるのが一般的で、過去データ(例えば顧客の属性、行動データ、購買データ)から未来(商品を買うかどうか、優良顧客になるかどうか)を予測するロジックを生成します。具体的な学習方法としては回帰や分類、ニューラルネットワークなどがあり、さらに細かい分析手法があります。
教師なし学習
教師なし学習は過去データを用いて学習モデルを生成するのではなく、大量のデータからパターンや構造を見つける手法です。クラスタリングが有名です。クラスタリングは例えば大量のお客様のデータから似たような購買行動をしているお客様をグルーピングします。(例:アパレルでいうとプレゼント目的、自分の服を買う目的など購買行動から自動で客層を分類する) その結果はマーケティングに応用したりでき、DMやメルマガの内容を変えることでより高い確度で受注につなげることが出来るのです。
強化学習
強化学習は学習ロジックが自ら精度を高めるスタイルの学習方法です。事前に報酬という概念が設定されており、この報酬を最大化するロジックは何か?を学習します。ランダムに行動した上で報酬を最大化する行動は何か?を理解し、それをひたすら繰り返して学習する手法です。ロボットや自動運転などの技術に利用されています。
機械学習を始めるには?
このような機械学習ですが実は驚くほど簡単に導入できます。ご自身での実装も実はかなり簡単にできるようになっています。「え?こんなすごい数式やプログラムかけないよ。。。」と思われるかもしれませんが、実は世の中ではすでに開発された学習方法が無償で公開されており(これをライブラリと呼びます)このライブラリを使うことで難しい計算ロジックを自分で実装する必要はないです。
よほど自社にカスタマイズした機械学習モデルを欲しない限りは世の中で一般に出回っているライブラリを使ってすぐに学習モデルの生成が可能です。以下ではもう少し具体的に始め方をご紹介します。
機械学習を自分で実装する
まず自分で実装するにはRかPythonを使います。どちらを使うのかは好みですがその後のシステムへの組み込みなどを考えるとPythonの方が良いかもしれません。手元で分析するだけならRでもよいです。
R
Rはオープンソースの分析言語です。利用するためにRのダウンロードとRをコーディングするためのツールが必要です。ツールはRStudioを利用するのが一般的です。
Rは、CRAN (Comprehensive R Archive Network) と呼ばれる公式のリポジトリから入手することができます。以下の手順でインストールしてください。
・Rの公式サイト (https://www.r-project.org/) にアクセスし、”CRAN” をクリック
・インストールしたいOSに合わせて、”Download and Install R” のリンクをクリック
・ミラーサイトのリストが表示されるので、自分に最も近いものを選択
・インストーラーをダウンロードし、実行
RStudioのインストール
RStudioをインストールする場合は、以下の手順を実行してください。
・RStudioの公式サイト (https://posit.co/download/rstudio-desktop/#download) にアクセスし、”Download” をクリック
・”RStudio Desktop” の欄から、自分に最も合ったバージョンを選択
・ダウンロードしたインストーラーを実行し、指示に従ってインストールを完了
利用方法などは様々なサイトで公開されておりますのでそれらを参照の上利用してみてください!
Python
Pythonはオープンソースのプログラミング言語です。WEBシステムの開発でも使われますが分析言語としても非常に広く利用されています。Pythonで分析を行う際はJupyter NotebookというWEB上でコーディングができるツールを利用するのが一般的でそれらのソフトも含めてAnacondaというツールをインストールするとPythonを利用するために必要なソフトウェアがひと通り入ります。なので、まずはAnacondaをDownloadしてインストールしましょう。以下が手順です。
・Anacondaの公式サイト (https://www.anaconda.com/) にアクセスし、”Download” をクリック
・使用しているOSに合わせたインストーラーをダウンロードし、実行
・インストーラーに従って、Anacondaをインストール
・インストールが完了したら、ターミナルまたはAnaconda Navigatorを起動し、必要なライブラリをインストール
またGoogle Colab(https://colab.research.google.com/?hl=ja)というGoogleが提供する無償のPythonでの機械学習環境も提供されています。まずはPythonで機械学習やってみたいという方はこちらを利用するのも一案です。
機械学習をツールを使って実装する
ご自身で機械学習ロジックを実装するのではなく、機械学習のモデル生成を自動化できるツールもあります。いくつか代表的なツールをご紹介します。一方で、ツールを使うにあたっても機械学習の全容は理解している必要があるため、いきなりツールを使うのではなくご自身でいくつか実装を行ってから作業効率化のためツールを利用するというのが重要です。
DataRobot
DataRobotは、自動機械学習プラットフォームであり、データの前処理、モデルの選択、パラメータチューニングを自動的に行うことができます。データを投入しモデルを選択するだけでデータサイエンティストに匹敵するような高度な予測モデルを生成できます。
Data Robot公式ページ
Google AutoML
Googleが提供する自動機械学習ツールです。機械学習に熟練していない人でも簡単にモデル生成ができ、画像認識や自然言語処理など含め分析対象のデータは多岐にわたります。またクラウドサービスなので分析環境を用意しなくてよいのも魅力です。
Google AutoML公式ページ
機械学習のビジネスへの応用
機械学習をビジネスに応用するためのポイントとしては以下があげられます。
・分析だけで終わらせず結果を使って行動に移す:分析だけやって満足するというケースはよくあります。実際のその結果をビジネスプロセスに適応して始めて意味があるため、具体的にアクションまで定めたプロジェクトにすることが肝要です。
・分析ができるためのデータを整備しておく:「機械学習のプロジェクトのほとんどの作業がデータの成型だ」と言われるほどデータのクレンジング作業が重要です。企業様によってはデータが整備されておらずそもそも機械学習を実装するに値しない状態というケースもあります。機械学習の導入の前にデータ整備を検討しましょう。
・目的を明確化しておく(人間の作業の省力化なのか、高度化なのか?):機械学習はあくまで手段であり、何に使ってどういう効果を得たいのか?それが本当に機械学習を応用して達成できるのか?をしっかり考えおくことが重要です。
おわりに
機械学習(=AI)はどの業界でも必須といっていいほど強力なツールです。是非正しい理解をした上で導入を進めてください。
株式会社KUIXではAIプロジェクトに関しても豊富な知見を持ったメンバをそろえております。また、分析ではなくその結果を使ってビジネスにどういう効果をもたらすのか?に主眼を置いたプロジェクト推進を行っています。ご支援が必要でしたら是非ご連絡ください!お問い合わせはこちらから

