この記事は、インテル® デベロッパー・ゾーンに公開されている「Why Should You Care About Machine Learning?」(https://software.intel.com/en-us/articles/why-should-you-care-about-machine-learning) の日本語参考訳です。
この記事の PDF 版はこちらからご利用になれます。
マシンラーニングはしばらく前から活用されているため、開発に携わったことがなくても、良くご存じかもしれません。Amazon* で商品をカートに追加すると、お勧め商品のリストが表示されます。これは、マシンラーニングの一例です。本来、マシンラーニングとは、データを基に学習し、独自のルールを作成可能なコンピューター・プログラムを開発することです。
マシンラーニング・アプリケーションの開発は、標準的なアプリケーションの開発とは異なります。特定の問題を解くコードを記述する代わりに、マシンラーニングの開発者はデータを読み取り、それを基に独自のロジックを構築するアルゴリズムを作成します。Amazon* の例では、顧客の行動と購入情報を使用して、その顧客が興味を持ちそうな商品を決定します。カートの商品と特定の商品の関係は 1:1 ではありません。マーケティング担当者や販売員が複数の商品を一緒に購入することを勧めるのとは異なり、これまでの訪問履歴や購入履歴といった既存のデータをすべて考慮し、その情報に基づいて行動を予測し、最適なお勧め商品を決定します。常に新しい商品とデータが入力されるため、推奨結果が継続的に調整および改善されます。
なぜ今マシンラーニングに注目すべきなのでしょうか? 近年の IoT デバイスとコネクテッド・デバイスの増加に伴い、膨大なデータへのアクセスが可能になり、それらを管理し理解する必要性が高まっています。
また、さまざまな業界がマシンラーニングの採用を進めているため、開発者にとってマシンラーニングの仕組みを知り、製品価値向上の可能性を探る絶好の機会といえます。
マシンラーニング・アルゴリズムの種類
教師あり
トレーニング・データはラベル付きの入力と既知の結果で構成されており、マシンは自力でラベルを適用できるようになるまで学習します。例えば、顔検出アルゴリズムの場合、マシンがラベル付けされていないイメージから顔を確実に認識できるようになるまで、ラベル付けされた風景、人、動物、建造物などのイメージを提供します。
教師なし
マシンはラベル付けされていないデータを解析し、識別した類似点に基づいて分類します。上記の例と同じイメージをラベル付けしないで提供した場合、マシンは共通の特徴 (都市の景観の明確な線や顔が丸いことなど) に基づいてイメージを分類することはできますが、丸いものが「顔」であると識別することはできません。これらのプログラムは、人では識別が困難または不可能なデータセット内のグループを特定するのに使用されます。
半教師あり
上記の 2 つを組み合わせたもので、大量のデータのうち一部のみがラベル付けされている場合に使用します。教師なし手法によりラベル付けされていないデータをグループ化し、教師あり手法によりそれらのラベルを予測します。
強化学習
単純な報酬データを使用して、特定のコンテキスト内で理想的な行動についてマシンをトレーニングします。
手動で対応するよりも高速
マシンラーニングの最大の利点は、ほかの手段よりもはるかに高速に処理できることです。人間が解くことができない問題は解くことができませんが、膨大な量のデータを読み取り、素早く関連付けて、推奨を構築することができます。IoT デバイスやコネクテッド・デバイスによりデータ量が拡大し続けるとともに、この利点はさらに重要になります。スマートコンセントや歩数計など、データを生成するものはさまざまで、それらが日々生成するデータは膨大な量に上ります。さらに、多くの人々がそれらのデバイスを所有しています。コネクテッド・デバイスの普及に伴い、情報量も増加します。マシンラーニングは、重要なパターンと詳細を人間には不可能な速度で識別できるようにします。
対象となる業界
機器や設備の故障を予測したい製造工場や無人自動車のメーカーなど、データにアクセスするあらゆる業界にとって、データの意味を正確に理解することは大きな利点をもたらします。以下は、いくつかの業界におけるマシンラーニングの採用例です。
最近のトレンド: チャットボット
2016 年にチャットボットに対応した Facebook* Messenger が登場し、ボットを使用して企業と消費者が対話できるようになりました。顧客が企業の Facebook* ページにアクセスし、メッセージを送信すると、直ちに AI が対応し、製品に関する意思決定や情報収集を支援します。チャットボットは、対話を通して改善されます。特定の取引を直接行うことも可能です。例えば、Messenger で車のアイコンをクリックすると、Uber* から車を手配できます。
チャットボットは、テキストを送信するだけでなく、イメージや動作開始ボタンを備えています。つまり、カスタマーサービス、E コマース支援、コンテンツを自動化できます。正確さが向上するにつれ、チャットボットは自動化されたコンシェルジュのようになり、消費者は必要な情報とサービスを素早く簡単に利用できるようになります。これは、「会話型コマース」と呼ばれる大きなトレンドの一部で、人気のモバイル・メッセージ・アプリと拡大する AI の能力を利用して、チャットウィンドウで買い物ができるようにします。
関連情報
マシンラーニングについて詳しく知る最良の方法は、対象分野のグループを見つけることです。オンラインにも豊富なリソースがあります。そのうちのいくつかを以下に示します。
マシンラーニングの用語集
http://robotics.stanford.edu/~ronnyk/glossary.html
マシンラーニング、統計、データマイニングに関する一般的な用語集。
Facebook* のデータマイニング/マシンラーニング/AI グループ
(https://www.facebook.com/groups/machinelearningforum/)
データマイニング、マシンラーニング、人とコンピューターの相互作用、人口知能のさまざまなトピックについて一般的興味がある方向けのパブリックグループ。
Facebook* のボットグループ (英語)
約 10,000 人のメンバーで構成されるクローズドグループ。チャットボット分野での取り組みについて意見交換するにはグループへの参加要求を送る必要があります。
LinkedIn* のパターン認識、データマイニング、機械知能、マシンラーニング・グループ
30,000 人弱のメンバーで構成される、パターン認識、データマイニング、機械知能、マシンラーニングに興味がある方向けのクローズドグループ。
LinkedIn* のマシンラーニングとデータサイエンス・グループ
約 40,000 人のメンバーで構成される、データサイエンスとマシンラーニングの最新情報に関するクローズドグループ。フォーラムベースのテクニカルサポートと関連業界の求人情報を提供しています。
LinkedIn* のマシンラーニング・ネットワーキング・グループ
20,000 人強のメンバーで構成される、次世代のマシンラーニングに興味がある方向けのネットワーキングを目的としたクローズドグループ。
Reddit* のマシンラーニング掲示板 (英語)
ニュース、研究論文、ビデオ、講演、ソフトウェア、意見交換を含む、マシンラーニングのあらゆるトピックに関するアクティブな掲示板。
Quora* のマシンラーニング掲示板 (英語)
Quora* コミュニティーの掲示板。初心者から上級者まで、マシンラーニング開発者の質問に対し、コミュニティーから回答が得られます。
マシンラーニングは、歴史の長い非常に大きなトピックであり、さまざまなことを考慮する必要があります。我々も高い関心を持っているトピックであり、今後さらに情報を充実させていく予定です。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。