![]() |
ビッグデータの解析と機械学習のパフォーマンスを大幅に向上
|
- このページでは、https://software.intel.com/en-us/intel-daal の内容をもとに、製品に関連する記事や参考資料へのリンクをまとめています。
- 本製品は単体販売しておりません。インテル® oneAPI ツールキットに同梱されています。
- インテル® oneAPI ツールキットに同梱されるバージョンから製品の名称がインテル® oneAPI データ・アナリティクス・ライブラリー (インテル® oneDAL) に変わりました。
- 関連記事
- リソース
- FAQ
関連記事
関連記事一覧
- インテル® oneDAL でデータ・アナリティクスとマシンラーニングを強化
- oneAPI でアーキテクチャーの壁を越える: ヘテロジニアス・コンピューティングを容易にするライブラリー
- シングルセル遺伝子解析の高速化
- インテル Parallel Universe 43 号日本語版の公開
- インテル® DAAL の Python* API (daal4py) 導入ガイド
- インテル® DAAL を使用した主成分分析パフォーマンスの向上
- インテル® DAAL を使用したサポート・ベクトル・マシン (SVM) の向上
- インテル® DAAL を使用した外れ値検出の強化
- インテル® DAAL を使用した線形回帰モデルの最適化
- インテル® DAAL を使用した Python* ナイーブベイズ・アルゴリズムのパフォーマンス向上
- インテル Parallel Universe 39 号日本語版の公開
- PyDAAL 超入門: パート 4 分散処理とオンライン処理
- PyDAAL 超入門: パート 3 解析モデルの構築とデプロイメント
- PyDAAL 超入門: パート 2 数値テーブルの基本操作
- PyDAAL 超入門: パート 1 データ構造
- 入れ子構造の並列処理が手に負えなくなったときにどうするか? インテル® TBB 向け Python* モジュールを 30 分で導入する
- インテル Parallel Universe 33 号日本語版の公開
- 一般的な Linux* パッケージ・マネージャーを使用してインテル® パフォーマンス・ライブラリーとインテル® Distribution for Python* をインストールする
- インテル Parallel Universe 32 号日本語版の公開
- インテル® MKL とインテル® DAAL によるビッグデータ解析のスピードアップ
- インテル® ライブラリーによるディープラーニングとマシンラーニングの促進
- インテル Parallel Universe 28 号日本語版の公開
- インテル® DAAL を利用して実際のマシンラーニングの問題を解く
- インテル Parallel Universe 26 号日本語版の公開
- インテルのハイパフォーマンス・ライブラリーにより MeritData 社が Tempo* ビッグデータ・プラットフォームをスピードアップ
- データ解析およびマシンラーニング向けパフォーマンス・ライブラリー
- 電光石火の R マシンラーニング・アルゴリズム
- マシンラーニングにおける Python* パフォーマンスの壁を乗り越える
- ビッグデータ解析とマシンラーニングの有効利用
- 京都大学における GPU を超える CPU の優れたパフォーマンスの検証
- インテル® DAAL とは?
- インテル® DAAL を使用した分散処理の概要
- インテル® DAAL を使用したオンライン処理の概要
- インテル® DAAL for OS X* 入門ガイド
- インテル® DAAL for Linux* 入門ガイド
- Java* アプリケーションでインテル® DAAL を使用する方法
- C++ アプリケーションとインテル® DAAL のリンク方法
- インテル® DAAL チュートリアル: 簡単な C++ 例の使用
- インテル® Xeon® プロセッサー E5 ファミリー・ベースのマルチノード分散メモリーシステム上の Caffe* 学習
- インテル® Xeon® プロセッサー E5 ファミリー上でのシングルノード Caffe* スコアと学習
- インテル® DAAL の無料オプション、サポートなし、ロイヤルティー・フリー
リソース
サポート
-
コミュニティーに問い合わせ
Forums (英語) からほかのユーザーやエキスパートに問い合わせできます。
-
インテル社の製品サポートに英語で問い合わせ
Online Service Center (英語) ではインテル社のサポートチームにお問い合わせいただけます。
-
エクセルソフト社の技術サポートに日本語で問い合わせ
ユーザー登録完了後、技術サポート受付フォームよりお問い合わせください。
ドキュメント
- 導入ガイド (英語)
- インテル® oneDAL ドキュメント (英語)
- インテル® oneDAL リリースノート (英語)
サンプル
- daal4py Hello World (英語)
- 分散線形回帰のトレーニングと予測 (英語)
- 分散 K 平均法のトレーニングと予測 (英語)
- C++ サンプル (英語)
- DPC++ サンプル (英語)
- daal4py サンプル (英語)
- daal4py GPU サンプル
https://github.com/intel/scikit-learn-intelex/tree/master/examples/daal4py/sycl - JAVA* サンプル (https://github.com/oneapi-src/oneDAL/tree/master/examples/daal/java)
- Spark* サンプル (https://github.com/oneapi-src/oneDAL/tree/master/samples/daal/scala/spark)
- GitHub* 上のすべてのサンプル (英語)
FAQ
よくある問い合わせ
-
インテル® DAAL は、Windows*、Linux* および OS X* 向けの C++ と Java* ライブラリーであり、マシンラーニングを含むビッグデータ解析をアクセラレートします。これは、データを情報に変換する最適化された関数を提供することで実現されます。既存の開発環境に簡単に組み込むことができます。
-
簡潔に答えると、それはパフォーマンスのためです。多くのデータ解析タスクは演算集約型です。インテル® DAAL は、今日のそして将来のプロセッサーから高いパフォーマンスを引き出すように最適化されています。
-
インテル® DAAL はビックデータのエコシステムにどのように貢献しますか?
インテル® DAAL は、データ解析パイプラインのすべてのステージに注目: 前処理、変換、解析、モデル化、検証および意思決定。製品ページにある、”インテル® DAAL はビックデータのエコシステムに最適” の図ご覧ください。
-
インテル® DAAL は、基本的な記述分析からより高度なデータマイニングやマシンラーニングまで、豊富なアルゴリズムを提供します。
-
EULA のライセンス契約をご覧ください。インテル® DAAL のコピー数は、完全なインテル® DAAL 開発ツールのファイルセットを必要とするコンパイルとリンクを行うビルドマシンの数だけでなく、インテル® DAAL を使用してコードを記述、コンパイル、およびテストを行う開発者数分のライセンスが必要です。使用許諾契約はオンラインで公開されています。
-
インテル® DAAL とインテル® MKL の違いは何ですか?
主な違いを以下に示します。
- インテル® MKL は、処理するデータ全体がメモリーに収まる場合に有用です。インテル® DAAL は、データが一度にメモリーに収まりきらない状況でも処理できます。インテル® DAAL は、アプリケーションがデータの一部分をチャンクとして処理し、最後に最終結果を取得することを可能にします。
- インテル® MKL は、Fortran と C API をサポートします。インテル® DAAL は、C++ と Java* API をサポートします。
- インテル® MKL を使用する場合、アプリケーションはデータの管理 (データソースに接続し読み取る) にほかのツールやライブラリーを必要とします。インテル® DAAL は、データ管理機能を持っています。アプリケーションは、各種ソース (ファイル、インメモリー・バッファー、SQL データベース、HDFS など) に直接アクセスできます。
- いくつかのアルゴリズム (行列分解、低次モーメント、分位など) は、インテル® MKL にもあります。
-
すべての計算カーネルは C++ で実装されています。しかし、インテル® DAAL は C++ 実装のラッパーとして Java* API を提供します。Java* インターフェイスは、JNI (Java Native Interface) を通して C++ カーネルを呼び出します。インテル® DAAL を利用する開発者は、JNI コードを記述する必要はありません。すべてインテル® DAAL で行われます。
-
インテル® DAAL は、次の 3 つの処理モデルを提供します。
- バッチ処理 – すべてのデータが単一ノードのメモリーに収まる場合。インテル® DAAL 関数は、一度にすべてのデータを処理します。
- オンライン処理 – 別名ストリーミング。すべてのデータがメモリーに収まりきらない、もしくはデータが小分けして提供される場合。インテル® DAAL は、個別のデータチャンクを処理し、最終ステージですべての部分的な結果を結合することができます。
- 分散処理 – インテル® DAAL は、Map-Reduce に似たモデルをサポートしています。クラスターのスレーブがローカルデータを処理し (map ステージ)、その後マスターがスレーブから部分データを収集および結合します (reduce ステージ)。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。