インテル Parallel Universe マガジンの最新号が公開されました。
注目記事: OpenVINO™ ツールキットと FPGA
掲載記事
- インテル® ソフトウェア・ツールにおける浮動小数点結果の再現性
- C++ メモリー割り当てライブラリーの比較
- LIBXSMM: インテルのハードウェアとソフトウェア開発にインスピレーションを与えるオープンソース・プロジェクト
- ECHO-3DHPC による天体物理シミュレーションのパフォーマンスを向上
- システム・パフォーマンスを理解するためのガイド
編集者からのメッセージ
OpenVINO™ ツールキットを利用したエッジツークラウドのヘテロジニアス並列処理
前号では、以前は来るべきヘテロジニアス並列コンピューティング時代に不安を感じていたことを述べました。通常の並列処理でさえ十分に複雑です。同時操作を異なるプロセッサー・アーキテクチャーに分散することは、私のプログラミング能力を超えるレベルの複雑さになるでしょう。幸いにも、2006 年にカリフォルニア大学バークレー校の並列コンピューティング研究所が予測したように、複雑さが増すことでドメイン・エキスパートとチューニング・エキスパートの間の課題の分業はさらに大きくなるでしょう。(詳細は、「並列コンピューティング研究の展望: バークレーの見識」 (英語) を参照してください。) 例えば、私は科学ドメインで高速フーリエ変換 (FFT) を利用する方法は分かりますが、自分で FFT を記述しようとは思いません。なぜならば、すでに専門家によって記述されたライブラリーを利用することで、彼らの専門知識を活用できるからです。
このことを念頭に置いて、我々の名誉編集長である James Reinders は、今号でも FPGA プログラミング・シリーズの 1 つとして、インテルの新しい OpenVINO™ ツールキット (英語) を使用してヘテロジニアス並列処理を行う方法を紹介しています (OpenVINO™ は、Open Visual Inference and Neural network Optimization―オープン・ビジュアル・インファレンスとニューラル・ネットワークの最適化―の略です)。「OpenVINO™ ツールキットと FPGA」では、エッジデバイスからクラウドやデータセンターまで、FPGA を含む幅広いプロセッサー・アーキテクチャーにおいて、このツールキットを使用してコンピューター・ビジョンをアプリケーションに組み込む方法を紹介します。OpenVINO™ ツールキットは、コンピューター・ビジョンとハードウェア・エキスパートの専門知識をカプセル化して、アプリケーション開発者が利用できるようにします。(私は最近、インテル® スレッディング・ビルディング・ブロック (インテル® TBB) について James にインタビューする機会がありました。インテル® TBB の並列抽象化によりアプリケーション開発者と並列ランタイム開発者の間の課題が明確になり、インテル® TBB のフローグラフ API によりヘテロジニアス並列処理を実現する方法について議論しました。このインタビューは、Tech.Decoded (英語) でご覧いただけます。)
今号のほかの記事では、ハードウェア/ ソフトウェア・スタックを下層から上層へ徐々に移動していきます。「インテル® ソフトウェア・ツールにおける浮動小数点結果の再現性」では、バイナリー浮動小数点表現の不正確さと、インテル® コンパイラーとパフォーマンス・ライブラリーを使用してそれに対応する方法を述べます。「C++ メモリー割り当てライブラリーの比較」は、タイトルが示すとおりです。2 つのベンチマークでさまざまなC++ メモリー割り当てライブラリーを比較して、インテル® VTune™ Amplifier でプロファイルの詳細を調査し、主なパフォーマンスの相違点を説明します。スタックをさらに上層へと進み、「LIBXSMM: インテルのハードウェアとソフトウェア開発にインスピレーションを与えるオープンソース・プロジェクト」では、ハイパフォーマンスな小行列乗算向けの研究ツールでもあり、JIT コード・ジェネレーターでもあるライブラリーを紹介します。小行列乗算は、畳み込みニューラル・ネットワークやその他多くのアルゴリズムで重要な計算カーネルです。
ハードウェア/ ソフトウェア・スタックのアプリケーション・レベルの記事「ECHO-3DHPC による天体物理シミュレーションのパフォーマンスを向上」では、フランス原子力庁 (CEA) サクレー研究所とドイツのライプニッツ研究センター (LRZ) の協力者が、インテル® Parallel Studio XE を使用して重要なアプリケーションの 1 つを最適化した方法を紹介します。最後に、スタックの最上位の記事「システム・パフォーマンスを理解するためのガイド」では、インテル® VTune™ Amplifier の技術プレビュー機能であるプラットフォーム・プロファイラーの概要を示します。名前のとおり、プラットフォーム・プロファイラーは、プラットフォーム全体をモニタリングして、パフォーマンスに影響するシステム構成問題の診断を支援します。
今後の The Parallel Universe では、Python* による並列コンピューティング、大規模な分散データ解析に対する新しいアプローチ、インテル® ソフトウェア・ツールの新機能に関する記事をお届けします。コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムとIoT 開発向けのインテルのソリューションの詳細は、Tech.Decoded (英語) を参照してください。