インテル Parallel Universe マガジンの最新号が公開されました。
注目記事: CPU 上でのマシンラーニング/ ディープラーニング・プロジェクトの効率的な訓練と実行
掲載記事
- Numba を使用した Python* での並列処理
- グラフ解析ワークロードのパフォーマンスの向上
- ベクトル化の効率を把握する
- PIC コードのベクトル化によるパフォーマンスの向上
- インテル® MPI ライブラリーのマルチ EP によりハイブリッド・アプリケーションのパフォーマンスを向上
- システムと IoT アプリケーションの革新
編集者からのメッセージ
エクサスケール・コンピューティングの時代
皆さんはすでにご存知かもしれませんが、私は HPC を好きで選んだのではなく、やむを得ず選んだ人間です。ハイパフォーマンス・コンピューティング (HPC) には、一般に 2 つの意味があります。1 つには、単にアプリケーション・パフォーマンスの向上を意味します。例えば、コンパイラー・チームの一部のメンバーは 5% のスピードアップを HPC と呼んでいます。彼らの世界ではこれで正解です。ただし、私の世界では、HPC とは数十万、数百万のコアを利用して桁違いのスピードアップを得る大規模コンピューティングを意味します。(TOP500 (英語) をイメージしてみてください。)
そのため私は、先月発表された、インテルがアルゴンヌ国立研究所に Aurora スーパーコンピューターを納入するというニュースを聞いて大いに興奮しています(詳細は、「米国エネルギー省とインテルが米国初のエクサスケール・スーパーコンピューターを実現」 (https://newsroom.intel.com/news-releases/u-s-department-energy-intel-deliver-first-exascale-supercomputer/#gs.2qchq9) を参照)。Aurora はエクサ FLOPS パフォーマンス (1 秒間に 100 京回(1018 回) の浮動小数点演算が可能) を達成すると期待されています。エクサスケール・システムは、前号の The Parallel Universe で述べたように、集中型のワークフローには不可欠です。
この号の 3 つの記事では、エクサスケール・システムの登場を待ち望んでいる最適化を取り上げます。プリンストン・プラズマ物理研究所は、エクサスケール・システムを活用する科学の研究を行っています。「PIC コードのベクトル化によるパフォーマンスの向上」では、クリティカルなアルゴリズムの 1 つを微調整する方法を説明します。「ベクトル化の効率を把握する」では、インテル® Advisor により提供される情報の活用方法を示します。「インテル® MPI ライブラリーのマルチ EP によりハイブリッド・アプリケーションのパフォーマンスを向上」では、メッセージパッシングとマルチスレッドを組み合わせたアプリケーションのスケーラビリティーを高める方法を紹介します。
HPC 関連以外にも、さまざまな分野の記事が用意されています。注目記事「CPU 上でのマシンラーニング/ディープラーニング・プロジェクトの効率的な訓練と実行」では、ディープ・ニューラル・ネットワーク向けインテル® マス・カーネル・ライブラリー (インテル® MKL-DNN) (英語) を使用して AI フレームワークを高速化する方法を説明します。データ・サイエンティスト向けに、2 つの記事「Numba を使用した Python* での並列処理」および「グラフ解析ワークロードのパフォーマンスの向上」も用意しました。前者は、Numba コンパイラーを使用して Python* 数値カーネルのパフォーマンスを大幅に向上するための実践的なアドバイスを提供します。また後者は、グラフ解析の一般的なベンチマークである GAP ベンチマーク・スイート (英語) の解析を説明します。
この号の最後の記事「システムと IoT アプリケーションの革新」では、インテル® System Studio のさまざまな解析ツールを説明します。
以前からお伝えしているように、コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムと IoT 開発向けのソリューションの詳細については、インテルの開発者向けのナレッジハブ、Tech.Decoded (英語) を参照してください。