この記事は、インテル® デベロッパー・ゾーンに公開されている「INTEL® XEON® SCALABLE PROCESSORS DELIVER A BIG BOOST IN SIMULATION PERFORMANCE」(https://software.intel.com/en-us/blogs/2017/11/06/intel-xeon-scalable-processors-deliver-a-big-boost-in-simulation-performance) の日本語参考訳です。
インテル® Xeon® Gold 6148 プロセッサーを採用した ANSYS* Fluent* 18.2 が複雑な製造シミュレーションを次のレベルへ向上
エンジニアと設計者は、より詳細なデータ、より多くの変数、高精度、結果取得までの時間短縮など、常により優れたシミュレーション・テクノロジーを求めています。インテルとエンジニアリング・シミュレーション・ソフトウェアのプロバイダーである ANSYS* は、コラボレーションによりパフォーマンスにおいて大きな飛躍を遂げました。
インテル® Xeon® スケーラブル・プロセッサーの 1 つである、インテル® Xeon® Gold 6148 プロセッサーは、前世代のプロセッサーと比較して、ANSYS* Fluent* 18.1 のパフォーマンスを最大 41% 向上しました。また、コアあたりのパフォーマンスが最大 34% 向上1 したことで、ライセンス費用の軽減につながります。
ANSYS* の HPC およびクラウド・アライアンス・ディレクターの Wim Slagter 博士は次のように述べています。「ANSYS* は、ソフトウェアとハードウェアの改良が確実に進むように、インテルとチームを組みました。最新の ANSYS* Fluent* 18.1 とインテル® Xeon® Gold 6148 プロセッサーの組み合わせは、エンジニアリングの生産性を向上したいと考えている顧客にとって、全体的なパフォーマンスを大幅に向上できることの証です。」
ANSYS* Fluent* は、自動車、航空宇宙、学術機関、石油・ガス、海洋、F1 レースを含むさまざまな分野で広く使用されている、計算流体力学 (CFD) ツールであり、マルチフィジックス・ソルバーです。典型的なワークロードのサイズは、200 万~5 億セルです。
改良されたプロセッサーによる優れたシミュレーション
インテル® Xeon® Gold 6148 プロセッサーは、前世代のインテル® Xeon® プロセッサー E5 v4 ファミリーと比較して、コア数とメモリー帯域幅が向上し、キャッシュ構造が改善されています。インテルは ANSYS* と協力して、新しいハードウェア機能向けに Fluent* 18.1 製品の最適化に取り組みました。追加の処理能力により、実際のシミュレーションで大幅なパフォーマンス・ゲインを実現できるように、インテル® ソフトウェア開発製品を利用しました。
最適化作業では、インテル® Xeon® プロセッサーの高度なベクトル処理機能を利用して、ソルバーコードのベクトル化を改善することに注目しました。新しいプロセッサーでパフォーマンスを確認するため、異なる業界向けの多種多様なモデルと 200 万~ 3300 万セルを使用してベンチマーク・テストを実行しました。3 つのベンチマークでは、インテル® Xeon® Gold 6148 プロセッサー・ベースの 2 ソケットのサーバーは、第 4 世代インテル® Xeon® プロセッサー E5-2697 v4 ベースのサーバーと比較して、ANSYS* Fluent* のパフォーマンスが最大で 41% 向上1 し、同等の第 3 世代インテル® Xeon® プロセッサー E5-2698 v3 ベースのサーバーとの比較では最大 60% 向上1 しました。
インテル® Xeon® Gold 6148 プロセッサー向けに最適化された ANSYS* Fluent* 18.1 の詳細
https://www.intel.com/content/www/us/en/processors/xeon/scalable/software-solutions/ansys-hpc-fluent.html
インテルとの協業プロセスの紹介ビデオ「ANSYS* が複雑なエンジニアリング・シミュレーションを次のレベルへ向上」(https://www.intel.com/content/www/us/en/processors/xeon/scalable/software-solutions/ansys-hpc-fluent.html)
インテル® Xeon® Gold 6148 プロセッサーが ANSYS* Fluent* 18.1 のパフォーマンスを向上した方法 (英語)
インテル® HPC Developer Conference のスポンサーとして、ANSYS* は 2017 年 11 月 11 日にコロラド州デンバーで開催された同イベントにて本件に関するプレゼンテーションを行いました。
1 出典: 2017 年 3 月に実施したインテル社内での測定値。
ベースライン (第 3 世代): 2x インテル® Xeon® プロセッサー E5-2698 v3 (16 コア、2.30GHz)、合計 128GB メモリー (8x 16GB @ 2133MT/秒 DDR4)、Red Hat* Enterprise Linux* 7.3。
第 4 世代: 2x インテル® Xeon® プロセッサー E5-2697 v4 (18 コア、2.30GHz)、合計 128GB メモリー (8x 16GB @ 2400MT/秒 DDR4)、Red Hat* Enterprise Linux* 7.3。
最新世代: 2x インテル® Xeon® Gold 6148 プロセッサー (20 コア、2.40GHz)、合計 192 GB メモリー (12x 16GB @ 2666MT/秒 DDR4)、Red Hat* Enterprise Linux* 7.3。
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。