インテル Parallel Universe マガジンの最新号 (英語) が公開されました。
注目記事: ダイレクト・メモリー・アクセスの先へ: インテル® データ・ストリーミング・アクセラレーターによるデータセンター・コストの削減
掲載記事
- 並列標準を洗練する: 多様性、アライメント、相互作用
- 堀のある AI から責任ある AI へ
- 独自のカスタム・チャットボットの作成
- Hugging Face* と oneAPI を使用した Falcon の 70 億パラメーター・モデルの微調整
- Fortran の DO CONCURRENT を使用したアクセラレーター・オフロード
- 高帯域幅メモリーを搭載したインテル・プロセッサーのパフォーマンス最適化
編集者からのメッセージ
オープン性、持続可能性 (サステナビリティー)、そして生成 AI モデルのカンブリア爆発
前号の発行後に、2 つのニュースが AI コミュニティーに波紋を引き起こしました。1 つ目は、「生成 AI に立ちはだかるコンピューティングとサステナビリティーの課題に取り組む」に関するインテルと Hugging Face との談話です。
この談話では、特に生成 AI の民主化が The Model Hub (英語) の事前トレーニング済みモデルの爆発的な増加につながった経緯について議論されました。2 つ目は、リークされた Google の内部メモ「We Have No Moat, And Neither Does OpenAI」 (英語) です。このメモでは、小さく、速く、安価で、カスタマイズ可能なオープンソース AI にクローズドモデルは勝てないと分析されています。
本号では、これらのニュースに関連する記事を 3 つ取り上げています。1 つ目の Huma Abidi (AI ソフトウェア製品ジェネラル・マネージャー兼シニア・ディレクター) と Haihao Shen (AI ソフトウェア・アーキテクト) による寄稿記事「堀のある AI から責任ある AI へ」では、シリコンバレーで流行した表現を用いた AI における「堀」について言及します。2 つ目の「独自のカスタム・チャットボットの作成」では、オープンなモデルと簡単に入手できるハードウェアを使用して、カスタマイズされた高性能チャットボットを構築する方法を示します。3 つ目の「Hugging Face* と oneAPI を使用した Falcon の 70 億パラメーター・モデルの微調整」では、インテル® アドバンスト・マトリクス・エクステンション (インテル® AMX) を搭載したインテル® Xeon® プロセッサー上で別のオープンソースの大規模言語モデルを最適化する方法を紹介します。
注目記事「ダイレクト・メモリー・アクセスの先へ: インテル® データ・ストリーミング・アクセラレーターによるデータセンター・コストの削減」では、データ変換にオンチップ・アクセラレーションを活用するコード例とアドバイスを提供します。インテル® データ・ストリーミング・アクセラレーターは、第 4 世代インテル® Xeon® スケーラブル・プロセッサーの新しい機能です。
SYCL* の事例 (The Parallel Universe 51 号) では、ヘテロジニアス・コンピューティングに関する ISO C++ の制限について説明しました。本号の 2 つ目の寄稿記事「並列標準を洗練する」では、John Pennycook (ソフトウェア・イネーブリング & 最適化アーキテクト) が将来の C++ 言語の概念で SYCL* を調整するプロセスを説明します。
私が計算科学に携わった最初の 15 年間、数式 (FORmula) をコードに変換 (TRANslate) する必要がある場合は、ほとんどの作業を Fortran で行っていました。15 年間の Fortran と言えば、ロスアラモス国立研究所の最近のレポート「今後 15 年間にミッション・クリティカルなコードを Fortran に依存することのリスクの評価」 (英語) は非常に興味深いものでした。ヘテロジニアス並列処理のサポートはリスク要因の 1 つであるため、Ron Green (コンパイラー・エンジニアリング・マネージャーで Fortran の愛好家) とともに、「Fortran の DO CONCURRENT を使用したアクセラレーター・オフロード」を執筆しました。この記事は言語の機能に注目したものです。現在、CPU と GPU 上の DO CONCURRENT のパフォーマンスを分析する続編の記事に取り組んでいます。ご期待ください。
最後に、インテル® Xeon® CPU マックス・シリーズでのパフォーマンス・チューニングの詳細を説明した記事「高帯域幅メモリーを搭載したインテル・プロセッサーのパフォーマンス最適化」で本号を締めくくります。
コードの現代化、ビジュアル・コンピューティング、データセンターとクラウド・コンピューティング、データサイエンス、システムと IoT 開発、oneAPI を利用したヘテロジニアス並列コンピューティング向けのインテル・ソリューションの詳細は、Tech.Decoded (英語) を参照してください。
Henry A. Gabb
2023年7月