インテル® ソフトウェア開発ツール最新情報

インテル® oneAPI

この記事は、インテル® デベロッパー・ゾーンに公開されている「Intel® Software News Updates」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


2025年

より高速な AI、リアルタイム・グラフィックス、よりスマートな HPC: インテル® ソフトウェア開発ツール 2025.1 リリース!

2025年03月26日 | インテル® ソフトウェア開発ツール | AI フレームワークとツール (英語)

インテルの最新世代の AI ツールとフレームワーク、およびインテル® oneAPI ツールキット 2025.1 がリリースされました。開発者が AI と HPC をより迅速かつ自信を持って作成できるように支援が強化されています。

ソフトウェア・プロジェクト全体でパフォーマンス、生産性、コード品質をターボチャージ

  • インテル® Xeon® 6 プロセッサー向けの最新の最適化 (英語)、インテル® oneAPI ディープ・ニューラル・ネットワーク・ライブラリー (インテル® oneDNN) を使用した AI 推論とトレーニングの高速化、インテル® Core™ Ultra プロセッサーでのディープラーニング推論パフォーマンスのプロファイルから、最新の貢献やインテル® プロセッサー上での PyTorch による FlexAttention サポートまで、最新リリースはすべてをカバーしています。

  • リアルタイム・グラフィックス、ビジュアル AI、レンダリング・パフォーマンスにおいて、Vulkan および Microsoft DirectX 12 との SYCL 相互運用性が強化されました。

  • サニタイザーと拡張されたコードカバレッジにより、CPU と GPU で実行される計算カーネルのコード品質を保証します。LLVM ベースのコンパイラー・テクノロジーにより、最新の C/C++、Fortran、SYCL、OpenMP をサポートしています。

  • 新しいインテル® SHMEM ライブラリーにより、大規模なデータセット計算向けのマルチノード分散構成で GPU による通信の効率を向上できます。

  • oneAPI をベースとしたこれらの広範な分野に対応したツール、ライブラリー、および一般的なフレームワークを組み合わせることで、プログラミングとワークロードのニーズを満たすことができます。

詳細情報とダウンロード

AI ソリューション:
AI フレームワークとツール (英語) | AI ツールセレクター (英語)

汎用計算ソリューション:
インテル® oneAPI の概要 | インテル® ソフトウェア開発ツール

データセンターから PC まで AI パフォーマンスを最適化

最新のインテルの CPU および GPU プラットフォームで PyTorch 2.6 (英語) およびその他の主要なディープラーニング・フレームワークを使用して大幅なパフォーマンス向上を実現します。

  • インテル® Core™ Ultra AI PC およびインテル® Arc™ ディスクリート・グラフィックス上で PyTorch モデルをファイン・チューニング、推論、開発したい開発者や研究者は、Windows、Linux、Windows Subsystem for Linux 2 向けのバイナリーリリースを使用して PyTorch を直接インストールできるようになりました。

  • TorchInductor CPP バックエンドを通じて X86 CPU の FlexAttention サポートが追加されました。これにより、CPU のパフォーマンスを最適化する既存の FlexAttention API に基づいて、現在の CPP テンプレートの機能が拡張され、幅広いアテンション・バリアント (LLM 推論に不可欠な PageAttention など) がサポートされます。

  • x86 CPU での Float16 サポートは、PyTorch 2.5 でプロトタイプ機能として初めて導入されました。現在、Eager モードと Torch.compile および Inductor モードの両方でさらに改良され、り広く採用されるようにベータ版がリリースされています。

ディープラーニング推論向けのインテル® oneDNN (英語) の最適化により最新のインテル® プロセッサーを活用できます。

  • インテル® アドバンスト・マトリクス・エクステンション (インテル® AMX) 命令セットを搭載したインテル® Xeon® プロセッサー・アーキテクチャーのパワーを活用し、インテル® oneDNN により強化された行列乗算と畳み込みのパフォーマンスを体験できます。

  • インテル® Arc™ グラフィックス上の AI アプリケーションのパフォーマンスが向上し、インテル® Core™ Ultra プロセッサー (シリーズ 2) とインテル® Arc™ B シリーズ・ディスクリート・グラフィックスの機能が最大限に活用されます。

  • 暗黙的なカジュアルマスクを使用して、ゲート付き多層パーセプトロン (ゲート付き MLP) と SDPA (Scaled Dot-Product Attention) の速度と効率の両方を向上させ、インテル® oneDNN Graph API を通じて int8 または int4 圧縮キーと値をサポートすることで、AI モデルをさらに最適化します。

インテル® VTune™ プロファイラーを使用して、AI PC のパフォーマンス・ボトルネックを解消し、分散型ディープラーニング・ワークロードを効率化します。

  • DirectML または WinML API を呼び出す AI ワークロードのパフォーマンス・ボトルネックを特定します。

  • 分散型ディープラーニングと Python ワークロードの解析を改良し、Python 3.12 で最も時間のかかるコード領域とクリティカルなコードパスを特定します。

C++ with SYCL を使用して、ゲーム、グラフィックス、デジタルコンテンツ向けのリアルタイム・ビジュアル AI エクスペリエンスを提供

  • インテル® oneAPI DPC++/C++ コンパイラーとインテル® DPC++ 互換性ツールは、Vulkan および DirectX12 との SYCL 相互運用性を強化します。

  • これにより、GPU からイメージ・テクスチャー・マップ・データを直接共有できるようになり、CPU と GPU 間の余分なイメージコピーが排除され、イメージ処理と高度なレンダリング・アプリケーションでシームレスなパフォーマンスが確保され、コンテンツ作成の生産性が向上します。

HPC とアクセラレーテッド・コンピューティングのパフォーマンス、生産性、コード品質を向上

インテル® コンパイラーは、コードの安定性、セキュリティー、生産性を向上します。

  • インテル® oneAPI DPC++/C++ コンパイラーインテル® Fortran コンパイラーは、CPU MemorySanitizer のサポートを GPU を含むデバイス側に拡張します。これにより、開発者は CPU とデバイスコードの両方で問題を簡単に検出してトラブルシューティングできるため、より信頼性が高く堅牢なアプリケーションを実現できます。

  • インテル® oneAPI DPC++/C++ コンパイラーは、ビルド時間を大幅に短縮するキャッシュ* をサポートしました。以前のコンパイルをキャッシュして再利用することで、反復処理が高速化し、ワークフローが効率化されます。ビルドに時間をかけずに、高品質のコードの作成に集中できます。

  • インテル® oneAPI DPC++/C++ コンパイラーのコード・カバレッジ・ツールには、C/C++、SYCL、OpenMP を使用するアプリケーション向けの GPU サポートと拡張 CPU カバレッジが追加されました。

  • インテル® Fortran コンパイラーは、スレッド間で作業を効率的に分散する WORKDISTRIBUTE 構造と、ループネスト内のループを並べ替える INTERCHANGE 構造を導入することで、OpenMP 6.0 標準のサポートを拡張し、並列パフォーマンスとコード最適化を向上させます。

  • Fortran 23 のサポートがさらに強化され、標準準拠によってコードの柔軟性が向上し、SYSTEM_CLOCK 組込み関数の整数引数の種類の一貫性が確保され、PUBLIC NAMELIST グループに PRIVATE 変数を含めることができるようになりました。

MPI と新しいインテル® SHMEM ライブラリー (英語) により GPU 開始通信の効率が向上します。

  • ポイントツーポイントのリモート・メモリー・アクセス (RMA) と OpenSHMEM 1.6 ストライド RMA 操作、アトミックメモリー操作 (AMO)、シグナリング、メモリー順序付け、チーム、コレクティブ、同期などの OpenSHMEM 1.5 準拠機能を使用して、マルチノード・アクセラレーター・デバイスとホストをターゲットにできます。

  • 対称ヒープ API を使用したインテル® SHMEM SYCL キュー順序付け RMA、SYCL ホスト USM アクセスにより、分散マルチノード SYCL デバイスアクセスを簡素化します。

  • インテル® MPI ライブラリーは、新しい MPI 標準に先駆けて、サポートされている GPU でデバイス開始 MPI-RMA 機能もサポートしました。

AI フレームワークとツール (英語) | インテル® ソフトウェア開発ツール


2024年

2023年

2022年

2021年

2020年

タイトルとURLをコピーしました