この記事は、インテル® デベロッパー・ゾーンに公開されている「Intel Vectorization Tools」 (https://software.intel.com/en-us/intel-vectorization-tools/) の日本語参考訳です。
ベクトル化はもうひとつの並列性
ムーアの法則では、プロセッサーに集積されるトランジスター数は年々増加すると予測しています。増加したトランジスターは、マルチコアやパフォーマンスを向上するハードウェア拡張など、ハードウェア機能を強化するために使われてきました。インテル® プロセッサーは、インテル® SSE とインテル® AVX/AVX2 による SIMD (single instruction, multiple data) 並列をサポートする拡張を実装しています。 これらの命令は、データのベクトル要素を同時に操作します。ベクトル幅は、同時にアクセスできる要素の数を表しますが、新しいテクノロジーのプロセッサーが発表されるたびに拡張されています。拡張されたベクトル幅を効率よく使用して SIMD 命令の恩恵を得るには、アプリケーションはベクトル化される必要があります。
自動ベクトル化などの技術を利用することで、開発者のコードを非常に簡単にベクトル化することができます。これには、コードを変更する必要はありません。次は、パフォーマンスを改善するためスレッド化とベクトル化の両方を使用できるライブラリーを利用することです。一部のアプリケーションでは、インテル® Cilk™ Plus など特殊なビルドログの利用と機能を含む、より高度な技術がコンパイラーに情報を提供することが求められます。
ベクトル化のコードブックをダウンロードしてください。インテル® コンパイラーとライブラリーによって、アプリケーションの開発に使用できるシンプルでありながら強力なベクトル化技術が紹介されています。ベクトル化のコードブックをご覧になっている方は、下にあるタブのトピックをご覧ください。
ベクトル化のコードブックをダウンロード ›
- 関連記事
- 参考文献 (C/C++)
- 参考文献 (Fortran)
関連記事
関連記事一覧
- oneAPI GPU 最適化ガイド日本語版公開
- パフォーマンス・モニタリング・ユニット (PMU) 対応の Google Cloud* 仮想マシンでのアプリケーションのプロファイル
- PyTorch と Open Platform for Enterprise AI (OPEA) を使用して AI アバター・チャットボットを作成する
~インテル® Xeon® スケーラブル・プロセッサーとインテル® Gaudi® Al アクセラレーターで構築および展開する~ - インテル® DPC++ 互換性ツール・デベロッパー・ガイドおよびリファレンス日本語版公開
- インテル® Tiber™ AI クラウドの Stable Diffusion ワークショップで生成 AI を使ってテキストから画像を作成する
- oneAPI for NVIDIA GPU Windows 版を試してみましょう
- インテル® コンパイラーを利用した高度な OpenMP デバイスオフロード
- インテル® Xeon® プロセッサーのインテル® データ・ダイレクト I/O テクノロジーに関連するアンコア・パフォーマンス・モニタリング・イベントの解析
- インテル® ソフトウェア開発ツール最新情報
- インテル® ソフトウェア開発ツール2025 リリース記念キャンペーン
- 2024年人気記事ランキング
- インテル® Core™ Ultra プロセッサー 200V シリーズでの大規模言語モデルのプロファイル
- インテル® VTune™ プロファイラー・パフォーマンス解析クックブック
- Prediction Guard がインテル® Gaudi® 2 AI アクセラレーターで信頼できる AI を実現した方法
- AI / HPC ソフトウェア開発や運用の最適化について学べるオンライン・イベント『AI + HPC DEVELOPER TECH DAY 2025』参加申込受付
- GPU 上で実行する SYCL* アプリケーションのプロファイル
- インテル® VTune™ プロファイラー・リリースノートと新機能
- インテル® oneAPI プログラミング・ガイド日本語版の公開
- oneAPI for AMD* GPU 2025.0.0 ガイド
- oneAPI for NVIDIA* GPU 2025.0.0 ガイド
- インテル® Tiber™ AI クラウド上での ML ワークロードの構築と開発
- インテル® ソフトウェア開発ツールの最新バージョン 2025 提供開始
- データ並列 Python* アプリケーションのプロファイル
- OpenVINO™ アプリケーションのプロファイル
- インテル® ツールキットとコンパイラーのバージョン対応表
- Codeplay が oneAPI Construction Kit で RISC-V* をサポート
- インテル® Tiber™ AI クラウドで AI に PyTorch* と TensorFlow* を活用する
- インテル® Tiber™ AI クラウドで PyTorch* 2.4 を使って AI ワークロードを高速化
- Linux* で AI 開発キットと OpenVINO™ を使用してリアルタイム人数カウントを行う方法
- Python* と C++ 分析によるシミュレーションと後方伝播の高速化
- パート 2: CUDA* から SYCL* と oneAPI へ AI コードを移行
- パート 2: OpenVINO™ を使用した AI 医療アシスタントのカスタマイズ
- パート 1: OpenVINO™ を使用した AI 医療アシスタントの作成: ヘルスケアの変革
- llama.cpp を使用したインテル® GPU 上での LLM 実行
- 生成 AI の基礎: OpenVINO™ を使用した LLM のデプロイ
- Transformers による GGUF モデルの高速化
- パート 1: CUDA* から SYCL* と oneAPI へ AI コードを移行
- Intel Vision 2024 のエンタープライズ AI アート展
- インテル® Gaudi® 2 AI アクセラレーター上での Prediction Guard のプライバシー保護 LLM プラットフォームのスケーリング
- 低ビットの量子化されたオープン LLM リーダーボード
- インテル® Gaudi® 2 AI アクセラレーターとインテル® Xeon® プロセッサーを使用したコスト効率の高いエンタープライズ RAG アプリケーションの構築
- インテル Parallel Universe 57 号日本語版の公開
- OpenVINO™ ツールキットの重み圧縮を使用して LLM のフットプリントを削減する
- インテル® データ・ストリーミング・アクセラレーターを使用したメモリー帯域幅依存カーネルの高速化
- OpenVINO™ ツールキットを使用して高速で小さな LLM をデプロイする理由と方法
- AI PC により大規模な LLM 開発がデスクトップで可能に
- インテル® Tiber™ デベロッパー・クラウドのチュートリアル: インテル® HLS-Gaudi® 2 AI アクセラレーター・サーバー
- OpenVINO™ 生成 AI API を使用して数行のコードで高速な生成 AI アプリを作成する方法
- SYCL* Graph
- インテル® Fortran コンパイラーの Fortran 言語と OpenMP* 機能
- インテル® Tiber™ デベロッパー・クラウドのガイド: インスタンスの管理
- インテル® Tiber™ デベロッパー・クラウドのガイド: SSH キー
- インテル® C++ コンパイラーが Khronos SYCL* 2020 準拠の最初のコンパイラーに
- シングルノードの Kubernetes* アプリケーションのプロファイル
- トランスフォーマー向けインテル® エクステンションを利用した効率的な自然言語埋め込みモデル
- AI PC で夢を描く
- LangChain が OpenVINO™ を公式にサポート
- インテル® Tiber™ デベロッパー・クラウド対応日本語パッケージ公開記念キャンペーン【当選者発表】
- 金融サービスのリスク計算における oneMKL 乱数ジェネレーター・デバイス API
- インテル Parallel Universe 56 号日本語版の公開
- マシンラーニング・アプリケーションのプロファイル
- インテル® oneAPI DPC++/C++ コンパイラーにおける OpenMP* 機能と拡張のサポート
- OpenVINO™ バックエンドを使用して NVIDIA* Triton Inference Server* でモデルをサービングする方法
- OpenVINO™ 2024.1 の概要: LLM のパフォーマンスの強化とサポートの拡大で生成 AI ワークロードを活用
- 1 時間 (未満) で SYCL* を学ぶ
- ウェブブラウザーで解析結果を表示
- OpenVINO™ を使用した AI PC への Llama3 のデプロイ
- OpenACC* API から OpenMP* API への移行
- OpenVINO™ ノートブック・チームのメンバーからの重要な情報: パート 2
- OpenVINO™ ノートブック・チームのメンバーからの重要な情報: パート 1
- ハイブリッド CPU プラットフォーム向けの Windows* アプリケーションのプロファイル
- AI PC で将来の AI 開発を試す
- Stable Diffusion ControlNet パイプラインを使用して LoRA の重みを有効にする
- インテル® Tiber™ デベロッパー・クラウド対応日本語パッケージ (iSUS 翻訳版) のご案内
- インテル® oneAPI ポーティング・ガイド (ifx) 日本語版 最新版公開
- バイオ医薬品および医薬品開発の分野におけるインテルのエッジ AI テクノロジー
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (46)
- インテル® Xeon® CPU マックス・シリーズの高帯域幅メモリー・パフォーマンスのプロファイル
- HPSC 2024 オンライン講演の参加者限定プレゼント・キャンペーン実施
- 高速な埋め込み: Spark* NLP と OpenVINO™ を使用して大規模で高速な BERT 推論を実現
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (45)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (44)
- インテル® コンパイラーが SYCL* 2020 準拠の最初のコンパイラーに
- OpenVINO™ と NNCF を使用した量子化で Big Transfer (BiT) モデルをさらに高速化
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (43)
- AI/HPC 開発者向け期間限定イベントサイト『HPSC 2024』公開、オンライン講演の申込受付開始!
- タイル・アンサンブル・メカニズムを Anomalib に追加する — GSoC 2023 @ OpenVINO™
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (42)
- アップデート・バージョン 2024.1 で SYCL* 2020 完全準拠の最初のコンパイラーが誕生
- Spack を使用してインテルにより最適化された HPC バイナリーのディストリビューション
- インテル® NPU (インテル® AI ブースト) に対応した最初の AI PC アプリを開発してビルドする方法
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (41)
- 最先端のビジュアル品質検査
- AUPIMO: ビジュアル異常検出ベンチマークの再定義
- ベイズ・ディープラーニングの量子化フレームワーク
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (40)
- パフォーマンス解析用のカスタムデータ収集
- 正しい手法を使用して優れた生成 AI アプリケーションを作成する
- OpenVINO™ 2024.0 の概要: パフォーマンスの強化とサポートの拡張で開発者を支援
- BigDL プライバシー保護マシンラーニングを使用したトラスト TorchServe
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (39)
- インテル Parallel Universe 55 号日本語版の公開
- Unified Acceleration (UXL) Foundation
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (38)
- インテル® TDX と NVIDIA* H100 の TEE をインテル® Trust Authority でシームレスに認証
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (37)
- 我々がどこまで辿り着いたか振り返る
- インテルの新しい組込み AI アクセラレーション・エンジンを使用する
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (36)
- インテル® oneAPI ポーティング・ガイド (icx) 日本語版公開
- oneAPI にとって 2023年は成長と普及の年
- インテル® CPU における高速化された AI の新時代の到来
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (35)
- インテルとマイクロソフトが協力してインテル® Arc™ グラフィックス・ソリューション向けに DirectML を最適化
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (34)
- SYCL* コードのよくある落とし穴を調査
- DirectML によってインテル® ニューラル・プロセシング・ユニットを活用する
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (33)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (32)
- インテル® oneAPI DPC++/C++ コンパイラーでサニタイザーを使用してバグを素早く検出
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (31)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (30)
- インテル® ソフトウェア開発ツール 2024 リリース記念キャンペーン
- CUDA* と oneAPI 間の変換を可能にする SYCL* の相互運用性を深掘り
- Microsoft* Azure* 上にセキュアな Kubeflow* パイプラインを構築
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (29)
- CPU 上での XGBoost、LightGBM、CatBoost 推論の高速化
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (28)
- 釜山大学がインテル® VTune™ プロファイラーを使用して計算流体力学のパフォーマンスを大幅に向上
- PyTorch* を使用して山火事を予測する
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (27)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (26)
- インテル® Arc™ GPU 上の TensorFlow* による転移学習
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (25)
- パート 6: oneAPI ライブラリーを VSCode の C++ プロジェクトにリンクする
- 2023 年人気記事ランキング
- インテル Parallel Universe 54 号日本語版の公開
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (24)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (23)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (22)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (21)
- パート 5: DPC++ と Visual Studio* Code を使用した C++ プロジェクトの SYCL* への移行
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (20)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (19)
- インテル® ソフトウェア開発ツールの最新バージョン 2024 提供開始
- iSUS 夏のプレゼント・キャンペーン 2023【当選者発表】
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (18)
- OpenMP* ターゲットオフロードの事例
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (17)
- パート 4: Ubuntu* で Visual Studio* Code を使用して DPC++ をデバッグ
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (16)
- AI でビジネスを拡大する
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (15)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (14)
- インテルの AI ハードウェアとソフトウェアの最適化を活用して Llama を高速化
- SYCL* パフォーマンス: SYCL* に最適なワークグループ・サイズの選択
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (13)
- ベクトル命令セットの統合: インテル® アドバンスト・ベクトル・エクステンション 10
- 「インテル® アドバンスト・ベクトル・エクステンション 10 アーキテクチャー仕様」からの CPUID 機能列挙の抜粋
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (12)
- インテル® VTune™ プロファイラーを使用してインテル® マックス・シリーズ製品ファミリー上でワークロードを最適化
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (11)
- 11月17日 (金) 開催『OpenVINO™ ツールキット・デベロッパー・カンファレンス』参加申込受付開始
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (10)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (9)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (8)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (7)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (6)
- 転移学習は魔法か、それとも特殊能力か?
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (5)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (4)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (3)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (2)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説 (1)
- oneAPI 1.3 暫定仕様書 Rev. 1 の解説
- NVIDIA* GPU と AMD* GPU の SYCL* パフォーマンスはネイティブシステム言語に匹敵
- 高帯域幅メモリーを搭載したインテル・プロセッサーのパフォーマンス最適化
- Fortran の DO CONCURRENT を使用したアクセラレーター・オフロード
- インテル® DPC++ 互換性ツール (インテル® DPCT) セルフガイド Jupyter* Notebook チュートリアル
- CUDA* から SYCL* への移行ワークフロー
- インテル® DPC++ 互換性ツール (インテル® DPCT) 導入ガイド
- Hugging Face* と oneAPI を使用した Falcon の 70 億パラメーター・モデルの微調整
- 開発者の演習 | 何でもセグメント化して定量的に高速化
- インテル® Xeon® CPU マックス・シリーズの設定およびチューニング・ガイド
- インテル Parallel Universe 53 号日本語版の公開
- ダイレクト・メモリー・アクセスの先へ: インテル® データ・ストリーミング・アクセラレーターによるデータセンター・コストの削減
- AIxBoard で OpenVINO™ を使用して YOLOv8 物体検出モデルを高速化する
- 独自のカスタム・チャットボットの作成
- OpenVINO™ を使用したモデル最適化のための合成データ生成 DL モデルのトレーニング – パート 2
- 堀のある AI から責任ある AI へ
- インテル® Xe グラフィックス製品の GPU アーキテクチャー用語
- 並列標準を洗練する: 多様性、アライメント、相互作用
- OpenVINO™ を使用したモデル最適化のための合成データ生成 DL モデルのトレーニング – パート 1
- インテル® C++ コンパイラーでサポートされる C++23 の機能
- AI を活用して食品の無駄な廃棄を減らす
- インテル® End-to-End AI Optimization Kit による人工知能の高速化
- OpenVINO™ を使用してクラウドのトレーニング済みモデルのパフォーマンスを最大限に引き出す
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー上の DPDK およびインテル® データ・ストリーミング・アクセラレーターを使用した Open vSwitch* (OvS*) のチューニング ガイド
- 電柱の保守予測を最適化してサービス品質を向上
- AI と OpenVINO™ を使用して恐竜の骨を発掘する
- インテル® プロセッサーにおける Transformer モデル推論の最適化
- oneAPI DPC++ 導入ガイド
- インテルの GPU を使用して YOLOv8 で 1000fps 越えを達成するには
- ユーザーカーネルの融合
- エンタープライズ規模でのサプライチェーン最適化
- OpenVINO™ 2022.3 LTS リリースについて知っておくべき 6 つのこと
- インテル Parallel Universe 52 号日本語版の公開
- AI による 3D アスリート追跡
- 新製品 oneAPI Construction Kit の概要
- 不均衡なデータセットの不具合を検出する方法
- OpenVINO™ を使用してインテル® GPU で Stable Diffusion を実行する方法
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー上でのメディア処理の基本チューニング・ガイド
- oneMKL と OpenMP* ターゲットオフロードで線形システムを解く
- レベルゼロとは
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー上での AI のチューニング・ガイド
- SYCL* によるデバイス検出
- Fortran と OpenMP* でヘテロジニアス・プログラミングの課題を解決
- パート 3: Ubuntu* で SYCL* 開発向けに oneAPI、DPC++、Visual Studio* Code を設定
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー上で OLTP 向けに SQL Server* をチューニング
- パート 2: Ubuntu* で C++ 開発向けに Visual Studio* Code を設定
- 期間限定イベントサイト『HPSC 2023』公開、オンライン講演の申込受付開始!
- 第 4 世代インテル® Xeon® スケーラブル・プロセッサー上で OLAP 向けに SQL Server* をチューニング
- パート 1: DPC++ と Visual Studio* Code で SYCL* コードをデバッグ
- インテル® oneAPI ツールキット 2023 における DPC++ ランタイム環境変数
- 薬の良し悪しを見分ける
- インテル® oneAPI ツール最新バージョン 2023.1 の変更点
- インテル® oneAPI ツールキット 2023.1 と oneAPI for NVIDIA*/AMD GPU プラグイン 2023.1 の改善
- ACM RecSys Challenge 2022 のインテル® SIHG4SR ソリューション
- リモートユーザーとして Java* アプリケーションをプロファイルする
- エディバラ大学学生フォーミュラ・チームの CUDA* から SYCL* への旅
- インテル® Advisor クックブック
- GPU ルーフラインで SYCL* アプリケーションを解析
- GPU に移植した C++ アプリケーションのパフォーマンスをモデル化
- Fortran、oneMKL、OpenMP*を使用して LU 因数分解を高速化
- 異なる GPU デバイスの GPU アプリケーション・パフォーマンスをモデル化
- DPEcho: 2020 年代以降の SYCL* による一般相対論
- SYCL* を使用した群衆のシミュレーション
- Unreal Engine* でビルドしたゲームのプロファイル
- C++ Thrust アプリケーションを SYCL* と oneAPI DPC++ ライブラリー (oneDPL) へ移行する
- インテル® Arc™ GPU で TensorFlow* Stable Diffusion を実行する
- インテル Parallel Universe 51 号日本語版の公開
- Unity* でビルドしたゲームのプロファイル
- SYCL* の事例
- コマンドライン・インターフェイスを使用して GPU 上で実行する SYCL* アプリケーションのパフォーマンスを解析
- FPGA 上での SYCL* アプリケーションのプロファイル
- インテル® Xeon® スケーラブル・プロセッサーでインテル® AVX-512 とインテル® DL ブーストを使用したディープラーニングのチューニング
- 第 3 世代インテル® Xeon® スケーラブル・プロセッサー上での HPC クラスターのチューニング
- oneAPI で NVIDIA と AMD のサポートを実現
- PyTorch* 向けインテル® エクステンションによる PyTorch* の高速化
- インテル® oneDAL でデータ・アナリティクスとマシンラーニングを強化
- インテル® ISPC ユーザーガイド日本語版公開
- インテル® ISPC パフォーマンス・ガイド日本語版公開
- インテル® Xe アーキテクチャー向けインテル® ISPC ユーザーガイド日本語版公開
- ディープラーニング向け Habana* Gaudi2* プロセッサー
- インテル®oneAPI ツールキット最新バージョン 2023 リリース記念セミナーおよびキャンペーン
- SYCL* 2020 仕様日本語版を公開
- ディープラーニング・モデルの最適化を容易に
- oneAPI でアーキテクチャーの壁を越える: ヘテロジニアス・コンピューティングを容易にするライブラリー
- 運用環境でもハイパフォーマンスな AI
- 新年のご挨拶
- DPC++ に関するよくある質問
- インテル Parallel Universe 50 号日本語版の公開
- SYCL* リファレンス日本語版を公開
- インテル® oneAPI ツールキット 2023 バージョンにおけるコンパイラーの更新
- インテル® oneAPI 最新バージョン 2023 販売開始
- インテル® ニューラル・コンプレッサーによる PyTorch* 推論の高速化
- oneAPI DPC++ コンパイラーとランタイムのアーキテクチャー設計
- 2年連続 MLB オールスター “二刀流” 選出記念!iSUS プレゼント・キャンペーン 2022【当選者発表】
- 2022 年人気記事ランキング
- 今すぐ Python* を高速化
- インテル® oneAPI DPC++/C++ コンパイラー (dpcpp) でサポートされている SYCL* 2020 仕様の機能と DPC++ 言語拡張
- 暗号実装における周波数サイドチャネル攻撃のソフトウェア・ガイダンス
- インテル® AI ツールで恐竜を見つける手順
- Docker*、WSL、oneAPI: コンテナー化されたワークロードを最適化する方法
- ソフトウェア AI アクセラレーターで最大 100 倍のパフォーマンス向上を実現
- シングルセル遺伝子解析の高速化
- プレシジョン・メディシンで費用対効果の高いゲノミクスを実現
- インテルのゲーム・チューニング・ツール
- インテル® Xeon® スケーラブル・プロセッサー上での分散トレーニング
- LLVM の OpenMP* サポート、参加方法、FAQ
- SigOpt のインテリジェントな実験プラットフォーム
- インテル® oneAPI 2022.3 リリース
- OpenMP* を意識した最適化
- OpenMP* でグラフィックス・デバイスを選択して実行する
- SYCL* と oneAPI でベンダーへの依存からソフトウェアを解放
- DPC++ と SYCL* でグラフィックス・デバイスを選択して実行する
- インテル® oneAPI DPC++/C++ コンパイラーおよびインテル® Fortran コンパイラー向けの GPU への OpenMP* オフロード導入
- 複数グラフィックス・デバイスでインテル® VTune™ プロファイラーを使用する際の注意点
- インテル Parallel Universe 49 号日本語版の公開
- oneAPI Image Processing Library によるポータブルな高速画像処理
- LLVM の紹介
- LLVM リンク時の最適化設計と実装
- インテル® oneAPI DPC++/C++ コンパイラーのシステム要件
- インテル® C++ コンパイラーでサポートされる C++20 の機能
- クロスプラットフォーム・ソフトウェア開発にツールを活用
- SYCL* プログラムをコンパイルして景品をゲット!インテル® DevCloud for oneAPI お試しキャンペーン
- インテルがコンピューター・グラフィックスの制作にマシンラーニングを採用
- SYCLomatic: 新しい CUDA* から SYCL* へのコード移行ツール
- メタバースにおけるエンゲージメント、フォトリアリズム、オープン性
- HPC クラスターでインテル® VTune™ プロファイラー・サーバーを使用する
- ヤコビ反復法を CUDA* から SYCL* へ移行する
- 多様なハードウェアにおける HPC コードの移植性
- oneDPL による C++ プログラミングの生産性とパフォーマンスの向上
- 開発者が実感する oneAPI の価値
- oneAPI の maxloc リダクション
- ArrayFire* と oneAPI による 2 次元フーリエ相関アルゴリズムの高速化
- インテル® DPC++ 互換性ツールのベスト・プラクティス
- AI アプリケーションの最適化
- インテル® DevCloud for oneAPI 対応日本語パッケージ (iSUS 翻訳版) のご案内
- エンドツーエンドの AI パイプラインの最適化
- インテル Parallel Universe 48 号日本語版の公開
- SYCL* 2020 で追加された 5 つの優れた機能
- NeurIPS 億単位の近似最近傍探索コンテストの優勝作品
- ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2022 参加者限定プレゼント・キャンペーン実施
- マルチプロセッサー・システムにおける NUMA のパフォーマンスへの影響を測定する
- OpenMP* オフロードの最良の事例
- OpenMP* オフロードのチューニング・ガイド
- インテル® Iris® Xe GPU アーキテクチャー
- Ray から Chronos へ
- 期間限定イベントサイト『ハイパフォーマンス・ソフトウェア・カンファレンス・オンライン 2022』公開、オンライン講演の申込受付開始
- フレームグラフを使用して C++ アプリケーションの hotspot の観測性を向上する
- Modin で pandas* のワークフローをスケーリング
- ハイブリッド CPU 解析
- インテル Parallel Universe 47 号日本語版の公開
- Habana* Gaudi* 上での MLPerf* トレーニングの SigOpt を使用したハイパーパラメーター最適化
- SYCL* を使用すべき理由
- oneAPI レベルゼロ・インターフェイスの使用
- ArrayFire* と oneAPI、各種ライブラリー、OpenCL* の相互運用性
- AMD EPYC™ 7xx3 シリーズ向けコンパイラー・オプション一覧
- SYCL* キューに関するトピックの続編
- OpenMP* を使用した効率良いヘテロジニアス並列プログラミング
- SYCL* でヘテロジニアス・プログラミングの課題を解決する
- SYCL* 2020 仕様 (リビジョン 4) 日本語版を公開
- インテルの CPU と GPU 向けの LLVM と GCC のベクトル化
- フレームグラフを使用してホットなコードパスを解析する
- インテル® oneAPI DPC++/C++/Fortran コンパイラー 2022 日本語版ドキュメントの公開
- James Reinders 氏によるインテル® oneAPI 2022 の紹介
- インテル® oneAPI 最新バージョン 2022 リリース記念セミナーおよびキャンペーンのご案内
- インテル® oneAPI レンダリング・ツールキット — 『アベンジャーズ/エンドゲーム』から自動車業界まで
- 新年のご挨拶
- インテル® oneAPI 新バージョン 2022 リリース
- インテル® Advisor チュートリアル: まとめ
- インテル® Advisor チュートリアル: 実際のボトルネックの特定
- OpenMP* 5.2 API シンタックス・クイック・リファレンス・カード
- OpenMP* 5.2 仕様の概略
- 2021 年人気記事ランキング
- インテル® Advisor チュートリアル: 計算能力のボトルネックへの対応
- インテル® Advisor チュートリアル: メモリー帯域幅のボトルネックへの対応
- データ並列 C++ (DPC++) プログラミング・セミナー・シリーズ 2021 ~ インテル® oneAPI によるヘテロジニアス環境への移行方法を紹介 ~
- インテル Parallel Universe 46 号日本語版の公開
- 第 12 世代インテル® Core™ プロセッサー (開発コード名 Alder Lake) パフォーマンス・ハイブリッド・アーキテクチャー向けゲーム開発者ガイドの日本語版を公開
- x86 ハイブリッド・アーキテクチャー向けのソフトウェア最適化ホワイトペーパー日本語版公開
- インテル® Advisor チュートリアル: ルーフライン解析の実行
- インテル® Advisor チュートリアル: Visual Studio* IDE: サンプル・アプリケーションの準備
- インテル® Advisor チュートリアル: スタンドアロン GUI: サンプル・アプリケーションの準備
- コストを考慮したハイパーパラメーター最適化の重要性について
- 【オンデマンド配信中!】開発者向けインテル最新テクノロジー紹介┃インテル・デベロッパー・カンファレンス 2021
- ディープラーニングの推奨システム向けの新しいスケールアウト・トレーニング・ソリューション
- インテル® Advisor チュートリアル: ルーフラインの使用例
- インテル® Advisor チュートリアル: 自動ルーフライン・グラフを使用して最適化の方針を決定
- インテル® oneAPI 2021.4 リリース
- 投機実行のサイドチャネル攻撃
- ロサンゼルス・エンゼルス大谷選手グッズが当たる!iSUS 開設 10 周年記念プレゼント・キャンペーン【当選者発表】
- 第 3 世代インテル® Xeon® スケーラブル・プロセッサー上で優れたマシンラーニング・パフォーマンスを実現
- 市場への新たなルートを開拓する
- HPC と AI をターゲットとする新しいインテル® XPU のイノベーション
- インテル® oneAPI ベース・ツールキットを使用した GPU アプリケーションの最適化
- インテル® C/C++ コンパイラーが LLVM への対応を完了
- SYCL* と C++ を補完する新しいオープンな DPC++ 拡張
- CatBoost マシンラーニング・ライブラリーが 1.47 倍のスピードアップを達成
- インテル Parallel Universe 45 号日本語版の公開
- インテル® Fortran コンパイラー・クラシック – Fortran 言語標準のサポート
- 最小限のコード変更で CPU 上で超高速な Python* データサイエンスと AI パフォーマンスを実現
- BRODA 社の SOBOL 擬似乱数ジェネレーターによる正確でハイパフォーマンスなシミュレーション
- インテル・ハードウェアで最高のパフォーマンスを達成するためインテル・ソフトウェアでアプリケーションを開発する方法
- ヘテロジニアス・プログラミング向けのレベルゼロ API の紹介
- OpenMP* のアクセラレーター・オフロード
- ロサンゼルス・エンゼルス大谷選手グッズが当たる!iSUS 開設 10 周年記念プレゼント・キャンペーン
- インテル® GPU 向けのソフトウェア最適化
- ヘテロジニアスな処理にはデータ並列化が必要: SYCL と DPC++ から始めよう
- データ並列 C++ のリダクション操作のパフォーマンスを解析する
- SYCL* 2020 仕様 (リビジョン 3) ドラフトの日本語版を公開
- ページフォルト
- インテル® VTune™ プロファイラー・サーバーと Visual Studio* Code およびインテル® DevCloud for oneAPI の併用
- セグメント化されたキャッシュ環境におけるキャッシュ関連のレイテンシー問題
- 最新の命令セットを使用して最適化されたポータブルなバイナリーをコンパイルする
- OpenMP* 5.1 API シンタックス・クイック・リファレンス・カード
- DPDK イベント・デバイス・プロファイル
- インテル Parallel Universe 44 号日本語版の公開
- GPU 上で実行する OpenMP* オフロード・アプリケーションのプロファイル
- プロキシーサーバーを介したリモートターゲットのプロファイル
- 1 行のコードを追加するだけでインテルのハードウェア上で推論を高速化
- オープンソースの新しい oneAPI 数学ライブラリー・インターフェイス
- リスが鳥のエサを盗む問題を解決する: インテル® DevCloud for Edge のディープラーニング・ワークベンチを利用した画像分類プロトタイプの作成
- oneAPI を使用して有限差分法を高速化
- テレパソロジーのためのネットワークの最適化と AI 推論の管理
- 銀行業務にパブリッククラウドが欠かせない 5 つの理由
- 新しい働き方には新しいテクノロジーが必要
- インテル® SGX とインテル® DL ブーストによるプライバシーを保護したマシンラーニング
- データ並列 C++ のリダクション操作
- インテル® データ・ダイレクト I/O テクノロジーの効果的な利用
- パフォーマンス異常を見つけるアプリケーションのプロファイル
- Cinema 4D* でリアルな 3D シーンを作成する
- インテル® VTune™ プロファイラーを使用してインテル® GPU 向けにアプリケーションを最適化
- ローレンス・バークレー国立研究所は oneMKL によりヘテロジニアス・コンピューティングを推進
- インテル® Fortran コンパイラー・クラシック 2021.1 およびベータ版インテル® Fortran コンパイラー導入ガイド
- インテル® Fortran コンパイラー・クラシック 2021.1 およびベータ版インテル® Fortran コンパイラー: Windows* での導入ステップ
- インテル® Fortran コンパイラー・クラシック 2021.1 およびベータ版インテル® Fortran コンパイラー: Linux* での導入ステップ
- MPI と DPC++ を使用したハイブリッド並列プログラミング
- SYCL* と DPC++ を始めよう
- リアルタイム 3D 心臓電気生理学シミュレーションのベクトル化を最適化
- ターゲット GPU での C++ アプリケーションのスピードアップを予測
- oneAPI が私をインテルに引き戻した理由
- PMDK アプリケーション・オーバーヘッド
- インテル® TBB アプリケーションのスケジュール・オーバーヘッド
- 低いプロセッサー・コア利用率: OpenMP* シリアル時間
- OpenMP* インバランスとスケジュール・オーバーヘッド
- OS スレッド・マイグレーション
- 非効率な TCP/IP 同期
- 非効率な同期
- 命令キャッシュミス
- 低いポート使用率
- 頻繁な DRAM アクセス
- フォルス・シェアリング
- Linux*、Android*、および QNX* のシステムブート時のプロファイル
- Apptainer* コンテナーでのプロファイル
- Docker* コンテナでのプロファイル
- MPI アプリケーションのプロファイル
- インテルのサンプリング・ドライバーを使用しないハードウェア・プロファイル
- ハードウェアベースの hotspot 解析向けに Hyper-V* 仮想マシンを設定する
- Amazon Web Services* (AWS*) EC2* インスタンス上のアプリケーションのプロファイル
- .NET Core アプリケーションのプロファイル
- CPU と FPGA (インテル® Arria® 10 GX) の相互作用を解析する
- Node.js* の JavaScript* コードのプロファイル
- DPDK アプリケーションの PCIe*トラフィック
- DPDK アプリケーションのコア使用率
- OpenMP* コード解析
- トップダウン・マイクロアーキテクチャー解析法
- コードを GPU にオフロードする
- Demetics 社がインテル® SGX で AI ベースの医療イノベーションを保護
- oneAPI でヘテロジニアス・アーキテクチャー上の DNA ストレージを実現
- インテル® Fortran コンパイラーの OpenMP* サポートに関する日本語ドキュメントを公開
- インテル® oneAPI DPC++/C++ コンパイラー 2021.1 ドキュメントの日本語版を公開
- インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) 2021.1 リリースノート
- インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneMKL) 導入ガイド
- インテル® Advisor 2021 ユーザーガイド日本語版の公開
- DPC++ への Codeplay の貢献により NVIDIA* GPU の SYCL* サポートを提供
- DPC++ または OpenMP* オフロードを使用するヘテロジニアス・プログラムをデバッグするときの課題、ヒント、既知の問題
- インテル Parallel Universe 43 号日本語版の公開
- インテル® Fortran および C++ コンパイラーで実装される OpenMP* 機能の調査
- oneAPI 仕様日本語版の公開
- インテル® oneAPI ツールキットの既知のコンパイラー問題の回避方法
- インテル® DPC++ 互換性ツール 2021.1 入門
- インテル® oneAPI HPC ツールキット (Linux* 版) 導入ガイド
- インテル® oneAPI HPC ツールキット (Windows* 版) 導入ガイド
- インテル® oneAPI DPC++/C++ コンパイラー (Windows* 版) コマンドライン・ヘルプ
- インテル® DPC++ 互換性ツールを使用した CUDA* から DPC++ への移行
- GPU オフロードコードのメモリーとスレッドの正当性解析
- インテル® oneAPI ベース・ツールキット (Linux* 版) 導入ガイド
- インテル® oneAPI ベース・ツールキット (Windows* 版) 導入ガイド
- データ並列 C++ USM サンプルコード
- DPC++ 基礎サンプルコード
- インテルのサンプルを使用して DPC++ を開始する
- 2020 年人気記事ランキング
- インテル® Advisor 導入ガイド
- インテル® VTune™ プロファイラー導入ガイド
- インテル® oneAPI 2021 リリース
- XPU ソフトウェア開発向けの新しいインテル® oneAPI ツールキット
- インテルと Creative Assembly のコラボレーション
- インテル Parallel Universe 42 号日本語版の公開
- マシンラーニング向け線形モデルの高速化
- ベクトル化と SIMD 最適化
- GPU 構成を調査してパフォーマンスを向上する方法
- インテル® Advisor ユーザー向けルーフライン・リソース
- ITT API オープンソース・バージョン
- インテル® VTune™ プロファイラーの新機能
- DPC++ 言語を使用した MPI プログラムのコンパイルと実行
- インテル® MPI ライブラリー 2019 の libfabric
- AWS* のインスタンスで利用可能なインテル® VTune™ プロファイラーの機能
- PageRank の計算に $800,000 も費やす必要はありません
- OpenMP* 5.1 の機能概要
- サンプルコード: インテル® ディープラーニング・ブーストの新しいディープラーニング命令 bfloat16
- Architecture Day 2020: AI ソフトウェア開発に関するインテルの取り組み
- インテル® Advisor のメモリーレベルのルーフライン・モデル
- OpenMP* 5.0 API シンタックス・クイック・リファレンス・カード
- 革新的なインテル® oneAPI HPC ツールキットを使用して並列安定ソートのパフォーマンスを最適化する方法
- インテル® C++ コンパイラーと OpenMP* 4.5 ライブラリーを使用した効率良い並列 3 分岐基数クイックソート
- インテル® C++ コンパイラーでサポートされる C++17 の機能
- インテル® DAAL の Python* API (daal4py) 導入ガイド
- インテル Parallel Universe 41 号日本語版の公開
- ベクトル化を利用したデータ・アナリティクス向け LLVM コード生成の最適化
- データ・サイエンス・アプリケーションを次のレベルへ
- 実験による DirectX* マルチスレッド・レンダリング・パフォーマンスの理解
- インテル® Advisor 2020 導入ガイド
- ヘテロジニアス・アーキテクチャーのプログラミングに OpenMP* オフロードを使用する
- パフォーマンス・スナップショット
- GitLab* CI でパフォーマンスをプロファイルする
- インテル® DAAL を使用した主成分分析パフォーマンスの向上
- インテル® DAAL を使用したサポート・ベクトル・マシン (SVM) の向上
- 『Imperator: Rome』の最適化されたグラデーション境界レンダリング
- インテル® DAAL を使用した外れ値検出の強化
- インテル® DAAL を使用した線形回帰モデルの最適化
- インテル® DAAL を使用した Python* ナイーブベイズ・アルゴリズムのパフォーマンス向上
- インテル® コンパイラーのバージョンとインテル® Parallel Studio XE (Composer、Professional、Cluster の各エディション) のバージョンの対応表
- AI、マシンラーニング、およびディープラーニングの違い
- 続グラフ・アナリティクス・ベンチマークの冒険
- マルチスレッド・アプリケーション開発のためのガイド
- oneAPI: CPU とアクセラレーター向けの統合クロスアーキテクチャー・パフォーマンス・プログラミング・モデル
- HPC ワークロードと AI の融合がエクサスケール時代への道を開く
- インテル® oneAPI DPC++: OpenCL* および SYCL* テクノロジーとのカーネルと API の相互運用性
- インテル® VTune™ Amplifier の出力からビジュアル・コールグラフを作成する
- OpenCL* 向けの設計を DPC++ へ移行
- メモリーとスレッドのバグを検出: インテル® Inspector – スレッド、メモリー、および不揮発性メモリー対応エラー検出ツール
- マルチスレッド開発ガイド: 1.4 ロードバランスと並列パフォーマンス
- サンプルコード: 等方性媒質における 2 次元有限差分波伝搬 (ISO2DFD) – インテル® oneAPI DPC++ コンパイラーの例
- データ並列 C++ を開始する
- インテル® oneAPI 製品をインストールしてデータ並列 C++ のサンプルコードを実行
- 複数アーキテクチャーにおける DPC++ のデータ管理
- NUMA 向けのアプリケーションの最適化
- 並列ソフトウェアを最適化するための 3 つのステップ
- オンプレミスとクラウドでの HPC パフォーマンス ― 準備はできていますか?
- パラレルジャングルへようこそ!
- パラレルジャングルへようこそ! Part 2
- パラレルジャングルへようこそ! Part 3
- パラレルジャングルへようこそ! Part 4
- パラレルジャングルへようこそ! Part 5
- パラレルジャングルへようこそ! Part 6
- 並列パフォーマンスの理解 パート 1
- 並列パフォーマンスの理解 パート 2
- 並列パフォーマンスの理解 パート 3
- インテル Parallel Universe 40 号日本語版の公開
- 書評: 『The OpenMP Common Core』
- AI 革新の 5 つの落とし穴とその回避方法
- インテル® VTune™ プロファイラー 日本語版 (iSUS 翻訳版) のお申し込み
- マルチコア向け並列プログラミングの 8 つのルール
- インテル® oneAPI ツールキット向けに Visual Studio* で setvars.bat を自動化
- インテル® oneAPI を使用したヘテロジニアス ・プログラミング
- インテル® VTune™ プロファイラー 2020 の新機能: スロットリング解析の活用
- インテル® Advisor の新機能
- マルチスレッド開発ガイド: 2.4 非ブロッキング・ロックの使用
- Python* と daal4py を使用したマシンラーニング
- マルチスレッド開発ガイド: 4.6 インテル® Parallel Composer を利用して並列コードを開発する
- マルチスレッド開発ガイド: 4.5 インテル® VTune™ Amplifier を使用したスレッド・インバランスの解消
- マルチスレッド開発ガイド: 4.4(a) インテル® Inspector を使用したマルチスレッド・コードのデータ競合の検出
- マルチスレッド開発ガイド: 4.4 インテル® Inspector を使用した OpenMP* ベースのマルチスレッド・コードにおける競合状態の検出
- マルチスレッド開発ガイド: 4.3 スレッド化とインテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP)
- マルチスレッド開発ガイド: 4.2 インテル® マス・カーネル・ライブラリー (インテル® MKL) での並列処理
- マルチスレッド開発ガイド: 4.1 インテル® コンパイラーによる自動並列化
- マルチスレッド開発ガイド: 1.7 順序付きデータ構造におけるデータの並列化
- マルチスレッド開発ガイド: 3.5 NUMA 向けのアプリケーションの最適化
- マルチスレッド開発ガイド: 3.4 スレッド間のフォルス・シェアリングの回避と特定
- マルチスレッド開発ガイド: 3.3 マルチスレッド・アプリケーションのメモリー帯域飽和を検出する
- マルチスレッド開発ガイド: 3.2 スレッド・ローカル・ストレージを利用して同期を軽減する
- マルチスレッド開発ガイド: 3.1 スレッド間のヒープ競合の回避
- マルチスレッド開発ガイド: 2.3 オーバーヘッドを最小限に抑える適切な同期プリミティブの選択
- マルチスレッド開発ガイド: 2.2 スレッド API の同期ルーチンの使用
- マルチスレッド開発ガイド: 2.1 ロック競合の管理: 大小のクリティカル・セクション
- マルチスレッド開発ガイド: 1.8 アセンブリーや組込み関数を利用することなく AVX を使用するには
- マルチスレッド開発ガイド: 1.6 スレッドの代替としてのタスクの使用
- マルチスレッド開発ガイド: 1.5 人工的な依存関係の回避/排除による並列性の顕在化
- マルチスレッド開発ガイド: 1.3 粒度と並列パフォーマンス
- マルチスレッド開発ガイド: 1.2 ループの最適化によるデータの並列パフォーマンスの強化
- マルチスレッド開発ガイド: 1.1 並列パフォーマンスの予測と測定
- インテル® C++ コンパイラーの次世代コード・ジェネレーターのドキュメント
- インテル® Advisor クックブック: リモートシステム上でパフォーマンスを解析してローカル macOS* システム上で結果を表示
- インテル® Advisor クックブック: MPI アプリケーションのベクトル化とメモリーアクセスを解析
- インテル® Advisor クックブック: GPU にオフロードするコード領域を特定して GPU の使用状況を可視化
- インテル® コンパイラーを使用したインテル® Xeon® プロセッサー向けのアプリケーションの最適化
- アプリケーション・パフォーマンス・スナップショット入門 (Linux* 版)
- Linux* パッケージ・マネージャーを利用してインテル® oneAPI ツールキットをインストールする
- インテル® Fortran コンパイラーの新しいベクトル化診断
- インテル® C++ コンパイラーの新しいベクトル化診断
- Fortran の明示的なベクトル・プログラミング
- ベクトル化および最適化レポート
- インテル® ディストリビューションの OpenVINO™ ツールキットによるディープラーニング・ベースの大規模な逆運動学の高速化
- インテル® Parallel Studio XE バージョンのサポート状況
- 乱数関数のベクトル化
- 外部ループのベクトル化
- ベクトル化の可能性を高めるデータ・アライメント
- ベクトル化ツールキット
- 一般的なベクトル化のヒント
- ベクトル化の基本
- Fortran の配列データおよび引数とベクトル化
- AI 対応ロボットを素早く簡単に開発: インテル製品、AWS*、UP Squared RoboMaker Developer Kit により実現
- ディープラーニング・ワークベンチを利用してインテル® ディストリビューションの OpenVINO™ ツールキットによる開発を合理化
- インテル® C++/Fortran コンパイラー for Windows* – Microsoft* 開発ソフトウェアの要件
- 診断 15509: ベクトルバージョン ‘xxxx’ (関数 ‘xxxx’、位置 <値>) の引数が無関係です。
- 診断 15511: ベクトルバージョン ‘xxxx’ (関数 ‘xxxx’、位置 <値>) の引数が不足しています。
- 診断 15513: ベクトルバージョン ‘xxxx’ (関数 ‘xxxx’、位置 <値>) の mask 引数の型が正しくありません。
- 診断 15542: ループはベクトル化できませんでした: 内部ループはベクトル化されています。
- 診断 15535: xxxx はベクトル化されませんでした: ループに switch 文が含まれています。if-else 文の使用を検討してください。
- 診断 15487: 型変換: xxxx
- 診断 15537: ループはベクトル化されませんでした: 暗黙の FP 例外モデルが、切り捨てまたは整数除算/剰余に必要な SVML ライブラリーの使用を妨げています。コンパイラー・オプションやソースのディレクティブを変更して、fast FP モデルを有効にし、FP 例外をマスクすることを検討してください。
- 診断 15541: 外部ループは自動ベクトル化されませんでした: SIMD ディレクティブの使用を検討してください。
- 診断 15527: 関数/ループはベクトル化されませんでした: xxxx への関数呼び出しはベクトル化できません。
- 診断 15524: xxxx はベクトル化されませんでした: すべてのメモリー参照をアライメントされたベクトルロードにできなければ検索ループはベクトル化できません。
- 診断 15523: ループはベクトル化されませんでした: ループを実行する前にループの反復回数数を計算できません。
- 診断 15521: ループはベクトル化されませんでした: ループ制御変数が識別されませんでした。ループを実行する前に反復数を計算できる式に置き換えてください。
- 診断 15517: インライン・アセンブリーで EBX/RBX レジスターが使用されているため、このサブルーチンのループはベクトル化できません。
- 診断 15476: スカラーのコスト: xxxx
- 診断 15414: ループはベクトル化されませんでした: 最適化後に xxxx 本体が空になったため、ベクトル化するものがありません。
- 診断 15378: ループはベクトル化されませんでした: /Qfreestanding オプションが整数除算/剰余のベクトル化を妨げています。
- 診断 15344: ループはベクトル化されませんでした: ベクトル依存関係がベクトル化を妨げています。
- 診断 15335: xxxx はベクトル化されませんでした: ベクトル化は可能ですが非効率です。オーバーライドするには vector always ディレクティブまたは /Qvec-threshold0 を使用してください。
- 診断 15331: xxxx はベクトル化されませんでした: コンパイラー・オプションまたはディレクティブによる暗黙の precise FP モデルがベクトル化を妨げています。fast FP モデルの使用を検討してください。
- リマーク #15319: ループ はベクトル化されませんでした: novector ディレクティブが使用されています。
- 診断 15304: ループ はベクトル化されませんでした: マルチバージョンのベクトル化できないループ・インスタンスです。
- インテル Parallel Universe 39 号日本語版の公開
- Wi-Fi* の 新規格「Wi-Fi* 6E」に備える
- インテル® Inspector チュートリアル: C++ サンプル・アプリケーションのスレッドエラーを解析する (Linux* 版)
- インテル® Inspector チュートリアル: C++ サンプル・アプリケーションのスレッドエラーを解析する (Windows* 版)
- インテル® グラフィックス・パフォーマンス・アナライザーが『Frostpunk*』の雪のシミュレーションを支援
- インテル® Inspector チュートリアル: C++ サンプル・アプリケーションのメモリーエラーを解析する (Windows* 版)
- インテル® Inspector チュートリアル: C++ サンプル・アプリケーションのメモリーエラーを解析する (Linux* 版)
- インテル® コンパイラーでの OpenMP* 5.0 TARGET 機能のサポート
- サンプルコード: インテル® AVX-512 とインテル® ディープラーニング・ブースト: 組込み関数
- インテル® MKL 2020 ベクトル統計乱数ジェネレーターのパフォーマンス・データ
- AI による顧客体験の再定義
- Elastic Games が AAA の Triple-I ゲームを制作
- インテルにより『ゴーストバスターズ: ザ・ビデオゲーム リマスタード』でプロトンパックがパワーアップ
- NCF ディープラーニング推論で第 2 世代インテル® Xeon® スケーラブル・プロセッサーが NVIDIA* GPU を凌駕
- ゲームが GPU 依存ではありませんか?
- グラフ・アナリティクス・ベンチマークの冒険
- ボイスボット・スケーリング・チャレンジ: CPU により優れたスループットを達成
- インテル® TBB 2020 の有用な機能: task_arena クラス
- インテル® TBB 2020 の有用な機能: task_arena NUMA サポート
- インテル® TBB 2020 の有用な機能: タスクの分離
- インテル® TBB 2020 の有用な機能: タスク・スケジューラー
- インテル® TBB 2020 の有用な機能: cache_aligned_allocator テンプレート・クラス
- 推奨システム向けに INT8 推論パフォーマンスを高速化
- インテル® ディープラーニング・ブースト (インテル® DL ブースト) で推奨システム向けに INT8 推論パフォーマンスを高速化
- 新しいディープラーニング・ワークベンチ・プロファイラー機能
- ディープラーニングの 4 つの強力な特性
- FAIL IMAGE を実行した後に Fortran Co-Array アプリケーションがハングする
- ハイパフォーマンス・コンピューティングがスマートシティーの可能性を開く
- インテル® oneAPI マス・カーネル・ライブラリー (インテル® oneAPI MKL) データ並列 C++ 使用モデル (モンテカルロ・シミュレーションの例)
- 重要性が高まりつつある課題: ディープラーニング推論のスケーリング
- 新年のご挨拶
- ICC のポインターチェッカーにはダイナミック・リンク・ランタイム・ライブラリーが必要
- Microsoft* Visual Studio* 2017 で Fortran デバッガーがクラッシュする: 配列が表示されない
- サンプルコード: 不揮発性メモリーキャッシュの実装 – 簡単な検索の例
- クラウドにおけるハイパフォーマンス・コンピューティングの課題に取り組む
- 32 ビットの Co-Array Fortran は 64 ビットの Microsoft* Windows* 上で動作しない
- インテル® コンパイラーで使用するため Microsoft* Visual Studio* 2017 をインストールする
- インテル® Parallel Studio XE 2020 の新機能
- インテル® Parallel Studio XE 新バージョン 2020 リリース
- 2019 年人気記事ランキング
- IoT/システム開発を高速化!インテル® System Studio 最新バージョン 2020 リリース
- Amazon Web Services* とインテルが協力して Amazon* EC2 CPU インスタンス上で最適化されたディープラーニング・フレームワークを実現
- インテル® Optane™ DC パーシステント・メモリー導入への道: その 3 – パーシステント・メモリーで C++ アプリケーションをブースト (簡単な grep の例)
- ファクトシート: oneAPI
- インテル® TBB のコンカレント・コンテナー・クラスを利用して C++ アプリケーションを効率的にスケールする
- インテル® Optane™ DC パーシステント・メモリー導入への道: その 2 – App Direct モードで不揮発性ディスクとして使用
- インテル® Optane™ DC パーシステント・メモリー導入への道: その 1 – 計画から装着まで
- 0 A.D. のフレームレートのボトルネックを特定
- Unity* による魚群行動: AI を利用して動くオブジェクト動作のシミュレーション
- インテル Parallel Universe 38 号日本語版の公開
- 32 ビット・インテル® アーキテクチャー上でデータ構造を調整してメモリー使用量を最適化する方法
- CPU で Unreal* Engine のパーティクル・エフェクトを使用する
- The Parallel Universe 38 号編集者からのメッセージ (抜粋)
- マルチプロセッサーでフォルス・シェアリングを検出し軽減する
- OpenVINO™ ツールキットとインテル® System Studio を使用する
- 第 2 世代インテル® Xeon® スケーラブル・プロセッサーでインテル® Deep Learning Boost を使用して TensorFlow* の推論を高速化
- Baidu* の PaddlePaddle における最適化されたディープ・アテンション・マッチング・モデル
- OpenVINO™ ツールキットを使用してインテル® System Studio の Python* プロジェクトを作成する
- インテル® VTune™ Amplifier のプラットフォーム・プロファイラーを使用したワークロードとシステムの特徴付け
- システムレベルの最適化によりディープラーニングのトレーニングと推論を高速化
- AI により拡張された医療用画像処理で放射線科医のワークフローを改善
- インテル® Advisor 2019 の新機能
- NUMA マイグレーションのパフォーマンスへの影響を測定
- メモリーアクセスのパフォーマンス・ボトルネックを特定
- ディープラーニング・リファレンス・スタック機能の拡張
- インテルと Facebook* の協力により PyTorch* の CPU パフォーマンスを向上
- インテル Parallel Universe 37 号日本語版の公開
- Java* によるインテル® Optane™ DC パーシステント・メモリーのサポート
- インテル® VTune™ Amplifier の注目ドキュメント
- インテル® VTune™ プロファイラーをはじめよう
- インテル® プロセッサー上でのディープラーニング推論のデプロイメントの最適化手法
- ポインター・エイリアシングとベクトル化
- 低い数値精度でのディープラーニングのトレーニングと推論
- ゲームとグラフィックス・アプリケーションのパフォーマンス解析
- 明示的なベクトル・プログラミング – 最も一般的な手法
- インテル® Xeon® スケーラブル・プロセッサーでの顔認識推論の最適化
- インテル® プロセッサー・グラフィックス Gen11 API 向け開発者および最適化ガイド
- アプリケーション・パフォーマンス・スナップショット (APS) ユーザーガイド Linux* 版
- インテル® インテグレーテッド・グラフィックス上のマシンラーニングを高速化する Windows® 10 May 2019 Update
- インテル® Advisor クックブック: ルーフラインでパフォーマンス改善を視覚化
- インテル® Advisor クックブック: Cray* システムのパフォーマンス解析
- インテル® Advisor クックブック: Amazon Web Services* (AWS*) EC2* インスタンスのパフォーマンス解析
- インテルの「One API」プロジェクトは、多様なアーキテクチャーに統合プログラミング・モデルを提供
- インテル® Advisor クックブック: ボトルネックの繰り返しを特定: キャッシュを考慮したルーフライン
- インテル® Advisor の統合ルーフライン・モデル
- ループ・ブロッキングによる 32 ビットのインテル® アーキテクチャーのメモリー使用を最適化する方法
- インテル® Advisor クックブック: ループ交換とキャッシュ・ブロッキングによりメモリー・アクセス・パターンを最適化
- VR アプリケーションのパフォーマンス・チューニング
- ブラックホールとハイパフォーマンス・コンピューティング
- エッジにおける Python* 開発
- ハイパフォーマンス静音ワークステーションを自作する
- bgfx レンダリング・エンジンのシェーダーのデバッグ
- 初心者向け AI 実践ガイド
- FPGA とデータセンター: スタックの必要性
- インテル® Advisor を使用してメモリーのボトルネックを排除
- インテル® Advisor の整数ルーフライン・モデル
- マシンラーニングで優位に立つ
- インテル® DevCloud for oneAPI 対応日本語パッケージ (iSUS 翻訳版) ダウンロード・ページ
- 次世代メモリーへの準備
- ベクトル・ニューラル・ネットワーク命令はインテル® アーキテクチャーによる INT8 推論を可能に
- デバイス・ソフトウェア開発者がプロトタイプから生産へ迅速に移行するには
- 高速 Python*: コードを変更せずに Python* をさらに高速化
- アプリケーション・パフォーマンス・スナップショットとは
- プロトタイピングは芸術であり科学である
- チューニング・ガイドとパフォーマンス解析
- ベクトル化の効率を把握する
- インテル Parallel Universe 36 号日本語版の公開
- Microsoft* Visual Studio* を使用して計算集約型のワークロードをインテル® AVX-512 で加速
- vector プラグマ/ディレクティブの動的アライメント節
- インテル® プラットフォーム上でディープ・イメージ・マッティング・アルゴリズムの推論を高速化する
- 数値精度を低くすることでディープラーニングのパフォーマンスを向上
- インテル® CPU が ResNet-50 ディープラーニング推論で NVIDIA* GPU を凌駕
- インテル® Advisor 2019 for Windows* をお使いの皆様
- インテル® VTune™ Amplifier プラットフォーム・プロファイラーのインストールと使用法
- インテル® Software Development Emulator を使ってみよう
- インテル® Software Development Emulator
- マシンラーニングとマンモグラフィー
- 第 2 世代インテル® Xeon® スケーラブル・プロセッサーの技術概要
- インテル® コンパイラーの最適化オプションから見る次世代 CPU
- インテル® 64 および IA-32 アーキテクチャー最適化リファレンス・マニュアル – 248966-041 April 2019 で追加された第 11 章 インテル® Optane™ DC パーシステント・メモリーの参考訳
- インテル® MPI ライブラリーのマルチEP によりハイブリッド・アプリケーションのパフォーマンスを向上
- ハイブリッド・クラウド: オンプレミスとクラウドでの HPC パフォーマンスのベスト・プラクティス
- インテル® VTune™ プロファイラー日本語版 (iSUS 翻訳版) ダウンロード・ページ
- インテル® 64 および IA-32 アーキテクチャー最適化リファレンス・マニュアル – 248966-041 April 2019 で追加された第 7 章 INT8 ディープラーニング推論の参考訳
- インテルが提供するディープラーニング・フレームワーク
- 不揮発性メモリーのアウトオブオーダー解析にインテル® Inspector を使用する
- インテル® Advisor Python* API を使用したパフォーマンス向上の考察
- JD は GPU から CPU への変更により画像解析を高速化
- Hot Chips におけるヘテロジニアス時代の前触れ
- PyDAAL 超入門: パート 4 分散処理とオンライン処理
- OpenCV とは?
- 最近のインテル® アーキテクチャーにおける TensorFlow* の最適化
- PyDAAL 超入門: パート 3 解析モデルの構築とデプロイメント
- AI によるコンピューター・ビジョンの可能性の拡大
- PyDAAL 超入門: パート 2 数値テーブルの基本操作
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: まとめ
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 42
- 自動運転の開発
- PyDAAL 超入門: パート 1 データ構造
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 41
- インテル Parallel Universe 35 号日本語版の公開
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 40
- ダイナミック解像度レンダリング
- インテル® SPMD コンパイラーから学べること
- OpenMP* とインテル® TBB タスクグラフ: インテル® Advisor のフローグラフ・アナライザーで問題を解明する
- インテル® インテグレーテッド・グラフィックス上でリアルタイム・アップスケーリングを実現するチェッカーボード・レンダリング
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 39
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 38
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 37
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 36
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 35
- サンプルコード: Microsoft* DirectX* 12 を使用したダイナミック・チェッカーボード・レンダリング
- メディアとビデオ処理のアクセラレーション: どのツールを使用すべきか?
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 34
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 33
- 入れ子構造の並列処理が手に負えなくなったときにどうするか? インテル® TBB 向け Python* モジュールを 30 分で導入する
- 2018 年人気記事ランキング
- インテル® VTune™ Amplifier 2019 のプロファイルに基づく最適化レポート (プレビュー機能)
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 32
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 31
- 秘密のない API: Vulkan* への実践的なアプローチ – パート 1
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 30
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 29
- PyPy による OpenStack* Swift* パフォーマンスの最適化
- インテル Parallel Universe 34 号日本語版の公開
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 28
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 27
- Doctor Fortran による「終わりは近い」
- 日本語版コンパイラーを同梱「インテル® Parallel Studio XE 2019」最新アップデート版 提供開始
- アプリケーション・パフォーマンス・スナップショット導入ガイド Windows* 版
- インテル® ソフトウェア・ツールにおける浮動小数点結果の再現性
- YUM レポジトリーを使用してインテル® Parallel Studio XE 2019 のランタイムをインストールする
- APT レポジトリーを使用してインテル® Parallel Studio XE 2019 のランタイムをインストールする
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 26
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 25
- Amazon EC2* クラスター上で動作する HPC アプリケーションでインテル® ソフトウェア開発ツールを利用する
- CEDEC 2018 講演ビデオの紹介
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 24
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 23
- インテル® AVX-512 で x265 を高速化
- IoT/システム開発向け インテル® System Studio 新バージョン 2019 リリース
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 22
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 21
- Doctor Fortran による「さあ、始まりだ!」
- OpenMP* 5.0 TR7 の仕様抜粋訳
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 20
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 19
- インテル® Xeon® スケーラブル・プロセッサーのインテル® AVX-512 のベクトル長の拡張機能
- インテル® Parallel Studio XE 新バージョン 2019 リリース
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 18
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 17
- マルチコアシステムの並列パフォーマンス向けに Fortran アプリケーションをスレッド化
- インテル® ソフトウェア開発製品 技術ウェビナーシリーズ
- インテル Parallel Universe 33 号日本語版の公開
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 16
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 15
- インテル® Inspector の不揮発性インスペクターにより不揮発性メモリーのプログラミング・エラーを検出する方法
- Google Cloud Platform* の Windows* インスタンスにインテル® Parallel Studio XE をインストール
- AWS* Windows* インスタンス上にインテル® Parallel Studio XE をインストール
- Google Cloud Platform* の Linux* インスタンスにインテル® Parallel Studio XE をインストール
- APT レポジトリーを使用してインテル® Parallel Studio XE 2018 のランタイムをインストールする
- YUM レポジトリーを使用してインテル® Parallel Studio XE 2018 のランタイムをインストールする
- インテル® Advisor のパフォーマンス・データ収集制御 API の使い方
- Linux* パッケージ・マネージャーを使用してインテル® Parallel Studio XE のランタイムをインストールする
- 一般的な Linux* パッケージ・マネージャーを使用してインテル® パフォーマンス・ライブラリーとインテル® Distribution for Python* をインストールする
- アマゾン ウェブ サービス* (AWS*) でインテル® Parallel Studio XE をインストールする
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 14
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 13
- 最も一般的な手法: ファイアウォールによってノード間の MPI 通信がブロックされた場合の対応方法
- インテル® アーキテクチャー上で Unity Technology ML-Agents* を調査する
- iSUS キャンペーン 2018 夏の陣のご案内
- Unreal* Engine 4/インテル® VTune™ Amplifier 利用ガイド
- コードの現代化を実践: スレッド化、メモリー、ベクトル化の最適化
- ゲームにおける CPU ベクトル化にインテル® SPMD Program Compiler を使用する
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 12
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 11
- 暗号通貨訓練のディープラーニング
- ミッションをクリアして抽選で景品をゲット!インテル® VTune™ Amplifier 解析チャレンジ・キャンペーン
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 10
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 9
- Windows* ML: インテル® ハードウェア上での AI の高速化
- Unreal* Engine 4.19 の最適化にインテルのソフトウェア・エンジニアが協力
- SPIR-V から ISPC へ: GPU 計算を CPU に変換する
- メモリー・アクセス・プロファイル: 一般的なパフォーマンス・ボトルネックの特定と修正
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 8
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 7
- インテル® HD グラフィックス向けにエッジベースの AI を最適化する
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 6
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 5
- キャラクター・アニメーション: スケルトンと逆運動学
- さらに効率良く高速でスケーラブル: エクサスケールに向けて前進
- 高速で優れたメディア/ビデオ処理を実現 – インテル® Media Server Studio 2018 販売開始
- インテル® Advisor 2018 アップデート情報
- インテル® VTune™ Amplifier、インテル® Advisor、およびインテル® Inspector を異なる OS で使用する
- クラウドおよびエッジ・アプリケーション向けデータ圧縮コードの高速化
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 4
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 3
- ゲーム・アプリケーションにおけるニューラル・ネットワーク入門
- インテル Parallel Universe 32 号日本語版の公開
- インテル® MKL を使用した小行列乗算の高速化
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 2
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: No. 1
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問: はじめに
- プログラミング、リファクタリング、そしてすべてにおける究極の疑問
- インテル® コンパイラーを使用して投機実行サイドチャネルの問題を緩和
- インテル® VTune™ Amplifier – 最近の OS セキュリティー・アップデートの影響
- Python* はネイティブコードと同じくらい速いのか?
- 比較関数の罠
- ディープラーニングの訓練向けインテル® プロセッサー
- インテル® Xeon® スケーラブル・プロセッサー上の並列 CFD と HiFUN ソルバー
- 統合仮想プラットフォームの構築
- IT 担当者と開発者のためのインテル® Xeon® スケーラブル・プロセッサーによる大幅なパフォーマンス向上
- インテル® グラフィックス・テクノロジーへ計算をオフロードするための入門ガイド
- 新しいインテル® Core™ i9 X シリーズ・プロセッサー・ベースのシステムの強力な計算処理能力で究極のメガタスクを実現
- インテル® コンピューター・ビジョン SDK – 概要
- 最新のインテルの HEVC エンコーダー/デコーダーでメディア・アプリケーションの品質とパフォーマンスを向上
- インテル® Xeon® スケーラブル・プロセッサーでシミュレーション・パフォーマンスを大幅に向上
- インテル® VTune™ Amplifier + OpenMP* によりスレッドのパフォーマンスとスケーラビリティーを向上する (全 2回)
- インテル Parallel Universe 31 号日本語版の公開
- インテル® Parallel Studio XE によりアプリケーション・パフォーマンスを大幅に向上 (全 2 回)
- Microsoft* Windows* 10 における新しい命令セットの利用
- ソフトウェアは実際に新しい命令セットを使用しているのか?
- インテル® Advisor: ベクトル化アドバイザー用語集
- Art’Em – 絵画風加工を VR で実現する: パート 5 (最終回)
- Art’Em – 絵画風加工を VR で実現する: パート 4
- OpenCL* による FPGA プログラミング
- インテル® プロセッサー・グラフィックス
- インテル® VTune™ Amplifier 2018 オンラインヘルプ (iSUS 翻訳版)
- OpenMP* TR6 (テクニカル・レポート 6) に含まれる新機能
- Art’Em – 絵画風加工を VR で実現する: パート 3
- Art’Em – 絵画風加工を VR で実現する: パート 2
- Art’Em – 絵画風加工を VR で実現する: パート 1
- てんかん脳の機能的結合性: てんかん脳の結合性調査 – パート 1
- てんかん脳の機能的結合性: EEG データの前処理 – パート 2
- てんかん脳の機能的結合性: 機能的結合性の抽出 – パート 3
- 2017 年人気記事ランキング
- 季節のご挨拶
- インテル® SSE およびインテル® AVX 世代 (SSE2、SSE3、SSSE3、ATOM_SSSE3、SSE4.1、SSE4.2、ATOM_SSE4.2、AVX、AVX2、AVX-512) 向けのインテル® コンパイラー・オプションとプロセッサー固有の最適化
- 将来に対応したコードの最適化によるソフトウェアの現代化
- スレッドについての考察
- ユニバーサル Windows* プラットフォーム・アプリケーションでインテル® TBB を使用する
- 最適化レポートをソースリストに挿入
- インテル® コンパイラー 17.0 以降の新機能: ループのコード・アライメント
- Doctor Fortran による「2018 が新しい 2015」
- インテル® MKL とインテル® DAAL によるビッグデータ解析のスピードアップ
- システム/IoT デバイス・アプリケーションを高速化! インテル® System Studio 新バージョン 2018 発売開始
- インテル® コンパイラー 18.0 の OpenMP* 5.0 サポート
- インテル Parallel Universe 30 号日本語版の公開
- インテル® Advisor とインテル® Trace Analyzer により天体物理学シミュレーションのパフォーマンスが 3 倍向上
- 2017 年秋のインテル® ソフトウェア製品技術ウェビナー
- 日本語版コンパイラーを同梱「インテル® Parallel Studio XE 2018」最新アップデート版 提供開始
- インテル® ソフトウェア開発ツールの Microsoft* Visual Studio* 2017 統合に関する問題
- Knights Landing – 開発者向け概要オンライン・トレーニング (前半)
- インテル® AVX-512 でベクトル化のパフォーマンスを向上する
- R でインテル® MKL を使用する
- 「さよなら Cilk Plus」移行の手順 – 明日のためのその 3 (最終回)
- インテル® Xeon® スケーラブル・プロセッサー向け SIMD ベクトル化のチューニング
- 「さよなら Cilk Plus」移行の手順 – 明日のためのその 2
- データ保持の概要
- 最新のメモリー・サブシステムをデータベース・コード、線形代数コード、ビッグデータ、エンタープライズ・ストレージに使用する利点
- 「さよなら Cilk Plus」移行の手順 – 明日のためのその 1
- インテル Parallel Universe 29 号日本語版の公開
- 「Cilk がやってきた」から「さよなら Cilk Plus」へ
- インテル® Cilk™ Plus アプリケーションを OpenMP* もしくはインテル® TBB へ移行する
- インテル® Advisor を利用したガイド付きコードのベクトル化
- インテル® Parallel Studio XE 新バージョン 2018 リリース – ソフトウェアに無限の可能性を
- インテル® C++ コンパイラーにおける C11 のサポート
- 命令あたりのサイクル (CPI) – なぜ重要なのか?
- データ圧縮の向上: “シャノン・エントロピー” の並列アルゴリズム
- インテル® Xeon® スケーラブル・プロセッサーにより HPC が大きく進歩
- インテル® 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス・マニュアル
- インテル® 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス・マニュアル – 248966-037 July 2017 rev. 2
- HPC アプリケーションに役立つハイパフォーマンス解析
- OpenMP* 20 周年
- C++ 11 でマルチスレッド・コードを記述する
- 編集長の夏休みの工作 その 3
- インテル® 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス・マニュアル – 248966-037 July 2017
- インテル® Cluster Checker – 高速かつ信頼性の高いプラットフォームでクラスター・アプリケーションを計算
- インテル® ライブラリーによるディープラーニングとマシンラーニングの促進
- データとコードの並べ替え: 最適化とメモリー – パート 2
- C++ コンパイラーの比較
- インテル Parallel Universe 28 号日本語版の公開
- BigDL: Apache Spark* 上の最適化されたディープラーニング
- R を使用した HPC: 基本
- 適切なテスト方法 (テスト理論パート 1)
- 適切なテストツール (テスト理論パート 2)
- インテル® DAAL を利用して実際のマシンラーニングの問題を解く
- OpenMP* 誕生から 20 年
- Parallel STL: C++ STL コードのパフォーマンスの向上
- データとコードの並べ替え: 最適化とメモリー – パート 1
- NUMA ハードウェアによるパフォーマンスの向上
- メモリー・パフォーマンスの概要
- Cython のスレッド並列処理
- ベクトル化によるパフォーマンスの向上
- インテル® メニーコア・プラットフォーム・ソフトウェア・スタック (MPSS)
- キャッシュを考慮したルーフライン解析を使用してベクトル化とメモリーの最適化を詳しく調査する
- インテル® Advisor 2017 ツールによるベクトル化のクイック解析
- インテル® Media SDK およびインテル® SDK for OpenCL* Applications のドライバーサポート
- インテル® AVX-512 ハードウェアを使用することなくインテル® AVX-512 を最適化する (全 2 回)
- インテル Parallel Universe 27 号日本語版の公開
- ハイブリッド並列処理: 並列分散メモリーと共有メモリー・コンピューティング
- インテル® MKL の DNN プリミティブ
- インテル® Distribution for Python* におけるより高速な乱数生成
- インテル® SGX 命令とデータ構造の概要
- インテルが推進するディープラーニング・フレームワーク
- ケーススタディー – 画像認識モデルのトレーニングにインテル® Deep Learning SDK を使用する
- インテル® Advisor のルーフライン解析
- インテル® AVX-512 で向上したベクトル化のパフォーマンス
- AI に対するニーズの高まりに対応する
- インテル® TBB による並列プログラミング 10 周年
- 自動ベクトル化が失敗した場合の対処
- インテル® Xeon Phi™ Processor Software
- 並列アプリケーションのスケーラビリティーの問題を特定する
- 行列-行列乗算のパックのオーバーヘッドを減らす
- マシンラーニングに注目すべき理由
- Docker* 上に Ubuntu* 16.04 とインテル® Distribution for Python* の実行環境を構築する手順
- 現在と将来の OpenMP* API 仕様
- Python* プログラムの並列パフォーマンスを引き出そう
- インテルの x86 プラットフォーム向け Unity* 最適化ガイド: パート 4
- インテル® VTune™ Amplifier XE の General Exploration (一般解析) がどのように動作するかを理解する
- インテル® コンパイラーの浮動小数点演算における結果の一貫性
- インテルの Caffe* を CentOS* 7.2 上にインストールする
- C++11 ラムダ式により並列化されたループの定型コードを軽減する
- インテルの x86 プラットフォーム向け Unity* 最適化ガイド: パート 3
- Python* で無限のモノポリーゲームをプレイする
- インテルの x86 プラットフォーム向け Unity* 最適化ガイド: パート 2
- 季節のご挨拶
- インテル® グラフィックス・パフォーマンス・アナライザーを利用してインテル® Media SDK により最適化されたアプリケーションを解析する方法
- インテルの x86 プラットフォーム向け Unity* 最適化ガイド: パート 1
- インテル® Parallel Studio XE Composer Edition 製品にバンドルされているインテル® IPP、インテル® MKL、およびインテル® TBB のバージョン
- インテル Parallel Universe 26 号日本語版の公開
- コード変更なしで OpenStack* Swift のパフォーマンスを 2 倍に向上
- ビデオ・ストリーミング処理 – 環境への配慮
- インテルのハイパフォーマンス・ライブラリーにより MeritData 社が Tempo* ビッグデータ・プラットフォームをスピードアップ
- データ解析およびマシンラーニング向けパフォーマンス・ライブラリー
- 電光石火の R マシンラーニング・アルゴリズム
- インテル® VTune™ Amplifier XE による Java* および Python* コードのプロファイル
- Direct3D* 12 フリップモデルのスワップチェーンのサンプル・アプリケーション
- インテル® VTune™ Amplifier XE のコマンドラインのレポートでループ情報をホット関数として表示する方法
- マシンラーニングにおける Python* パフォーマンスの壁を乗り越える
- Amazon Web Services* 向けインテル® Parallel Studio XE 2017 ランタイム
- ビッグデータ解析とマシンラーニングの有効利用
- 京都大学における GPU を超える CPU の優れたパフォーマンスの検証
- Python* での苦い経験
- インテル® Distribution for Python* と Anaconda* を使用する
- モダンコード – ベクトル化されたリダクション 2: コンパイラーのベクトル化を活用する
- ベクトル化されたリダクション操作を記述できますか?
- インテル® Distribution for Python* の既知の問題
- インテル® C++ コンパイラーでサポートされる C++14 の機能
- インテル® VTune™ Amplifier XE で Python*/Cython 混在コードをプロファイルする
- 等方性 3 次元有限差分 (3DFD) 波動方程式コード向けの NUMA を理解する
- インテル® MKL 2017: 複雑な問題を解くためのクックブック
- インテル Parallel Universe 25 号日本語版の公開
- アドレス・レンジ・パーシャル・メモリー・ミラーリング
- 第 6 世代インテル® Core™ プロセッサー (開発コード名 Skylake) の概要
- ユーザー空間におけるオープンソースのストレージスタックのビルド
- ゲーム開発 – 第 6 世代インテル® Core™ プロセッサー向けグラフィックス API 開発者ガイド
- インテル® Distribution for Python* の紹介
- インテル® MPI ライブラリーを利用した Python* の並列プログラミング
- GEN アセンブリーの概要
- インテル® VTune™ Amplifier XE を利用した Python* コードの高速化
- インテルと Anaconda* によるオープン・データ・サイエンス向け Python* の強化
- ソフトウェアによるオクルージョン・カリング
- 間接呼び出しと仮想関数の呼び出し: インテル® C/C++ コンパイラー 17.0 によるベクトル化
- インテル-HPEアライアンス: HPC分野で新たな革新が始まった
- インテル® Software Development Emulator
- Python* プロファイル
- インテル® Memory Protection Extensions (インテル® MPX) 利用ガイド
- インテル® Parallel Studio XE Cluster Edition のパスワードレス SSH インストール
- インテル® Xeon® プロセッサー E5 v3 における AES-GCM 暗号化のパフォーマンス
- インテル® TBB を使用したインテル® IPP のイメージリサイズのスレッド化
- SSL セッションで RDRAND を使用するように Apache* Web サーバーを設定する
- Linux* 上で CPU と GPU バッファーを共有する
- 順序付けの問題 – パート 5
- Amazon Web Services* 向けインテル® Parallel Studio XE 2016 ランタイム
- null ポインターの逆参照が引き起こす未定義の動作
- インテル Parallel Universe 24 号日本語版の公開
- インテル® Advisor XE 2016 を利用したコードのベクトル化
- インテルのクラスターツールを利用したハイブリッド・アプリケーションのチューニング
- 2016年春ウェビナーシリーズ
- 最後の行問題
- 最新の IoT と組込みテクノロジーを利用したスマートな開発
- 小惑星と DirectX* 12: パフォーマンスと省電力
- インテル® IPP を利用した画像識別の最適化
- メモリーアクセスのパフォーマンス・ボトルネックの検出
- インテル® MPI ライブラリー: Hadoop* エコシステムをサポート
- ANSYS* によるシミュレーション・パフォーマンスのスケーリング
- opencl_program と引数のバインド – パート 4
- 生産性と C++ パフォーマンスの向上
- コードの現代化を成功に導く 3 つのアドバイス
- ケーススタディー: 計算集約型ループにおける構造体配列 (AOS) および配列構造体 (SOA) データレイアウトの比較
- デバイスの選択 – パート 3
- opencl_node の基本インターフェイスと opencl_buffer – パート 2
- インテル® VTune™ Amplifier 2015 for systems を使用してドライバーをプロファイルする方法
- OpenMP* バージョン 4.5: 標準化の進化
- Allinea 社の マーク・オコナー氏のインタビュー
- 編集長の記事
- インテル® System Studio 2015 のインテル® Energy Profiler を使用する
- opencl_node の概要 – パート 1
- インテル Parallel Universe 23 号日本語版の公開
- HEVC エンコードのパフォーマンスが 1.1 倍、品質が 10% 向上したインテル® Media Server Studio 2016 発売
- コードで使用したメモリー割り当て/割り当て解除のトレースをサポートしたインテル® VTune™ Amplifier XE 2016 の新しいメモリーアクセス解析
- ヘテロジニアス分散システムにおける有限差分法
- HEVC (H.265) コーデックの重要性を理解する
- 「The Future of Fortran」の Doctor Fortran
- ゲームにおける群衆シミュレーションの向上
- インテル® アーキテクチャー向けの OpenCL* ドライバーとランライム
- インテル® Xeon Phi™ コプロセッサー: Code Modernization セミナー
- mpitune ユーティリティーの実行時間を軽減する
- インテル® VTune™ Amplifier XE のリモートデータ収集を簡単に行う方法
- インテル® DAAL とは?
- ベクトル異形関数でのプロセッサー ID 指定
- OpenMP 4.x による新しいレベルの並列化
- ケーススタディー: インテル® アドバンスト・ベクトル・エクステンションを使用したブラック-ショールズの計算
- インテル® DAAL を使用した分散処理の概要
- インテル® DAAL を使用したオンライン処理の概要
- インテル® DAAL for OS X* 入門ガイド
- インテル® DAAL for Linux* 入門ガイド
- Java* アプリケーションでインテル® DAAL を使用する方法
- C++ アプリケーションとインテル® DAAL のリンク方法
- インテル® DAAL チュートリアル: 簡単な C++ 例の使用
- インテル® Xeon® プロセッサー E5 ファミリー・ベースのマルチノード分散メモリーシステム上の Caffe* 学習
- インテル® Xeon® プロセッサー E5 ファミリー上でのシングルノード Caffe* スコアと学習
- Direct3D* 12 概要 パート 9: まとめ
- 2015 年人気記事ランキング
- インテル® Advisor コマンドラインと MPI
- インテル® SDK for OpenCL* Applications 入門
- 新年のご挨拶
- インテル® DAAL の無料オプション、サポートなし、ロイヤルティー・フリー
- インテル® IPP の無料オプション、サポートなし、ロイヤルティー・フリー
- インテル® MKL の無料オプション、サポートなし、ロイヤルティー・フリー
- OpenMP* 4.x による新しいレベルの並列化 (全2回)
- ポピュラーなオープンソース・プロジェクトのエラーを見つけるクイズに挑戦しよう
- インテル Parallel Universe 22 号日本語版の公開
- コンピューターの高度な概念: 用語集パート 2
- ピクセル同期を利用した順不同半透明描画 (更新)
- コンピューターの高度な概念: 用語集パート 1
- バイトニック・ソート
- Unity* 設定のヒント: メモリー、オーディオ、テクスチャー
- DirectX* 11 のイメージ処理における高速フーリエ変換
- インテル® コラボレーション・センターに取材に伺いました
- 究極のモバイルオフィス!?
- Windows* 環境でインテル® コンパイラーを使用してオフロード文を含むソースをコンパイルする際の注意点
- インテル® C++ コンパイラーでサポートされる C++11 の機能
- 暗号化/復号化 – JNI 呼び出しによる OpenSSL* API の使用
- 暗黙の同期を使用してインテル® プロセッサー・グラフィックス上で OpenCL* と OpenGL* 4.3 のサーフェスを共有する
- インテル® TBB ライブラリーと C++11 における正確な例外伝播 (exception_ptr)
- OpenCL* Code Builder で SPIR* を使用する
- OpenCL* 2.0 のジェネリック・アドレス空間
- V15 と V16 のコンパイラーのオフロード時のコンパイラーの振る舞いの違い
- 編集長の夏休みの工作 パート 2
- インテル Parallel Universe 21 号日本語版の公開
- Code Modernization – コード・モダニゼーション (現代化) とは?
- PATH システム環境変数の長さ制限
- インテルのキャッシュ・モニタリング・テクノロジー: ソフトウェア・サポートとツール (パート 4)
- 編集長の夏休みの工作
- インテルのキャッシュ・モニタリング・テクノロジー:
使用モデルとサンプルデータ (パート 3) - StdAfx.h に関する考察
- インテル® C/C++ コンパイラー: 機能とサポートされるプラットフォーム比較
- インテル® VTune™ Amplifier XE 2015 Update 2 による、ドライバーなしでのハードウェア・イベント・サンプリング (コールスタック付き) のサポート
- インテル® AVX2 によるプログラミング置換
- OS X* から Linux* へのリモートデータ収集ができない理由
- ベクトル・プログラミング: インテル® SSE4.2 からインテル® AVX2 への変換例
- インテルのキャッシュ・モニタリング・テクノロジー: ソフトウェア・インターフェイス (パート 2)
- インテル® Xeon® プロセッサー E7 v3 ファミリー向けのソフトウェア最適化によるビジネス・インテリジェンスと見識の加速
- Microsoft* DirectX* 12 におけるリソースバインドの紹介
- ループで呼び出される大きな関数を分割して命令キャッシュを最適化する
- インテルのキャッシュ・モニタリング・テクノロジー: 利点 (パート 1)
- ネストされた仮想マシン上でインテル® Xeon® プロセッサー E5-2600 V3 製品ファミリーの VMCS シャドーイング機能を有効にする
- OpenMP* 4.0 API C/C++ シンタックス・クイック・リファレンス・カード
- 成功した開発者の 5 つの秘訣
- とらえどころのないアルゴリズム – 並列スキャン (追記)
- すべてのノード上で MPI プロセスをプロファイルするには?
- とらえどころのないアルゴリズム – 並列スキャン
- インテル® コンパイラー 15.0 最適化 クイック・リファレンス・ガイド 日本語版を公開
- インテル Parallel Universe 20 号日本語版の公開
- 新しい最適化レポートを使用してインテル® コンパイラーをさらに活用する
- インテル® TBB のデバッグ、例外機能を使用する
- インテルの最新の並列化ツールによる明示的なベクトル化
- ヘテロジニアス・コンピューティングのパイプライン化
- Connected World のためのソフトウェア・ツール
- #pragma SIMD を使用してループをベクトル化するための条件
- ループをベクトル化するための条件
- OpenMP* でベクトル化された並列ループを簡単に作成する
- オープンソース Python*、R、Julia ベースの HPC アプリケーションの高速化
- インテル® VTune™ Amplifier XE によるマルチスレッド化とタスク解析
- インテル® MKL を Numpy/Scipy に実装
- OpenMP* を使用中に変数アクセスでスレッドがクラッシュしないようにする
- LLVM/Clang で OpenMP* 4.0 機能を試してみる
- OpenMP* 実行環境関数
- インテル Parallel Universe 19 号日本語版の公開
- 私の OpenCL* SDK はどこへ行ってしまったのか?
- MPI 標準に共通のアプリケーション・バイナリー・インターフェイスが登場
- 新しい MPI-3 標準でパフォーマンスの課題に対処する
- 基本ホットスポット解析のオーバーヘッドを軽減する
- GNU* ツールチェーンにおけるインテル® Memory Protection Extensions (インテル® MPX) のサポート
- C++11 とインテル® TBB スレッドの併用
- インテル® FLEXlm ライセンス・マネージャーの入手方法
- インテル® Inspector XE を使用して Windows* 向けアプリケーションのメモリーエラーを検出
- OpenOCD* でインテル® System Debugger を使用する
- OpenCL* によるゴッドレイの HDR レンダリング
- Tencent* QQ* の没入型ビデオ・パイプライン全体の最適化
- GCC 5.0 での x86 向けの最適化新機能: 32 ビット・モードにおける PIC
- インテル® Inspector XE を使用して Windows* 向けアプリケーションのスレッドエラーを検出
- 64 ビット・コンピューティングによりモバイル・エクスペリエンスを向上する
- OpenCL* 2.0 の不均等なワークグループ
- 季節のご挨拶
- OpenCL* 1.2 の活用: インテル® プロセッサー・グラフィックスでバッファーコピーを最小限に抑えてパフォーマンスを向上する方法
- GCC 5.0 での x86 向けの最適化新機能
- 2014 年人気記事ランキング
- iSUS クリスマス・キャンペーン 2014
- インテル® ソフトウェア・カンファレンス東京 2014 に行ってきました!
- インテル® GPA でゲームのボトルネックを特定する
- C# による並列プログラミング
- インテル® VTune™ Amplifier XE のソースビューは OpenCL* ソースファイルと関連付けることができないのか?
- SIMD アーキテクチャーの略語の解説
- 最適なインテルの並列プロセッサーを選択する方法: プロセッサーのモデルナンバーを理解する
- インテル命令セット・アーキテクチャー拡張
- インテル® 64 および IA-32 アーキテクチャー最適化リファレンス・マニュアルが更新されました
- JavaScript への SIMD ベクトル化の追加
- VTune™ Amplifier XE 2015 を使用して GPU 上の OpenCL* カーネル解析を解析する
- OpenSSL における RDRAND 統合の変更
- 異なる Microsoft* Visual Studio* バージョンで古いインテル® Visual Fortran コンパイラーを使用する
- セキュアキー対応インテル® データ・プロテクション・テクノロジー: Gazzang 社のケーススタディー
- パート 1 – HBase* 用 Java* ガベージ・コレクションのチューニング
- インテル® ソフトウェア開発製品 紹介
- Fortran 2008 仕様のサポート
- Fortran 2003 仕様のサポート
- 小さな問題サイズにおけるインテル® MKL パフォーマンスの向上: MKL_DIRECT_CALL の使用
- Direct3D* 12 概要 パート 8: CPU の並列性
- Direct3D* 12 概要 パート 7: ダイナミック・ヒープ
- Direct3D* 12 概要 パート 6: コマンドリスト
- 仮想環境におけるセキュアキー対応インテル® データ・プロテクション・テクノロジー
- Direct3D* 12 特集
- Linux* オペレーティング・システムの電力消費の解析と最適化
- インテル® Inspector XE 2015 の新機能
- Direct3D* 12 概要 パート 5: バンドル
- Direct3D* 12 概要 パート 4: ヒープとテーブル
- インテル® コンパイラー V15 におけるレポート機能の変更点
- Direct3D* 12 概要 パート 3: リソースバインド
- OpenMP 4.0 を使用してプログラムで SIMD を有効にする
- インテル® ソフトウェア開発製品の名称変更/新バージョンのお知らせ
- Direct3D* 12 概要 パート 2: パイプライン状態オブジェクト
- Direct3D* 12 概要 パート 1: ハードウェアに近く
- SIGGRAPH 2014: IA 上の DirectX* 12 サポート
- トランザクショナル・メモリー・サポート: speculative_spin_rw_mutex (プレビュー機能)
- インテル® VTune™Amplifier XE 2015 を旧バージョンと共存する
- 新書紹介:ビジュアル・エフェクト向けのマルチスレッド化
- インテル® Inspector XE 2015 スタンドアロン GUI の使用方法
- 追加された AVX-512 命令
- インテル® SDK for OpenCL* Applications – サンプルパッケージのリリースノート
- インテル® グラフィックス・パフォーマンス・アナライザー (インテル® GPA) よくある問い合わせ
- インテル® GPA: 対象プラットフォームで利用できるツールは ?
- インテル® アーキテクチャーにおける OpenCL* サポートに関するよくある問い合わせ
- 古いコンパイラーと tsx-tools で HLE および RTM を使用する
- インテル® PCM によるインテル® トランザクショナル・シンクロナイゼーション・エクステンションのモニタリング
- Linux* の perf を使用したインテル® トランザクショナル・シンクロナイゼーション・エクステンション (インテル® TSX) のプロファイリング
- インテル® System Studio を利用した第 4 世代インテル® Core™ プロセッサーのデジタル・セキュリティーと監視機能の活用
- インテル® JTAG デバッガーとイベントトレースの併用によるシステム・ソフトウェア・デバッグ
- インテル® System Studio 2014 – UEFI BIOS デバッグ
- サンプル・アプリケーション: データ暗号化ホワイトペーパー
- サンプルコード: ワンタイムパスワード (OTP) のデモ
- サンプルコード: 乱数アプリケーション
- インテル® Hardware Accelerated Execution Manager 1.0.6 (R3)
- サンプルコード: データ暗号化アプリケーション
- Cocos2d-x を使用してマルチプラットフォーム・ゲームを開発する
- インテル® 64 アーキテクチャーおよび IA-32 アーキテクチャー最適化リファレンス・マニュアル
- Sparse Ruler の並列計算
- インテル® VTune™ Amplifier XE によるインテル® トランザクショナル・シンクロナイゼーション・エクステンション (インテル® TSX) のプロファイリング
- スレッド化されたインテル ® MKL をマルチスレッド・アプリケーションで使用する
- ループのベクトル化によるプログラムの最適化
- インテル® アーキテクチャーの SIMD テクノロジーによりゲームコードを高速化
- インテル® IPP におけるインテル® AVX2 向け最適化
- インテル® MKL におけるインテル® AVX2 向け最適化
- インテリジェント・システムと組込みデバイス向けソフトウェア開発ツールの使用法
- 組込み開発におけるガイド付き自動並列化の利用
- ギャザーによる構造化されたデータのベクトル化
- Linux* 上でインテル® C++ コンパイラーとインテル® MKL を使用して R-3.0.1 をビルドする
- インテル® AES New Instructions (インテル® AES-NI)
- Parallel Universe マガジン
- 並列プログラムのテスト
- Apache* Tomcat* からの Java* アプレットをプロファイルするためインテル® VTune™ Amplifier XE を利用する
- 並列アプリケーション最適化のための計画
- インテル® ハイパースレッディング・テクノロジー: よくある質問
- インテル® パフォーマンス・カウンター・モニター - より優れた CPU 使用率の測定方法
- インテル® HD グラフィックス 4000 上の OpenCL* コードとインテル® クイック・シンク・ビデオのパフォーマンス相互作用
- 2013年 人気記事ランキング
- iSUS クリスマス・キャンペーン 2013
- インテル® VTune™ Amplifier XE で OpenMP* アプリケーションをプロファイルする
- インテル® グラフィックス・パフォーマンス・アナライザーで OpenCL* 関連のメトリックを収集する
- Windows* アプリケーションのサポートについて
- インテル® GPA:Windows* 7/8/8.1 OS サポート
- デフォルト・コンパイラーをインテル® C++ コンパイラーから x86 ターゲットの gcc コンパイラーへ戻す
- インテル® C++ コンパイラーと GNU* gcc を使用して x86 および ARM* APK を生成する
- Fortran と C のオフロード宣言子/指示句と関数
- 金融向けサービス
- OpenGL* ES 2.0 における動的な解像度のレンダリング
- PROJECT ANARCHY™ を発表 – HAVOK™ による無料のモバイル向けゲームエンジン
- インテル® C++ コンパイラーでサポートされる C99 の機能
- combiner/aggregator 同期プリミティブ
- インテル® Software Development Emulator とインテル® Transactional Synchronization Extensions の紹介
- HPC パフォーマンスの測定
- SVEN (System Visible Event Nexus) の概要
- 組込みシステムにおけるインテル® C++ コンパイラーの利用
- インテル® System Studio を使用する理由
- インテル® AVX をサポートする第 2 および第 3 世代インテル® Core™ プロセッサー・ファミリー向けに手動でコードを配置するには
- jQuery と CSS によるハノイの塔の実装
- ベクトル化レポートの行番号とソースの行番号の関連付け
- ベクトル化レポートと新しいレベル -vec-report6 の概要
- ベクトル化および最適化レポート
- ガイド付き自動並列化
- モバイルデバイス向け HTML5 および JavaScript エンジン JIT の最適化
- インテル® C++/Fortran コンパイラーのベクトル化レポートを基にソースに注釈を付ける Python* スクリプト
- インテル® ソフトウェア開発製品テクニカルガイド
- OMP_PROC_BIND の振る舞いがインテル製品以外のプロセッサーとの互換性をサポートしました
- インテル® IPP DLL を含むアプリケーションの配布
- 謹賀新年 2013 「iSUS お年玉」企画
- 2012年 人気記事ランキング
- インテル® コンパイラーを初めて使う際に知っておくべきこと
- 製品のサポートサービス規定、納品形態変更のお知らせ
- PAOS – パックド構造体配列
- 遅延モード画像処理フレームワーク: インテル® IPP によるインテル® マルチコア・テクノロジーとメニーコア・アーキテクチャーの単純かつ効率的な利用
- 半精度浮動小数点の使用によるパフォーマンスの向上
- OSCA™ オープンソース技術解説セミナー (10月25日)
- Linux*/Java* スタック上におけるインテル® AES-NI パフォーマンス・テスト
- スレッドローカル変数へのアクセスに隠されたパフォーマンス・コスト
- 電力効率の良いアプリケーション・ソフトウェアの設計
- アプリのパフォーマンスを向上する開発ツールスイート インテル® Parallel Studio XE 新バージョン 2013 リリース
- インテル® DRNG (Digital Random Number Generator) ソフトウェア実装ガイド
- Rdrand ライブラリーのユーザーマニュアル
- ガイド付き自動並列化 (GAP)
- ゲームエンジンのタスク処理 (アニメーション) - サンプル・プロジェクトのダウンロード
- ハイパースレッディング: サーバーのエンドユーザー応答時間の正しい測定方法
- OpenMP* を使用したその他のワークシェア
- 高度な OpenMP* プログラミング
- ハイブリッド・アプリケーション: インテル® MPI ライブラリーと OpenMP*
- MPI と OpenMP* の併用によりハードウェアを活用する
- タスク・マネージャーにおけるゲームスレッド API のパフォーマンスの比較
- C# コードからインテル® IPP 関数を呼び出す
- インテル® IPP を使用してインテル製マルチコア・プロセッサーの詳細情報を取得する
- インテル® コンパイラーによる OpenMP* 入門 (全8回)
- 新しいマイクロアーキテクチャーでアプリケーションはどのように実行されるのか? この疑問に答えるインテル® VTune™ Amplifier XE 2011
- インテル® AVX 命令を使用してビデオ処理ソフトウェアの計算パフォーマンスを向上する
- 「電力効率が良い」とは?
- cpuinfo: インテル® MPI ライブラリーのプロセッサー情報ユーティリティー
- インテル® Parallel Studio XE 2013 ベータプログラム実施中
- MPI/OpenMP* のハイブリッド・プログラミングを始めよう
- インテル® Cluster Studio XE 2012 を利用した MPI/OpenMP* ハイブリッド・アプリケーション: ノードレベルまで最適化
- HPL 向けアプリケーション・ノート
- プロセスピニングを使用する分散メモリー Co-Array プログラム
- 6/28 博多で開催 インテル® ソフトウェア・カンファレンス
- インテル® Fortran Studio XE によるマンデルブロー描画プログラムの高速化
- PARDISO 使用時のヒント
- インテル® マス・カーネル・ライブラリーの FFTW3 インターフェイス
- FFTW3 ラッパーの使用
- Fortran からのラッパーの呼び出し
- 独自のラッパー・ライブラリーのビルド
- アプリケーションのビルド
- サンプルプログラムの実行
- インテル® コンパイラー入門 (全10回)
- サマリー統計ライブラリーの概要
- インテル® C++ コンパイラーのベクトル化ガイド
- マルチコア・プロセッサーにおける 3 次元有限差分法の実装
- スリープループによる消費電力とパフォーマンスの改善
- x64 アセンブリーの概要
- レイテンシーの長い命令の影響を特定する
- AVX-SSE 切り替えペナルティーを回避する
- マルチスレッド開発ガイド: 4.7 データ構造とメモリー・アクセス・パターンを最適化してデータの局所性を高める
- クロススレッド・スタック・アクセスは競合状態か?
- セグメンテーション・フォルト SIGSEGV や SIGBUS エラーの原因を特定する
- バーゼル大学 (UB: Universität Basel) が提供する PARDISO* とインテル® MKL の PARDISO API における相違点の概要
- インテル ソフトウェア開発製品:並列化、高速化をしよう!抽選でインテル グッズセットをプレゼント
- Haswell のトランザクション同期
- 粗粒度のロックとトランザクション同期
- ムーアの法則を超えるパフォーマンス向上率への対応: インテル® Cluster Studio XE
- インテル® MKL と IMSL* Fortran 数値ライブラリーの使用
- iSUS ラウンドテーブル開催 (2月23日) のご案内
- Fortran アプリケーションにおけるインテル® Inspector XE の使用 – パート 3 スタティック・セキュリティー解析
- OpenMP* のサポート・ライブラリー
- インテル® Performance Bottleneck Analyzer
- インテル® FLEXlm* ライセンス借用機能
- James Reinders インタビュー: 質問 13. キャリア目標を達成するための秘訣
- James Reinders インタビュー: 質問 12. 週末の過ごし方と趣味について
- OpenMP* を使用して既存のシリアルコードで並列処理の可能性を見つけよう
- インテル® IPP における OpenMP* サポートの変更
- OMP Abort エラーが発生した場合の対処方法
- インテル® OpenCL SDK 環境におけるインテル® VTune™ Amplifier XE 2011 の操作
- 新春キャンペーン 「ソケットを探せ!!」
- 新年おめでとうございます
- OpenMP 特集に向けて
- OpenMP* 入門
- インテル® C++/Fortran コンパイラーによる OpenMP* 3.1 仕様のサポート
- C++ 開発者が陥りやすい OpenMP* の 32 の罠
- 2011年 iSUS 人気記事ランキング発表!
- インテル® Parallel Studio XE を使用した Linux* 環境での Fortran プログラムの正当性解析
- Fortran アプリケーションにおけるインテル® Inspector XE の使用 – パート 1 メモリー解析
- Fortran アプリケーションにおけるインテル® Inspector XE の使用 – パート 2 スレッド解析
- Windows* 環境での分散 Co-Array アプリケーションのビルドと実行
- 64 コアを超える Windows 環境でマルチスレッド・プログラミングをしてみる
- インテル® MKL の BLAS と DGEMM ルーチンを使用したインテル® AVX の最適化
- インテル® AVX 命令を使用した complex float データ型の IIR フィルターの実装
- 球面線形補間 (Slerp) におけるインテル® AVX の利点
- インテル® AVX を使用した Wiener フィルターの実装
- 小行列演算におけるインテル® AVX の利点
- 256 ビットのインテル® AVX を使用した 3D ベクトルの正規化
- インテル® AVX を使用した逆離散コサイン変換の実装
- インテル® AVX を使用した IIR ガウスぼかしフィルターの実装
- インテル® クイック・シンク・ビデオのパフォーマンスの最適化(第3回)
- インテル® VTune™ Amplifier XE Linux* 版を使用するためのコンパイラー・オプション
- インテル® IPP サンプル – エラーの修正
- マルチスレッド・アプリケーションからインテル® MKL ルーチンを呼び出す場合の推奨設定
- iSUS へようこそ!!
- インテル® コンパイラーによる AVX 最適化入門: 第4回 AVX への最適化について(その3)
- インテル® クイック・シンク・ビデオのパフォーマンスの最適化(第2回)
- インテル® IPP 7.0 ライブラリーとのリンクの概要
- インテル® コンパイラーによる AVX 最適化入門: 第3回 AVX への最適化について(その2)
- インテル® クイック・シンク・ビデオのパフォーマンスの最適化(第1回)
- hotspot 解析で MPI ジョブからスポーンされたプロセスを追跡できない理由
- [Bottom-up (ボトムアップ)] ペインと [Call Stack (コールスタック)] ペインの不一致
- インテル® Parallel Studio XE、インテル® C++ Studio XE 新価格でお求めやすくなりました!
- インテル® コンパイラーによる AVX 最適化入門: 第2回 AVX への最適化について(その1)
- インテル® ハイパースレッディング・テクノロジーのパフォーマンスに関する考察
- インテル® Parallel Studio XE を使用した Windows* 上での Fortran プログラムのパフォーマンス解析
- インテル® コンパイラーによる AVX 最適化入門: 第1回 AVX とは
- インテル® パフォーマンス・アナライザーの比較
- イベント・ベース・サンプリング (EBS) を使用した FLOPS の推定
- コンパイラー最適化入門: 第6回 ベクトル化の裏技集
- Intel® OpenCL SDK 1.1 の導入
- iSUS 主催 「サマーキャンプ 2011」資料公開
- iSUS 夏休み企画: Tシャツがもらえるキャンペーン
- OpenSimulator 仮想世界サーバーのケーススタディー (パート 3)
- OpenSimulator 仮想世界サーバーのケーススタディー (パート 2)
- OpenSimulator 仮想世界サーバーのケーススタディー (パート 1)
- James Reinders 氏インタビュー
- コンパイラー最適化入門: 第5回 明示的にベクトル化されたコードを記述する
- ゲーム AI の設計 (その 4) – AI の活用: スレッド化
- ゲーム AI の設計 (その 3) – 戦術 AI と戦略 AI
- ゲーム AI の設計 (その 2) – 知覚とパス検索
- ゲーム AI の設計 (その 1) – 設計と実装
- James Reinders インタビュー: 質問 11. インテル Cilk Plus のサポート予定
- James Reinders インタビュー: 質問 10. さまざまな並列化モデルの位置付け
- インテル® VTune™ Amplifier XE 2011 日本語ヘルプファイル公開
- コンパイラー最適化入門: 第4回 自動ベクトル化はどんな時に行われるか
- タスク処理によるゲーム・エンジン・システムのスケーリング
- マルチコアシステム向けの実用的なゲーム・アーキテクチャー
- 容易に移植可能なゲームを開発するための 6 つのヒント
- インテル® プロセッサー・グラフィックスについてよくある誤解
- James Reinders インタビュー: 質問 9. 並列化を習得するためのアドバイス
- James Reinders インタビュー: 質問 8. 米国における並列化に対する取り組み
- James Reinders インタビュー: 質問 7. 並列プログラミングの重要性
- コンパイラー最適化入門: 第3回 インテル® コンパイラーのベクトル化レポートを活用する
- Intel® Software Developer Day 2011(7/15開催)
- インテル® Array Building Blocks に関する学術論文
- James Reinders インタビュー: 質問 6. AMD プロセッサーのサポート
- James Reinders インタビュー: 質問 5. 組み込み市場における今後の予定
- コンパイラー最適化入門: 第2回 SIMD 命令と伝統的な IA 命令
- 並列性 (パラレリズム) は決定論に影響するか?
- 並列プログラミングにおけるロックの効率的な使用
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻 (番外写真集)
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- E3 Expo に行ってきました! の巻
- James Reinders インタビュー: 質問 4. マネージ言語のサポート
- James Reinders インタビュー: 質問 3. インテル ソフトウェアの利用分野
- インテル® コンパイラー 11.x プロフェッショナル・エディションでインストールされるインテル® IPP、インテル® MKL、およびインテル® TBB のバージョン
- ようこそ!
- コンパイラー最適化入門: 第1回 SIMD 命令とプロセッサーの関係
- 並列プログラミングのエキスパートのようになるには
- 並列プログラミングのエキスパートのようになるには – パート 4: 並列ソフトウェアの作成
- 並列プログラミングのエキスパートのようになるには – パート 3: 並列コンピューティング問題
- 並列プログラミングのエキスパートのようになるには – パート 2: 並列ハードウェア
- 並列プログラミングのエキスパートのようになるには – パート 1: 並行性 (コンカレンシー) と並列性 (パラレリズム)
- インテル® Parallel Advisor が Studio XE 製品で利用可能に
- James Reinders インタビュー: 質問 2. インテル® Parallel Studio XE の特長
- James Reinders インタビュー: 質問 1. IA Software User Society (iSUS) へ期待すること
- James Reinders インタビュー: 日本の皆様へのメッセージ
- インテル® Tiber™ デベロッパー・クラウド対応日本語パッケージ (iSUS 翻訳版) ダウンロード・ページ
参考文献 (C/C++)
インテル® C++ コンパイラーによるベクトル化へのガイド
ベクトル化の基本: 役立つ参考記事。
ループをベクトル化するための条件
新しい最適化レポートを使用してインテル® コンパイラーをさらに活用する
インテルの最新の並列化ツールによる明示的なベクトル化
参考文献 (Fortran)
コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください