DPCT1118#

メッセージ#

SYCL* グループ関数とアルゴリズムは、収束制御フローで検出される必要があります。

詳細な説明#

SYCL* グループ関数とアルゴリズムは、work-ghroup 内のすべてのワーク項目の収束制御フローで使用する必要があります。ワーク項目がカーネルを完了し、barrier などの work-group の集合操作に到達することなく終了した場合、集合操作に到達する work-group 内のほかのすべてのワーク項目は、完了したワーク項目を持ちます。

追加情報については、条件文で使用されるグループバリアなど、work-group レベルの同期が原因で SYCL* コードがハングする問題を修正するにはどうすればいいですか? を参照してください。

修正方法の提案

例えば、以下のオリジナル CUDA* コードについて考えてみます。

  __global__ void kernel(float *data) { 
   int tid = threadIdx.x; 
   if (tid < 32) { 
     if (data[tid] < data[tid + 32]) { 
       data[tid] = data[tid + 32]; 
     } 
     __syncthreads(); 
     ...
   } 
 }

このコードは、以下の SYCL* コードに移行されます。

  void kernel(float *data, const sycl::nd_item<3> &item_ct1) { 
   int tid = item_ct1.get_local_id(2); 
   if (tid < 32) { 
     if (data[tid] < data[tid + 32]) { 
       data[tid] = data[tid + 32]; 
     } 
   /* 
   DPCT1118:0: SYCL group functions and algorithms must be encountered in converged control flow.You should check this condition holds.
   */ 
  /* 
  DPCT1065:1: Consider replacing sycl::nd_item::barrier() with sycl::nd_item::barrier(sycl::access::fence_space::local_space) for better performance if there is no access to global memory.
  */ 
  item_ct1.barrier(); 
  } 
 }

このコードは次のように書き換えられます。

  void kernel(float *data, const sycl::nd_item<3> &item_ct1) { 
   int tid = item_ct1.get_local_id(2); 
 
   if (tid < 32) { 
     if (data[tid] < data[tid + 32]) { 
       data[tid] = data[tid + 32]; 
     } 
   } 
   item_ct1.barrier(); 
      ... 
 }

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス

DPCT1118

目次

DPCT1118#

メッセージ#

詳細な説明#

修正方法の提案

インテル® DPC++互換性ツール・デベロッパー・ガイドおよびリファレンス

DPCT1118

目次

DPCT1118#

メッセージ#

詳細な説明#

修正方法の提案

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス