DPCT1087#

メッセージ#

SYCL* は現在、グループ間の同期をサポートしていません。--use-experimental-features=nd_range_barrier を指定すると、dpct ヘルパー関数 nd_range_barrier を使用して <同期 API 呼び出し> を移行できます。

詳細な説明#

デフォルトでは、CUDA* のグリッドレベル同期の移行に dpct ヘルパー関数 nd_range_barrier は使用されません。nd_range_barrier を使用して CUDA* のグリッドレベル同期を移行するには、移行コマンドで --use-experimental-features=nd_range_barrier を指定します。

修正方法の提案#

移行コマンドで --use-experimental-features=nd_range_barrier を指定し、dpct ヘルパー関数 nd_range_barrier を使用して CUDA* のグリッドレベル同期を移行します。

例えば、以下のオリジナル CUDA* コードについて考えてみます。

  __global__ void kernel() { 
   namespace cg = cooperative_groups; 
   cg::grid_group grid = cg::this_grid(); 
   grid.sync(); 
  } 
 
  void foo() { 
   kernel<<<1, 64>>>(); 
  }

このコードは、以下の SYCL* コードに移行されます。

  void kernel() { 
 
   /* 
   DPCT1087:1: SYCL currently does not support cross group synchronization. You 
   can specify "--use-experimental-features=nd_range_barrier" to use the dpct 
   helper function nd_range_barrier to migrate this_grid().
   */ 
   cg::grid_group grid = cg::this_grid(); 
   /* 
  DPCT1087:0: SYCL currently does not support cross group synchronization. You 
  can specify "--use-experimental-features=nd_range_barrier" to use the dpct 
  helper function nd_range_barrier to migrate grid.sync().
  */ 
  grid.sync(); 
 } 
 
 void foo() { 
  dpct::get_in_order_queue().parallel_for( 
    sycl::nd_range<3>(sycl::range<3>(1, 1, 64), sycl::range<3>(1, 1, 64)), 
    [=](sycl::nd_item<3> item_ct1) { 
    kernel(); 
  }); 
 }

このコードは次のように書き換えられます。

  void kernel(const sycl::nd_item<3> &item_ct1, 
   sycl::atomic_ref<unsigned int, sycl::memory_order::seq_cst, sycl::memory_scope::device, sycl::access::address_space::global_space> &sync_ct1) { 
 
   dpct::experimental::nd_range_barrier(item_ct1, sync_ct1); 
  } 
 
  void foo() { 
   dpct::global_memory<unsigned int, 0> d_sync_ct1(0); 
   unsigned *sync_ct1 = d_sync_ct1.get_ptr(dpct::get_in_order_queue()); 
  dpct::get_in_order_queue().memset(sync_ct1, 0, sizeof(int)).wait(); 
  dpct::get_in_order_queue().parallel_for( 
    sycl::nd_range<3>(sycl::range<3>(1, 1, 64), sycl::range<3>(1, 1, 64)), 
    [=](sycl::nd_item<3> item_ct1) { 
    auto atm_sync_ct1 = 
    sycl::atomic_ref<unsigned int, sycl::memory_order::seq_cst, 
    sycl::memory_scope::device, 
    sycl::access::address_space::global_space>( 
    sync_ct1[0]); 
    kernel(item_ct1, atm_sync_ct1); 
  }) 
  .wait(); 
 }

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス

DPCT1087

目次

DPCT1087#

メッセージ#

詳細な説明#

修正方法の提案#

インテル® DPC++互換性ツール・デベロッパー・ガイドおよびリファレンス

DPCT1087

目次

DPCT1087#

メッセージ#

詳細な説明#

修正方法の提案#

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス