DPCT1049#

メッセージ#

SYCL* カーネルに渡される work-group サイズが制限を超えている可能性があります。デバイスの上限値は、info::device::max_work_group_size で照会できます。必要に応じて、work-group サイズを調整します。

詳細な説明#

SYCL* デバイスの SYCL* カーネルに渡される work-group サイズには制限があります (SYCL* 2020 仕様の「4.6.4.2 デバイス情報記述子」を参照)。

この警告は、ローカルレンジの次元をすべて評価できなかった場合や、ローカルレンジの次元の積が 256 以上の場合に表示されます。

修正方法の提案

info::device::max_work_group_size を照会して、使用するデバイスの work-group サイズの上限を定義します。コードで使用されている work-group サイズが制限値を下回っている場合は、この警告を無視できます。そうでない場合は、 work-group サイズを小さくする必要があります。

例えば、以下のオリジナル CUDA* コードについて考えてみます。

   __global__ void k() {} 
 
   void foo() { 
     k<<<1, 2048>>>(); 
   }

このコードは、以下の SYCL* コードに移行されます。

   void k() {} 
 
   void foo() { 
   /* 
   DPCT1049:0: The work-group size passed to the SYCL kernel may exceed the 
   limit.To get the device limit, query info::device::max_work_group_size.
   Adjust the work-group size if needed.
   */ 
     dpct::get_default_queue().parallel_for( 
    sycl::nd_range<3>(sycl::range<3>(1, 1, 2048), sycl::range<3>(1, 1, 2048)), 
    [=](sycl::nd_item<3> item_ct1) { 
    k(); 
    }); 
  }

このコードは次のように書き換えられます。

   void k() {} 
 
   void foo() { 
     size_t max_work_group_size = 
       dpct::get_default_queue() 
       .get_device() 
       .get_info<sycl::info::device::max_work_group_size>(); 
     size_t work_group_size = 2048; 
     if (work_group_size > max_work_group_size) { 
      work_group_size = max_work_group_size; 
    } 
    size_t work_group_num = std::ceil((float)2048 / (float)work_group_size); 
    dpct::get_default_queue().parallel_for( 
      sycl::nd_range<3>(sycl::range<3>(1, 1, work_group_num * work_group_size), 
      sycl::range<3>(1, 1, work_group_size)), 
      [=](sycl::nd_item<3> item_ct1) { k(); }); 
  }

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス

DPCT1049

目次

DPCT1049#

メッセージ#

詳細な説明#

修正方法の提案

インテル® DPC++互換性ツール・デベロッパー・ガイドおよびリファレンス

DPCT1049

目次

DPCT1049#

メッセージ#

詳細な説明#

修正方法の提案

インテル® DPC++
互換性ツール・
デベロッパー・ガイド
およびリファレンス