DPCT1008#
メッセージ#
<function name>
関数は SYCL* では定義されていません。これは、ハードウェア固有の機能です。代替関数については、ハードウェア・ベンダーにお問い合わせください。
説明#
clock 関数呼び出しは、SYCL* では定義されていないため、置き換えられませんでした。このハードウェア固有の機能を、ハードウェア・ベンダーが提供するものに置き換えてください。
修正方法の提案#
代替関数については、ハードウェア・ベンダーにお問い合わせください。
例えば、以下のオリジナル CUDA* コードについて考えてみます。
1__global__ void k(clock_t *timer) {
2 int tid = threadIdx.x;
3 if (tid == 0)
4 timer[0] = clock();
5
6 // workload
7
8 __syncthreads();
9 if (tid == 0)
10 timer[1] = clock();
11}
12
13int main() {
14 clock_t *dtimer = NULL;
15 cudaMalloc((void **)&dtimer, sizeof(clock_t) * 2);
16 clock_t timer[2];
17 k<<<1, 128>>>(dtimer);
18 cudaMemcpy(timer, dtimer, sizeof(clock_t) * 2, cudaMemcpyDeviceToHost);
19 cudaFree(dtimer);
20 long double time = timer[1] - timer[0];
21 return 0;
22}
このコードは、以下の SYCL* コードに移行されます。
1#include <sycl/sycl.hpp>
2#include <dpct/dpct.hpp>
3#include <time.h>
4void k(clock_t *timer, sycl::nd_item<3> item_ct1) {
5 int tid = item_ct1.get_local_id(2);
6 if (tid == 0)
7 /*
8 DPCT1008:1: clock function is not defined in SYCL.This is a
9 hardware-specific feature.Consult with your hardware vendor to find a
10 replacement.11 */
12 timer[0] = clock();// clock() is used to measure the kernel runtime
13
14 // workload
15
16 item_ct1.barrier();
17 if (tid == 0)
18 /*
19 DPCT1008:2: clock function is not defined in SYCL.This is a
20 hardware-specific feature.Consult with your hardware vendor to find a
21 replacement.22 */
23 timer[1] = clock();
24}
25
26int main() {
27 dpct::device_ext &dev_ct1 = dpct::get_current_device();
28 sycl::queue &q_ct1 = dev_ct1.default_queue();
29 clock_t *dtimer = NULL;
30 dtimer = sycl::malloc_device<clock_t>(2, q_ct1);
31 clock_t timer[2];
32 q_ct1.parallel_for(
33 sycl::nd_range<3>(sycl::range<3>(1, 1, 128), sycl::range<3>(1, 1, 128)),
34 [=](sycl::nd_item<3> item_ct1) {
35 k(dtimer, item_ct1);
36 });
37 q_ct1.memcpy(timer, dtimer, sizeof(clock_t) * 2).wait();
38 sycl::free(dtimer, q_ct1);
39 long double time = timer[1] - timer[0];
40 return 0;
41}
このコードは次のように書き換えられます。
1#define DPCT_PROFILING_ENABLED
2#include <sycl/sycl.hpp>
3#include <dpct/dpct.hpp>
4#include <time.h>
5void k(sycl::nd_item<3> item_ct1) {
6 // workload
7}
8
9int main() {
10 dpct::device_ext &dev_ct1 = dpct::get_current_device();
11 sycl::queue &q_ct1 = dev_ct1.default_queue();
12 dpct::event_ptr start;
13 dpct::event_ptr end;
14 start = new sycl::event();
15 end = new sycl::event();
16 *start = q_ct1.ext_oneapi_submit_barrier();
17 q_ct1.parallel_for(
18 sycl::nd_range<3>(sycl::range<3>(1, 1, 128), sycl::range<3>(1, 1, 128)),
19 [=](sycl::nd_item<3> item_ct1) {
20 k(item_ct1);
21 });
22 *end = q_ct1.ext_oneapi_submit_barrier();
23 end->wait_and_throw();
24 long double time =
25 (end->get_profiling_info<sycl::info::event_profiling::command_end>() -
26 start
27 ->get_profiling_info<sycl::info::event_profiling::command_start>()) /
28 1000000.0f; return 0;
29}