kernel void compiler_rhadd(global int *src1, global int *src2, global int *dst) { int i = get_global_id(0); dst[i] = rhadd(src1[i], src2[i]); }