Tune the amount of groups in `__parallel_find_or` pattern #1723

SergeyKopienko · 2024-07-23T12:08:13Z

In this PR we tune the amount of groups in __parallel_find_or pattern.
This approach give us some performance boost on bigger data sizes.

adamfidel

A few questions:

It is stated that the performance is better for larger input sizes. Does this have any affect on smaller input sizes?
For which devices do we see a performance benefit?

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

julianmi

I think a simpler tuning approach you might want to try is to fix __iters_per_work_item to powers of two based on the input sizes. This might generate more optimized code and would remove the need for the complex approach of calculating __n_groups.

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

SergeyKopienko · 2024-07-25T11:36:25Z

@julianmi, @danhoeflinger, @adamfidel implementation has been updated.

I wrote calculation of __required_iters_per_work_item in __parallel_find_or_n_groups_tuner<oneapi::dpl::__internal::__device_backend_tag>::operator() in the formula form.

We still have good perf profit for a lot of sizes.

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

SergeyKopienko · 2024-08-08T11:10:33Z

@danhoeflinger, @julianmi, @adamfidel Could you please take a look again?

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl_utils.h

…iters_per_work_item > 1 Signed-off-by: Sergey Kopienko <[email protected]>

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

Signed-off-by: Sergey Kopienko <[email protected]>

Co-authored-by: Alexey Kukanov <[email protected]>

…dpl::__internal::__device_backend_tag>::operator() Signed-off-by: Sergey Kopienko <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

Co-authored-by: Alexey Kukanov <[email protected]>

Signed-off-by: Sergey Kopienko <[email protected]>

…ve loop in __parallel_find_or_nd_range_tuner<oneapi::dpl::__internal::__device_backend_tag>::operator()

Signed-off-by: Sergey Kopienko <[email protected]>

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

Signed-off-by: Sergey Kopienko <[email protected]>

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

Co-authored-by: Alexey Kukanov <[email protected]>

danhoeflinger

LGTM

SergeyKopienko requested review from danhoeflinger, julianmi and adamfidel July 23, 2024 12:08

SergeyKopienko marked this pull request as ready for review July 23, 2024 12:08

SergeyKopienko added this to the 2022.7.0 milestone Jul 23, 2024

adamfidel reviewed Jul 23, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko requested a review from adamfidel July 24, 2024 07:39

julianmi reviewed Jul 24, 2024

View reviewed changes

SergeyKopienko requested a review from julianmi July 24, 2024 10:20

danhoeflinger reviewed Jul 24, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko force-pushed the dev/skopienko/tune_n_groups branch from b1544cd to 50e4789 Compare July 25, 2024 10:06

SergeyKopienko requested a review from danhoeflinger July 25, 2024 11:36

danhoeflinger reviewed Jul 29, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko removed this from the 2022.7.0 milestone Jul 30, 2024

SergeyKopienko marked this pull request as draft July 30, 2024 16:15

SergeyKopienko force-pushed the dev/skopienko/tune_n_groups branch 8 times, most recently from 6130b17 to 44bcf79 Compare August 7, 2024 13:37

SergeyKopienko marked this pull request as ready for review August 8, 2024 11:09

SergeyKopienko added this to the 2022.7.0 milestone Aug 8, 2024

SergeyKopienko requested a review from danhoeflinger August 8, 2024 11:10

SergeyKopienko commented Aug 8, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl_utils.h Show resolved Hide resolved

SergeyKopienko commented Aug 8, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl_utils.h Show resolved Hide resolved

Fix performance degradation for 64K of source data: tune only when __…

e8f59e8

…iters_per_work_item > 1 Signed-off-by: Sergey Kopienko <[email protected]>

SergeyKopienko force-pushed the dev/skopienko/tune_n_groups branch from aedac45 to e8f59e8 Compare August 9, 2024 08:18

akukanov reviewed Aug 9, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko and others added 4 commits August 9, 2024 14:51

Apply GitHUB clang format

9dd761c

Signed-off-by: Sergey Kopienko <[email protected]>

Update include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

67e59d4

Co-authored-by: Alexey Kukanov <[email protected]>

Using structure binding in __parallel_find_or_nd_range_tuner<oneapi::…

f2332af

…dpl::__internal::__device_backend_tag>::operator() Signed-off-by: Sergey Kopienko <[email protected]>

Fix review comment: remove __parallel_find_or_nd_range_tuner_common

5eb4720

Signed-off-by: Sergey Kopienko <[email protected]>

akukanov reviewed Aug 9, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko and others added 7 commits August 9, 2024 15:05

Update include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

001a75f

Co-authored-by: Alexey Kukanov <[email protected]>

Remove alias and extra closing bracket

58bb632

Signed-off-by: Sergey Kopienko <[email protected]>

Fix comment

d3ba89b

Signed-off-by: Sergey Kopienko <[email protected]>

Fix review comment: remove __base_rng_n

dbb77e4

Signed-off-by: Sergey Kopienko <[email protected]>

__k = std::pow(2, std::ceil(std::log2(__k)));Fix review comment: remo…

193983b

…ve loop in __parallel_find_or_nd_range_tuner<oneapi::dpl::__internal::__device_backend_tag>::operator()

Fix review comments: __current_iters_per_work_item is not required

b2af0e8

Signed-off-by: Sergey Kopienko <[email protected]>

Fix review comments: __current_iters_per_work_item is not required

4922f46

Signed-off-by: Sergey Kopienko <[email protected]>

SergeyKopienko force-pushed the dev/skopienko/tune_n_groups branch from 5d266b3 to 4922f46 Compare August 9, 2024 16:10

SergeyKopienko added 2 commits August 9, 2024 18:54

Fix review comment

0f9a60d

Signed-off-by: Sergey Kopienko <[email protected]>

Fix review comment

258f043

Signed-off-by: Sergey Kopienko <[email protected]>

danhoeflinger reviewed Aug 9, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

SergeyKopienko added 3 commits August 12, 2024 09:38

Fix review comment: // TODO : need to re-evaluate this formula.

adff34e

Signed-off-by: Sergey Kopienko <[email protected]>

Fix review comment: use float type instead auto

e48be00

Signed-off-by: Sergey Kopienko <[email protected]>

Add const to std::size_t __k

99fed47

Signed-off-by: Sergey Kopienko <[email protected]>

SergeyKopienko requested review from danhoeflinger and akukanov August 12, 2024 09:32

akukanov reviewed Aug 12, 2024

View reviewed changes

include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h Outdated Show resolved Hide resolved

Update include/oneapi/dpl/pstl/hetero/dpcpp/parallel_backend_sycl.h

65ce105

Co-authored-by: Alexey Kukanov <[email protected]>

akukanov approved these changes Aug 12, 2024

View reviewed changes

danhoeflinger approved these changes Aug 12, 2024

View reviewed changes

SergeyKopienko merged commit 52efa5b into main Aug 12, 2024
20 of 21 checks passed

SergeyKopienko deleted the dev/skopienko/tune_n_groups branch August 12, 2024 12:40

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Tune the amount of groups in `__parallel_find_or` pattern #1723

Tune the amount of groups in `__parallel_find_or` pattern #1723

SergeyKopienko commented Jul 23, 2024 •

edited

Loading

adamfidel left a comment

julianmi left a comment

SergeyKopienko commented Jul 25, 2024 •

edited

Loading

SergeyKopienko commented Aug 8, 2024

danhoeflinger left a comment

Tune the amount of groups in __parallel_find_or pattern #1723

Tune the amount of groups in __parallel_find_or pattern #1723

Conversation

SergeyKopienko commented Jul 23, 2024 • edited Loading

adamfidel left a comment

Choose a reason for hiding this comment

julianmi left a comment

Choose a reason for hiding this comment

SergeyKopienko commented Jul 25, 2024 • edited Loading

SergeyKopienko commented Aug 8, 2024

danhoeflinger left a comment

Choose a reason for hiding this comment

Tune the amount of groups in `__parallel_find_or` pattern #1723

Tune the amount of groups in `__parallel_find_or` pattern #1723

SergeyKopienko commented Jul 23, 2024 •

edited

Loading

SergeyKopienko commented Jul 25, 2024 •

edited

Loading