推定パッケージ追加手順（開発者向け）

このドキュメントは、BenchKit に新しい推定 package を追加する開発者向けガイドです。現在の実装では、package は「推定ロジックと package 固有 metadata を持つ側」、BenchKit 共通層は「flow と JSON 受け渡しを持つ側」として考えると整理しやすいです。

1. 最初に決めること

新しい package を書き始める前に、まず次を決めます。

top-level package か section / overlap package か
何を入力として受け取るか
入力不足時に fallback できるか
何を bench_time -> time に変換するか
どの assumptions / model / measurement を返したいか

最初の package では、欲張らずに

1 種類の入力
1 つの変換規則
1 つの applicability 方針

から始めるのがおすすめです。

2. どこに置くか

現在の実装では、主に次に分かれます。

top-level package
- scripts/estimation/packages/
section package
- scripts/estimation/section_packages/

この配置は現時点の約束です。将来、推定 package が増えた場合にディレクトリ名や登録方法を見直す可能性があります。そのため、package 固有のロジック、metadata、applicability 判定はこの配下に閉じ、BenchKit 共通層へ app 固有・package 固有の処理を混ぜないようにしてください。

qws の詳細ダミー推定では、たとえば次のような分担です。

top-level
- instrumented_app_sections_dummy.sh
section / overlap
- identity.sh
- logp.sh
- counter_papi_detailed.sh
- trace_mpi_basic.sh
- overlap_max_basic.sh
- gpu_kernel_mlp_v15.sh

3. top-level package の責務

top-level package は、主に次を担当します。

metadata を返す
applicability を判定する
breakdown 全体を変換する
top-level FOM を組み立てる
side ごとの model 情報を返す

少なくとも、weakscaling や instrumented_app_sections_dummy のような top-level package では、section / overlap ごとの bound package をどう dispatch するかを意識します。

4. section / overlap package の責務

section package はもっと小さくてかまいません。主に次を返せれば十分です。

metadata
applicability
1 区間の変換結果

ここでは「1 区間の変換規則」に集中し、Estimate JSON 全体の組み立てや current / future の side 管理は BenchKit 共通層や top-level package 側へ寄せる方が自然です。

GPU kernel 単位の外部推定ツールは、通常は section package として扱います。たとえば gpu_kernel_mlp_v15 は、PerfTools の MLP_NN/v1.5 を「GPU 区間だけを変換する package」として接続します。 top-level package は instrumented_app_sections_dummy などのままにして、GPU 区間にだけ gpu_kernel_mlp_v15 を割り当てます。

bk_declare_section --side future gpu_kernel_region gpu_kernel_mlp_v15
bk_emit_declared_section --side future gpu_kernel_region "$measured_gpu_time" results/estimation_artifacts/gpu_kernel_region_input.csv

PerfTools 本体は BenchKit に vendoring せず、実行時に次の環境変数で渡します。

export BK_GPU_MLP_PERFTOOLS_ROOT=/path/to/PerfTools
export BK_GPU_MLP_PYTHON=python3

section artifact は PerfTools 側の static GPU spec sheet から作られた prepared CSV を想定します。 BenchKit 実行時に GPU spec を動的採取しません。テストやデバッグでは、既に作成済みの prediction CSV を使えます。

export BK_GPU_MLP_ARTIFACT_MODE=prediction
# or section-specific override:
export BK_GPU_MLP_PREDICTION_CSV_GPU_KERNEL_REGION=/path/to/pred.csv

section package は prediction CSV の Execution Time [ns] を合算し、その section の future-side time にします。

qws を使って CI 配管だけを確認する場合は、実際の qws が GPU 化されていなくても GPU MLP smoke test を有効にできます。 BK_QWS_GPU_MLP_SMOKE_MODE=prediction では、同梱のサンプル prediction CSV を使い、run job が gpu_kernel_region section と prediction CSV artifact を結果に埋め込みます。 BK_QWS_GPU_MLP_SMOKE_MODE=perftools では、estimate job が PerfTools repo を checkout し、MLP_NN/examples/example_input_mixed-src_20kernels.csv を predict_v15.py に渡して prediction CSV を生成します。どちらのモードでも、estimate job が gpu_kernel_mlp_v15 section package を通して Estimate JSON へ変換できることを確認します。 qws の推定スクリプト単体では既定無効ですが、GPU estimator integration の立ち上げ期間中は GitLab CI 側の既定を一時的に有効化しています。

export BK_QWS_GPU_MLP_SMOKE=true
export BK_QWS_GPU_MLP_SMOKE_MODE=perftools
export BK_ESTIMATE_RUNNER_TAG=<python-and-jq-estimator-runner-tag>
export BK_GPU_MLP_PERFTOOLS_REPO=https://github.com/masaaki-kondo/PerfTools.git
export BK_GPU_MLP_PERFTOOLS_REF=main

これらの変数は、GPU estimator integration の立ち上げ期間だけの暫定スイッチです。 BK_QWS_GPU_MLP_SMOKE は qws を使った配管確認用、BK_QWS_GPU_MLP_SMOKE_MODE は prediction fixture 取り込みと PerfTools 実行の切り替え用、BK_ESTIMATE_RUNNER_TAG は推定用 runner/container を手動で逃がすためのものです。実際の GPU profiling input と推定 runner の運用が固まったら、専用の package/runner 設定へ置き換え、これらの暫定変数は削除対象として見直してください。

perftools smoke mode は GitHub から PerfTools を取得するため、推定 runner/container には git と外部接続、Python 3.12 以上、numpy/pandas/torch が必要です。実運用では smoke mode ではなく、推定 runner/container に PerfTools checkout を用意し、section artifact として実アプリ由来の prepared input CSV を渡してください。

5. metadata に持たせるもの

現在の実装では、package metadata がかなり重要です。少なくとも top-level package では、次を metadata に持たせる前提で考えると整理しやすいです。

name
version
method_class
detail_level
required_inputs
required_result_fields
supported_section_packages
supported_overlap_packages
output_fields
not_applicable_when
fallback_policy
models
defaults

特に models には、必要に応じて次を持たせます。

top_level
current_system
future_system
recorded_current

また defaults には、少なくとも次を持たせると共通層に寄せやすいです。

defaults.measurement
defaults.confidence
defaults.notes
defaults.assumptions

BenchKit 共通層は、これらを読んで Estimate JSON に写像する役割を主に持ちます。

6. package 側に持たせるべきもの

package 側で持つべきなのは、主に次です。

推定ロジックそのもの
必要入力と不足条件
fallback / not_applicable の方針
model 名や model type などの package 固有 metadata
assumptions / measurement / confidence / notes の package 固有既定値

逆に、package 側が毎回持たなくてよいのは次です。

Estimate JSON 全体の手組み
requested / applied package の記録
current / future の side ごとの JSON 組み立て
UUID / timestamp の保存
保存後の portal 表示

7. app 固有 section 名をどこまで見るか

top-level package が app 固有の section 名まで固定前提で持ちすぎるのは避けた方がよいです。 section 名そのものより、

bound package があるか
必要 artifact があるか
fallback 先があるか
system relation が成立するか

を主に見る形の方が、他 app へ横展開しやすくなります。

instrumented_app_sections_dummy でも、現在は固定 section 名そのものを前提にせず、bound package や必要入力の成立を主に見る方向へ寄せています。

8. fallback と not_applicable

実装時には、少なくとも次を明示できるとよいです。

fallback
- この package では直接扱えないが、より軽い package へ落とせる
not_applicable
- 必要入力や system relation が満たせず、推定を返すべきでない

特に fallback を使うときは、

最初に要求された package
実際に適用した package
なぜ切り替えたか

が Estimate JSON や portal 側で追えることが重要です。

9. 確認ポイント

単体で見るポイント

metadata が返せる
applicability が返せる
入力不足時に理由が見える
fallback 先があるなら返せる

全体で見るポイント

requested / applied package が残る
current / future package が必要なら分かれる
model 情報が side ごとに残る
applicability が top-level に集約される
portal の detail や、将来の compare UI で意味が読める

10. いまの見方

現状の BenchKit では、package を書き始める土台はかなり整っています。

package metadata を共通層へ写像する流れがある
current / future package を分けられる
current_system.model / future_system.model を side ごとに持てる
requested / applied package や fallback 理由を残せる
portal の estimated detail では section / overlap 単位の fallback / applicability まで追える

一方で、まだ未完なのは次です。

package metadata discovery の一般化
複数 detailed package の本格実装
compare UI での package 差分の見せ方
reestimation や compare と package metadata をどう結び付けるか

そのため、最初の package では「小さく動かして、metadata と責務分担を崩さない」ことを優先するのがよいです。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

推定パッケージ追加手順（開発者向け）

1. 最初に決めること

2. どこに置くか

3. top-level package の責務

4. section / overlap package の責務

5. metadata に持たせるもの

6. package 側に持たせるべきもの

7. app 固有 section 名をどこまで見るか

8. fallback と not_applicable

9. 確認ポイント

単体で見るポイント

全体で見るポイント

10. いまの見方

FilesExpand file tree

add-estimation-package.md

Latest commit

History

add-estimation-package.md

File metadata and controls

推定パッケージ追加手順（開発者向け）

1. 最初に決めること

2. どこに置くか

3. top-level package の責務

4. section / overlap package の責務

5. metadata に持たせるもの

6. package 側に持たせるべきもの

7. app 固有 section 名をどこまで見るか

8. fallback と not_applicable

9. 確認ポイント

単体で見るポイント

全体で見るポイント

10. いまの見方