compile 파이프 라인과 lower_ir_cuda 에서의 registry 탐색 ( b.ops 와 사전 정의한 registry 와의 매칭

compile 파이프라인에서 각 단계가 보는 것

Layer.emit 으로 쌓인 IR 의 원본

아직 identity

핵심 IR - 실행 가능 단위 변환

여기서 plan 의 생성 메모리 / alias / workspace / 실행 순서

이걸 executor 가 실행

이것도 아직 identity

여기서 emit 된 정보에 대해서 op.kind, reigistry 등의 가공들이 추가됨, 이는 근데 변경되지 않는 정보로, 처음 model.builder 에 전달 될 때, 아예 다 추가, 가공된 정보를 emit 하는 것에 대해 고민,

cuda_exec 에서의

해당 과정에서 lower_ir_cuda 부분에서의

해당 부분의 emit 정보를 통한 데이터 가공, 추가 부분이 존재, 이걸 초기 emit 단계에 포함시키는 것에 대해 고민

AICF v2 실행 파이프라인 ( optimize 생략 버전 ) (0)	2026.02.03
Layer 내부에서의 emit 정의 및 사용 방식의 변경, 사전 정의 op emitter 의 생성으로 lower_ir_cuda 의 기능 축소, 전체 로직 간편화 (0)	2026.02.02
CUDA Graph Capture / Replay 설계 정리 (0)	2026.02.01
AICF v2 - Online Accumulative Optimization 설계 문서 ( 여기서 Compiler 의 완성 ) (0)	2026.01.31
alias / inplace 에 대해... - 메모리 / 실행 전략에 관한 결정 (0)	2026.01.31