6.2 성공 케이스 문서화 : Warmup (no drift) + CUDA Graph Replay == IRExecutor

목표

핵심 설계 규칙

Capture-safe autograd: leaf grad 포인터 안정성

요점

Tracing 시 backward 는 실행이 아니라 IR 연결

요점

Lowering 에서 leaf param.grad vid 에 절대 쓰지 말 것

제일 오래 걸린 지점

해결

Warmup 은 커널 / 버퍼 예열임, 학습이 아니다

warmup 단계는 다음만

하면 안되는 것

해결법

IRExecutor 가 실행 가능한 env 를 완전 바인딩해야 함

lowering 이 grad pool / relu_y_saved 같은 temporaries 를 만들면,

IRExecutor 는 그 vid 에 대응하는 텐서를 반드시 가져야 함

해결

뜻 지, 가르칠 훈

6.2 성공 케이스 문서화 : Warmup (no drift) + CUDA Graph Replay == IRExecutor

목표

핵심 설계 규칙

Capture-safe autograd: leaf grad 포인터 안정성

Tracing 시 backward 는 실행이 아니라 IR 연결

Lowering 에서 leaf param.grad vid 에 절대 쓰지 말 것

Warmup 은 커널 / 버퍼 예열임, 학습이 아니다

IRExecutor 가 실행 가능한 env 를 완전 바인딩해야 함

티스토리툴바

6.2 성공 케이스 문서화 : Warmup (no drift) + CUDA Graph Replay == IRExecutor

목표

핵심 설계 규칙

Capture-safe autograd: leaf grad 포인터 안정성

Tracing 시 backward 는 실행이 아니라 IR 연결

Lowering 에서 leaf param.grad vid 에 절대 쓰지 말 것

Warmup 은 커널 / 버퍼 예열임, 학습이 아니다

IRExecutor 가 실행 가능한 env 를 완전 바인딩해야 함

'AI Compiler framework' Related Articles

티스토리툴바