본문 바로가기

AI Compiler framework

PR2 - Training Progress + Sequence Determinism

명징직조지훈 2025. 12. 30. 09:41

PR2 는 다음을 동시에 검증

학습 진행성
- replay step 마다 파라미터가 실제로 업데이트 된다.
- Adam optimizer state 가 증가한다.
학습 시퀀스 결정론
- 동일 seed / 동일 조건에서
- warmup - capture - replay N steps 전체 시퀀스를 2회 실행했을 때,
- 결과 시퀀스가 bitwise 동일해야 한다.

실제 결과

replay 동안 max param ~ 1e-3 수준 변화 지속
Adam step : 3 ~ 52 증가
A/B 결과
- loss_seq bitwise identical
- step_seq identical
- checkpoint params bitwise identical
결론 : 학습 시퀀스 결정론 OK

'AI Compiler framework' 카테고리의 다른 글

딥러닝을 수식 그래프가 아닌 시간을 가진 실행 프로그램으로 (1)	2026.01.02
PR3: Torch Golden 과 1-Step Training 일치까지의 전체 과정 정리 (1)	2025.12.30
PR1 - Replay Determinism Verification (0)	2025.12.30
다음 기능 개발 계획 ( Determinism + Golden 테스트 고정, Capture Guard, LayerNorm + Registry Variant, softmax + crossentropy 데모 경로, GraphKey/VariantKey 고도화 + Graph Pool 캐시 ) (0)	2025.12.30
accumulata = False / True, 먼뜻인지 True 환경에서 deterministic 하게 (1)	2025.12.30

티스토리툴바