Loss function 의 역전파 계산 이후
grad_out 값의 이상,
[DEBUG][LOSS] y_true device ptr = 0000000706030600
[DEBUG][LOSS] y_pred device ptr = 0000000706032400
[DEBUG][LOSS] y_true values (first 10): 1.00000
[DEBUG][LOSS] y_pred values (first 10): 0.51211
[DEBUG][LOSS] grad_out from BCE backward (first 10): -0.48789
[INFO] op_type=7, output_id=loss, input_id=activation_2990186475984_out
[INFO] grad_out ptr = 0000000706032A00, grad_input ptr = 0000000000000000
[DEBUG] grad_out values (first 10): 0.00000 0.00000 0.20523 0.00000 307348073856968022527436828704768.00000 843610853410486609957093376.00000 1119133488930748728363450368.00000 0.00000 0.00000 0.00000
디버깅 코드 추가 후 확인, Loss backward 커널 실행 겨로가는 정상,
이후 grad_out 에서의 문제,
'dev_AI_framework' 카테고리의 다른 글
| XOR test 의 출력 확인 (1) | 2025.08.09 |
|---|---|
| run_graph_backward의 각 변수 해석 (0) | 2025.08.09 |
| CUDA 이상치 문제 해결해보기... (2) | 2025.08.08 |
| 행렬 곱에 기반한 grad_input, grad_weight, shared memory 데이터 문제, tiling 알고리즘 사용 중에서 발생한 오류 (6) | 2025.08.07 |
| CUDA, CUPY, Python 버전 세팅 및 확인 (0) | 2025.08.03 |