ai_shim 의 역할 분리 및 개선 이후 rnn 연산의 재빌드 시행
ops_rnn 을 빌드하면서 그와 동시에 공용 ai_shim 과 공용 GEMM 바인딩도 함께 컴파일됨
save_z 의 의미가 더 엄격해짐 : attrs.save_z == true 일 경우 반드시 Z_saved 버퍼의 전달,
기존 파이썬 래퍼에선 act=none 일 경우 z_out 을 안 줬음 ( 실제론 Z = Y 의 형식이라 추가 버퍼가 없어도 되지만, C++ 바인딩은 Z 포인터를 필요로 했음, save_z 조건 이므로 ( 이건 나중에 처리 해야겠다 ) )
act = none 일 경우 Z = Y 의 지정과 save_z 는 Z 존재로 결정하도록 지정
'dev_AI_framework' 카테고리의 다른 글
| dropout 의 scaling 과 constexpr 을 통한 compile 내 최적화 - 결정론적이려면 어떻게 해야 하는지 (0) | 2025.11.13 |
|---|---|
| GPU 실행 모델의 구분, 정리 ( 단일 스트림 구현 이유를 정리하다가 remind 가 필요했음) - 추론 최적화에선 어떻게 적용할지 (0) | 2025.11.11 |
| 백엔드의 standalone ops 체제로 전환 ( ai_shim 의 사용 ) (0) | 2025.11.10 |
| 현재 상황 정리, 앞으로 뭘 어떻게 해야 할까 (0) | 2025.11.06 |
| graph_executor, 어떤 방식으로 graph_key, pool 의 분리, 재사용 확인 (0) | 2025.11.04 |