본문 바로가기

dev_AI_framework

백엔드의 standalone ops 체제로 전환 ( ai_shim 의 사용 )

include/ai/ 에 정의된 코어 헤더 ( tensor, dispatch, op_schema ) 에 의존해 빌드되었음, 

통합 빌드 구조는 빌드 종속성 등의 문제 야기

ops 계층을 완전히 코어로부터 분리, ai_shim.hpp 만으로 독립 빌드 가능한 구조로 전환

 

 빌드 대상이, ops 개별 단독 빌드로 변경, 

 

ai_shim 의 역할, 

각 ops 모듈이 필요로 하는 최소한의 타입, 유틸을 제공한다.

코어 헤더를 대체하는 얇은 코어

공통 타입 정의, 런타임 유틸리티, 검증 도우미, nvtx 지원, 레지스트리 인터페이스, 에러 전달 매크로, 

 

향후 ai_shim에 추가될 수 있는 기능

Memory Management Capture-safe allocator (Arena, BlockPool) CUDA Graph 내 malloc-free 금지용
Workspace Helpers WorkspaceFwd, WorkspaceBwd RNN·Conv 등 복합 op용 버퍼 관리
Profiling Utilities lightweight timer, kernel range tagging NVTX 기반 혹은 CUDA event 기반
Host Wrappers stream-sync safe memcpy host→device wrappers core 없이 단독 디버그 시 사용
Kernel Traits dtype-dispatch 매크로, tile config helpers template meta config 정리
Error Annotation AI_RAISE_IF(...) 매크로, 예외 메시지 capture safe 상태에서 trace