본문 바로가기

GPU-KERNEL

Register Tiling TN Sweep test TN 이 증가하면, ILP (Instruction Level Parallelism) 증가

GEMM 에서 register tiling 을 키워서 ILP 를 늘렸을 때, FMA 파이프 활용도가 좋아지는지에 대한 확인

register / occupancy 트레이드 오프 확인 

 

TN 이 증가하면, ILP (Instruction Level Parallelism) 증가, FMA 활용 증가, 성능 증가

TN 이 너무 커지면 레지스터 사용량 증가, occupancy 감소 

 

tn 증가가 단순하게 커널 코드 내 변수의 증가로 레지스터 증가라고 생각하면 좀 더 직관적인듯