epilogue - ep

#pragma once
#include "../epilogue_params.cuh"
#include "ep_policy.cuh"

namespace epi {

// Params mapping
template<typename T> struct EpParamsT;
template<> struct EpParamsT<float>{ using type = EpParamsF32; };
template<> struct EpParamsT<half> { using type = EpParamsF16; };

template<typename Policy>
struct EpApply {
  using T = typename Policy::ElemT;
  using P = typename EpParamsT<T>::type;

  __device__ static inline void run(const P& p,
                                    int m, int n, int ix, int iy,
                                    const PhiloxState& st,
                                    unsigned long long elem_idx){
    T v = p.x[ix];
    // bias -> act -> dropout
    v = Policy::BiasF::template apply<T>(v, p.bias, n);
    v = Policy::ActF ::template apply<T>(v);
    if constexpr (Policy::UseDrop) {
      v = Policy::DropF::template apply<T>(v, st, elem_idx, p.p_drop, p.keep_scale);
    }
    // blend & optional residual
    Policy::BlendF::template store<T,float>(p.alpha, p.beta, v, p.y, iy);
    if constexpr (Policy::UseResid) {
      p.y[iy] = Math<T>::add(p.y[iy], p.resid[iy]);
    }
  }
};

} // namespace epi

EpParamsT<T> 로 T = {float, half} 에 따라 파라미터 구조 매핑
EpApply<Policy>::run(...) 는 한 원소 단위 에필로그 처리 파이프라인
- v = p.x[ix]
- v = BiasF.apply<T>(v, p.bias, n)
- v = ActF.apply<T>(v)
- v = DropF.apply<T>(v, st, elem_idx, p.p_drop, p.keep_scale)
- BlendF.store<T, float>(p.alpha, p.beta, v, p.t, iy)
- p.y[iy] += p.resid[iy]
인덱싱 : ix 는 x 에서 읽기, iy 는 y 에 쓰기, n 은 열 인덱스, m 은 현재 코드 경로에서 미사용

'dev_AI_framework' 카테고리의 다른 글

AI Model 의 정적, 동적 경로 조건 (0)	2025.10.28
epilogue 실행 방식 고민 - 모놀리식 통합형 ( 항상 커널 내부에 epilogue 가 존재하도록 !!! ) (0)	2025.10.20
epilogue - epilogue.h (0)	2025.10.20
정책화된 커널 내부 에필로그 호출 체계 policy-based epilogue invocation (0)	2025.10.19
RDC + Device LTO(-dlto) 란?? (0)	2025.10.19

뜻 지, 가르칠 훈

epilogue - ep_apply

'dev_AI_framework' 카테고리의 다른 글

티스토리툴바

epilogue - ep_apply

'dev_AI_framework' 카테고리의 다른 글

'dev_AI_framework' Related Articles

티스토리툴바