dev_AI_framework

losses/softmax_ce 와 layers/softmax_ce 의 단일 백엔드 연산으로의 통일, 그 와중에 생기는 고민, 일반적인 framework 는 왜 model(layer) 과 comfile (loss_function) 을 분리하는가? 아니면 사용자 입장에서만 그렇게 분리되어서 구성된 것 처럼 보이고, 연산의 경우는 내부에 통합되어서 사용되는건지? -> 사용자는 다양한 비용 함수의 비교 결과를 확인하기 위해 그렇다라는 생각이 듦... 실

명징직조지훈 2025. 10. 4. 14:03

너의 현재 상태:

단일 백엔드로 통일 필요

처음엔 layer 를 비용 함수까지 확장해서 구성하는 방안을 고민했음...

GEMM(+bias+act)에서 Z(pre-activation) 저장/활용 설계 (0)	2025.10.06
Trainer 구현 필요 - (현재 forward, backword 의 파편 호출과 파이썬에서 opimizer 갱신하고 있음 이를 개선) (0)	2025.10.04
Dense / GEMM 역전파 (bias grad) 스케일 - 축 불일치 수정 (0)	2025.10.04
Python 코드 구조·작성 가이드 (ops / layers) (0)	2025.10.02
Low-level GEMM 직통 경로 사용 가이드 (ai::Tensor 기반) (0)	2025.10.01

뜻 지, 가르칠 훈