본문 바로가기

dev_AI_framework

row bias, column bias - pern, perm

일반적으로 Fully-connected layer 나 Linear layer 에서 수행되는 연산은 

Y = XW + b

X = (M, K)

W = (K, N)

b = N or M

Y = (M , N)

 

(10,4) @ (4,2) -> (10,2)

여기서 bias b 를 어떻게 브로드 캐스팅 하느냐에 따라 행 바이어스, 열바이어스로 나뉜다.

 

열 바이어스, Coulmn Bias

가장 흔히 쓰이는 방식, bias 벡터가 출력 행렬의 열 방향에 더해짐, 

bias shape = N, 열 방향에 더해짐, 

직관적으로 출력 뉴런마다 하나의 bias

 

행 바이어스, Row Bias

M 차원에 더해짐, 

직관적으로 입력 샘플마다 하나의 bias