본문 바로가기

심층 학습

2. 선형대수 (2)

특별한 종류의 행렬과 벡터

대각행렬 diagonal matrix 은 0이 아닌 성분들이 주대각에만 있고 나머지 성분은 모두 0인 행렬,

벡터 v 의 성분들이 주대각 성분들인 정방 대각행렬을 diag(v) 로 표기한다. 

대각행렬은 벡터와의 곱셈 계산이 아주 효율적이다. 각 성분을 비례하기만 하면 되기 때문, 

역행렬은 모든 주대각 성분이 0이 아닐 때만 존재한다. 

많은 경우 임의의 행렬들로는 다소 일반적인 기계 학습 알고리즘을 유도할 수 있지만, 일부 행렬이 대각행렬이어야 한다는 제약을 두면 덜 비싼 알고리즘이 나오게 된다. 

대각 행렬이 반드시 정방행렬이어야 하는 것은 아니다. 직사각형 형태의 대각행렬을 만드는 것도 가능, 비정방 대각행렬에는 역행렬이 없다.

 

대칭행렬 symmetric matrix 는 전치행렬이 곧 자신과 같은 행렬

A = A^T

인수가 두 개이되 두 인수의 순서에 의존하지 않는 함수로 행렬의 성분들을 생성하면 대칭행렬이 되는 경우가 많다. 

 

단위벡터 unit vector 는 크기가 단위노름 unit norm 인 벡터이다.

벡터 x 와 y 가 x^T y = 0 을 만족할 때, 두 벡터를 가리켜 서로 직교 orthogonal 라고 말한다. 두 벡터 모두 노름이 0이 아니라면, 두 벡터의 각도는 90도이다. 
R^n 에서 노름이 0이 아니고 서로 직교인 벡터들은 n 개를 넘지 않는다. 직교일 분만 아니라 크기가 단위노름인 벡터를 가리켜 정규직교 orthonormal 벡터라고 부른다.

 

직교행렬 othogonal matrix 는 행들이 서로 정규직교이고 열들도 서로 정규직교인 정방행렬이다.

A^T A = AA^T = I

이는 다음을 함의한다.

A^-1 = A^T

따라서 직교행렬은 역행렬을 계산하기 쉽다. 이 점이 직교행렬에 관심을 두는 주된 이유, 

'심층 학습' 카테고리의 다른 글

3. 확률론과 정보 이론  (0) 2023.06.02
2. 선형대수(주성분 분석)  (1) 2023.06.02
2. 선형대수(5. 무어-펜로즈 유사역행렬)  (0) 2023.06.01
2. 선형 대수  (0) 2023.06.01
1. 소개  (0) 2023.06.01