
GEMM 을 산술 커널이 아니라, 의미적 투영 연산자로 정의하고
그 의미를 기준으로 컴파일러가 어떻게 결정을 내리는지를 보여주는 구조
전체 아키텍처 구조
1. Semantic Layer ( What must be preserved )
- Canonical Definition
- Axes Meaning
- Semantic Invariants
무엇을 절대 깨면 안 되는가를 정의
2. Contextual Sensitivity Layer (When can we relax?)
- Downstream Sensitivity
- Tile Priority Model
연산이 독립적이지 않다는 것을 ㅁ여시
ReLU , Softmax 앞에 있는지, 최종 Logit 인지에 따라 허용 오차가 달라짐
문맥 인식 최적화기로써의 내용
3. Lowering & Physicla Execution Layer ( What was chosen )
- Compiler Decision
- Applied Rewrites
- Cost Model
- Kernel Metrics
- CUDA Snippet
- Benchmark
의미 보존 조건 하에서 어떤 rewrite 가 선택되고 어떤 커널이 생성되었는가
섹션별 상세 문서화
SECTION 1 - Semantic Deep-Dive
1.1 Canonical Proposition
C = α(A × B) + βC
수학적 표현 표시
- GEMM 을 단순 곱셈이 아니라
- 상태 병합을 포함하는 의미 연산으로 규정
1.2 Semantic Thesis
수식 아래의 한 줄 설명
GEMM evaluates relational hypotheses and merges semantic state
이 문장은 페이지 전체의 철학적 중심
1.3 Axes Interpretation
K 차원을 단순한 중간 차원이 아닌,
Hyopthesis Search Space
로 정의
| M | 샘플 집합 |
| K | 의미적 가설 공간 |
| N | 투영된 특징 |
이는 이후 Rewrite / Early Exit / Pruning 과 연결
1.4 Semantic Invariants
여기서 정의
- Rank Invariance
- Subspace Invariance
- Decision Boundary Invariance
각 invariant 는 다음 요소를 가짐
- metric
- threshold
- applies_when
- allows
이 조건이 유지되면 aggressive rewrite 가능
이는 컴파일러 계약
SECTION 2 - Contextual Sensitivity
2.1 Downstream Sensitivity
연산은 고립된 블록이 아님
예
- ReLU 앞 - 음수 영역은 덜 중요
- Softmax 앞 - tail 은 지수에서 소멸
이 정보는 다음을 가능하게 함
- Precision reduction
- K early-exit
- Sparse tail pruning
2.2 Tile Priority Model
semantic_sparsity_predict
이 모델은 lowering 이전에
어떤 타일이 의미적으로 중요한지 예측
리소스 분배 전랴고가 연결
SECTION 3 - Lowering & Physical Execution
3.1 Compiler Lowering Decision
이 페이지의 핵심
표현
- Chosen Variant
- Applied Rewrites
- Logic Evidence
이는 단순 결과가 아니라
의사 결정 로그
3.2 Applied Rewrites
예
- RW_ANCHOR_FUSION
- RW_EARLY_EXIT_K
이는 단순 최적화가 아니라
의미적 변환 경로를 나타낸다.
3.3 Semantic Cost Model
수식
λ1 RankLoss + λ2 OrderViolation + λ3 BoundaryDrift
이 비용은 단순 FLOPs 가 아니라
의미 손실 확률을 수치화한다.
컴파일러는 다음을 최소화한다
Compute Cost + λ * Semantic Loss
3.4 Kernel Metrics
여기서 물리적 계층 등장
- Throughput
- Memory Reuse
- Occupancy
물리 최적화는 의미 보존을 전제로 한다
3.5 CUDA Snippet
의미가 구현된 결과물
3.6 Benchmark
의미적 안정성 확보 후 결과
설계 철학 요약
의미가 먼저다
수식은 정의이지만 Invariant 가 계약이다
최적화는 허용된 변형이다
Rewrite 는 자유가 아니라 Invariant 하에서만 허용된다
컴파일러는 선택자다
Lowering 은 구현이 아니라 의사결정이다
물리는 마지막 계층이다
Kernel 은 목적이 아니라 결과다
'operator 의 연산 의미 분석' 카테고리의 다른 글
| LayerNorm Semantic Specification (0) | 2026.02.13 |
|---|---|
| BiasAdd / ResidualAdd Semantic Specification (0) | 2026.02.13 |
| GEMM 의 수학적 본질 Mathematical Semantics (0) | 2026.02.13 |
| AICF Recoredbook ( Web MVP ) - 구조 / 역할 정리 (0) | 2026.01.29 |
| Visual Compiler Playground - 보는 순간 이해되는 AI Compiler / Kernel Runtime (0) | 2026.01.26 |