본문 바로가기

operator 의 연산 의미 분석

AICF VISUAL LAB — GEMM Semantic Architecture Page Documentation

GEMM 을 산술 커널이 아니라, 의미적 투영 연산자로 정의하고

그 의미를 기준으로 컴파일러가 어떻게 결정을 내리는지를 보여주는 구조

 

전체 아키텍처 구조

1. Semantic Layer ( What must be preserved )

  • Canonical Definition
  • Axes Meaning
  • Semantic Invariants

무엇을 절대 깨면 안 되는가를 정의

 

2. Contextual Sensitivity Layer (When can we relax?)

  • Downstream Sensitivity
  • Tile Priority Model

연산이 독립적이지 않다는 것을 ㅁ여시

ReLU , Softmax 앞에 있는지, 최종 Logit 인지에 따라 허용 오차가 달라짐

문맥 인식 최적화기로써의 내용

 

3. Lowering & Physicla Execution Layer ( What was chosen )

  • Compiler Decision
  • Applied Rewrites
  • Cost Model
  • Kernel Metrics
  • CUDA Snippet
  • Benchmark

의미 보존 조건 하에서 어떤 rewrite 가 선택되고 어떤 커널이 생성되었는가

 

섹션별 상세 문서화

SECTION 1 - Semantic Deep-Dive

1.1 Canonical Proposition

C = α(A × B) + βC

수학적 표현 표시

  • GEMM 을 단순 곱셈이 아니라
  • 상태 병합을 포함하는 의미 연산으로 규정

 

1.2 Semantic Thesis

수식 아래의 한 줄 설명

GEMM evaluates relational hypotheses and merges semantic state

이 문장은 페이지 전체의 철학적 중심

 

1.3 Axes Interpretation

K 차원을 단순한 중간 차원이 아닌, 

Hyopthesis Search Space

로 정의

M 샘플 집합
K 의미적 가설 공간
N 투영된 특징

이는 이후 Rewrite / Early Exit / Pruning 과 연결

 

1.4 Semantic Invariants

여기서 정의

  • Rank Invariance
  • Subspace Invariance
  • Decision Boundary Invariance

각 invariant 는 다음 요소를 가짐

  • metric
  • threshold
  • applies_when
  • allows

이 조건이 유지되면 aggressive rewrite 가능

이는 컴파일러 계약

 

 

SECTION 2 - Contextual Sensitivity

2.1 Downstream Sensitivity

연산은 고립된 블록이 아님

  • ReLU 앞 - 음수 영역은 덜 중요
  • Softmax 앞 - tail 은 지수에서 소멸

이 정보는 다음을 가능하게 함

  • Precision reduction
  • K early-exit
  • Sparse tail pruning

 

2.2 Tile Priority Model

semantic_sparsity_predict

이 모델은 lowering 이전에 

어떤 타일이 의미적으로 중요한지 예측

리소스 분배 전랴고가 연결

 

 

SECTION 3 - Lowering & Physical Execution

3.1 Compiler Lowering Decision

이 페이지의 핵심

표현

  • Chosen Variant
  • Applied Rewrites
  • Logic Evidence

이는 단순 결과가 아니라

의사 결정 로그

 

3.2 Applied Rewrites

  • RW_ANCHOR_FUSION
  • RW_EARLY_EXIT_K

이는 단순 최적화가 아니라

의미적 변환 경로를 나타낸다.

 

3.3 Semantic Cost Model

수식

λ1 RankLoss + λ2 OrderViolation + λ3 BoundaryDrift

이 비용은 단순 FLOPs 가 아니라

의미 손실 확률을 수치화한다.

컴파일러는 다음을 최소화한다

Compute Cost + λ * Semantic Loss

 

3.4 Kernel Metrics

여기서 물리적 계층 등장

  • Throughput
  • Memory Reuse
  • Occupancy

물리 최적화는 의미 보존을 전제로 한다

 

3.5 CUDA Snippet

의미가 구현된 결과물

 

3.6 Benchmark

의미적 안정성 확보 후 결과

 

 

설계 철학 요약

 

의미가 먼저다

수식은 정의이지만 Invariant 가 계약이다

 

최적화는 허용된 변형이다

Rewrite 는 자유가 아니라 Invariant 하에서만 허용된다

 

컴파일러는 선택자다

Lowering 은 구현이 아니라 의사결정이다

 

물리는 마지막 계층이다

Kernel 은 목적이 아니라 결과다