명징직조지훈 2024. 8. 30. 10:50

로지스틱 시그모이드 함수를 사용한다고 가정,

0과 1 사이의 값이 나오고, 0.5 threshold 를 기준으로 0과 1로 분류함,

이 때의 학습,  훈련 데이터에 대한 정확도가 존재,

 

잘못 분류한 데이터 중 시그모이드 함수의 결괏값 z 에 대해 |z| - 0.5 가 가장 큰, z 값을 찾는다.

|z| - 0.5 = a 라고 할 때,

0.5 - a ~ 0.5 + a 사이의 시그모이드 함수값이 나오는 데이터, x~ 에 대해선 모델이 정확하게 분류할 수 없다.

 

0.5 - a <= z <= 0.5 + a, 의 데이터, x~ 에 대해 임의의 연산을 통해 z~ 값의  계산, 

임의의 연산은 학습 데이터의 생존자 비율에 대한 가중치가 존재,

1이 생존일 경우

 

랜덤한 수(0~100)의 생성과, 생존자 비율(0 ~ 1)을 곱한 값을 z~(0 ~ 1) 에 곱한 값, z*(0 ~ 1) 을 통한 분류를 시행해보자.