본문 바로가기

머신러닝 아이디어

인공지능 페페

인공지능이 페페, 개구리 사진을 다양하게 변환시킨 모습, 다양한 그림으로 변환된 것을 볼 수 있고, 각 그림에 대한 화풍이 동일한 것을 확인할 수 있다.

어떤 원리인지 추측해보면

 

1. 객체 이미지 인식 : 시맨틱 분할과 같은 객체 탐재 모델을 통한 원본 페페 이미지 인식, 좋은 모델의 경우 눈, 입을 제대로 인식 할 수 있을 것

 

2. 새로운 이미지 생성 : 분리된 각 객체에게서 위치와 추측된 객체 이름, 객체를 이루고 있는 색깔 등의 정보를 얻을 수 있을 것이고 이러한 정보를 여러 그림체에 대해 학습된 모델에게 전달하여 새로운 이미지를 생성할 수 있을 것이다.

우리가 신기하다고 느끼는 눈, 입, 피부 등의 부위들이 전혀 새로운 모습으로 나타나는 원리는 객체 인식 과정에서 얻은 각 객체의 클래스를 그대로 사용하지 않는다면 이러한 결과를 얻을 수 있을 것이라 생각된다.

 

이에 해당하는 모델로 오토 인코더로 생각해 볼 수 있을 것 같다.

인코더 ( 페페 이미지 인식, 객체 데이터 생성), 디코더 ( 객체 데이터를 통해 새로운 이미지 생성 ) 의 형태로 만들 수 있을 것 같다.