인공지능이 페페, 개구리 사진을 다양하게 변환시킨 모습, 다양한 그림으로 변환된 것을 볼 수 있고, 각 그림에 대한 화풍이 동일한 것을 확인할 수 있다.
어떤 원리인지 추측해보면
1. 객체 이미지 인식 : 시맨틱 분할과 같은 객체 탐재 모델을 통한 원본 페페 이미지 인식, 좋은 모델의 경우 눈, 입을 제대로 인식 할 수 있을 것
2. 새로운 이미지 생성 : 분리된 각 객체에게서 위치와 추측된 객체 이름, 객체를 이루고 있는 색깔 등의 정보를 얻을 수 있을 것이고 이러한 정보를 여러 그림체에 대해 학습된 모델에게 전달하여 새로운 이미지를 생성할 수 있을 것이다.
우리가 신기하다고 느끼는 눈, 입, 피부 등의 부위들이 전혀 새로운 모습으로 나타나는 원리는 객체 인식 과정에서 얻은 각 객체의 클래스를 그대로 사용하지 않는다면 이러한 결과를 얻을 수 있을 것이라 생각된다.
이에 해당하는 모델로 오토 인코더로 생각해 볼 수 있을 것 같다.
인코더 ( 페페 이미지 인식, 객체 데이터 생성), 디코더 ( 객체 데이터를 통해 새로운 이미지 생성 ) 의 형태로 만들 수 있을 것 같다.
'머신러닝 아이디어' 카테고리의 다른 글
사진의 수평, 수직선에 따른 보정 (0) | 2022.10.11 |
---|---|
꿈과 머신러닝_AutoEncoder (0) | 2022.10.10 |
다중 인격 - 프라이멀 피널 영화를 보고 (0) | 2022.10.10 |
추천 시스템 - 좋은 추천 시스템이란 무엇인가 (0) | 2022.10.08 |
로켓 회수 : 강화 학습 (0) | 2022.10.08 |