머신러닝 아이디어
AI 판사의 문제-알고리즘? 데이터?
명징직조지훈
2022. 10. 12. 15:04
AI 판사를 구현하기 위해서 훈련 데이터로 가장 크게 소송 내용과 판결에 영향을 주는 데이터들이 될 수 있을 것이고 타깃 데이터로는 판결문으로 새로운 재판에 대해 입력되는 데이터를 통해 판결문을 생성할 수 있어야 한다.
학습의 단계에선 전체 문장, 내용들이 아닌 판결에 영향을 줄 수 있는 단어 벡터들의 가중치 부여, 문장 압축의 과정을 통해 훈련, 타깃 데이터를 압축, 인코딩 할 수 있다.
이를 통해 새로운 데이터가 입력되면 학습된 내용을 통해 이를 짧은 문장으로 표현하고, 그에 대응하는 짧은 판결문의 생성, 이 판결문과 기존의 판결문 데이터들에 대한 유사도 측정을 통해 판결을 내릴 수 있을 것이다.
레이블링, 가중치 부여의 작업이 가장 중요한 작업이 될 것
AI 판사 도입에 대한 반대 의견으로 잘못된 판결에 대한 부작용에 대한 우려로, 영국의 법률가 William Blackstone의 "열 명의 범죄자가 도망치는 것이 한 명의 무고한 사람의 억울한 고초를 겪는 것보다 낫다" 라는 것과 동일한 의미일 것이다.
내가 생각하기엔 이러한 문제가 발생할 수 있는 원인으론 머신러닝 자체의 알고리즘의 문제가 아닌, 학습 데이터의 문제로써, 우리가 왜 AI 판사를 도입하고자 하는 이유에 의해 발생한다.