진짜보다 "만들어진 얼굴"이 더 강하다? 합성 데이터가 "얼굴 인식"을 바꾸는 날: 공정성, 프라이버시, 현장 구현의 현실

진짜보다 "만들어진 얼굴"이 더 강하다? 합성 데이터가 "얼굴 인식"을 바꾸는 날: 공정성, 프라이버시, 현장 구현의 현실

얼굴 인식은 스마트폰 잠금 해제나 공항 게이트 등 사회의 기반 기술이 된 반면, 프라이버시, 편향, 데이터 수집의 어려움이 오랜 과제였다. 이에 주목받고 있는 것이 GAN이나 3D 모델링으로 생성하는 합성 데이터이다. 합성 데이터는 다양한 인종, 연령, 조명, 자세를 자유롭게 늘릴 수 있으며, 개인정보 위험도 낮다. 시장도 급속히 확대되어 2030년에는 약 17.9억 달러 규모로 성장할 것으로 예상된다. 한편, "현실과의 괴리(fidelity)"나 "다양성을 과장해 보이는 것"이라는 "다이버시티 워싱" 등의 비판도 강하다. SNS에서는 "프라이버시 친화적이라 환영한다"는 목소리와 "검증 기반이 따라가지 못하면 역효과"라는 우려가 병행되고 있다. 앞으로는 ①실제 운영 데이터에서의 외부 검증, ②인구 통계의 분포 제어, ③합성 데이터 유래 아티팩트의 감사, ④규제 준수와 설명 가능성――이 네 가지가 열쇠가 될 것이다.