AI 시대의 새로운 차별, 디지털 에이지즘이란 무엇인가

AI 시대의 새로운 차별, 디지털 에이지즘이란 무엇인가

반환하는 것처럼 보입니다. 문장은 정중하고, 차별적인 언어도 피하며, 표면적으로는 누군가를 상처 주려는 의도도 느껴지지 않습니다. 그러나 그 "좋은 느낌"의 내부에, 사회에 오랫동안 축적되어 온 편견이 얇게 스며들어 있다면 어떻게 될까요?

한국과학기술원, KAIST의 연구팀이 발표한 연구는 바로 그 문제를 부각시켰습니다. 대상이 된 것은 OpenAI의 생성 AI 모델 GPT-4o입니다. 연구팀은 10세부터 90세까지, 10세 간격의 연령에 대해 AI에게 인물의 성격이나 특징을 설명하게 하고, 그 문장에 어떤 연령 이미지가 포함되어 있는지를 분석했습니다.

그곳에서 드러난 것은 노골적인 차별이 아닙니다. 노인을 모욕하는 듯한 언어도 아닙니다. 오히려, AI는 노인을 "친절하다", "신뢰할 수 있다", "배려심이 있다", "지혜가 있다" 등 긍정적인 언어로 묘사하는 경향을 보였습니다.

문제는 그 긍정의 방식에 있습니다.

연구에 따르면, 60세 이상의 인물은 "따뜻함" 면에서는 높게 평가되는 반면, "능력", "전문성", "효율성", "주체성", "자기 주장" 등의 측면에서는 젊은 세대보다 약하게 표현되는 경향이 있었습니다. 즉, AI는 노인을 부정하는 것이 아니라, "친절하지만 그다지 유능하지 않은 사람들"로 묘사하기 쉬운 가능성이 있는 것입니다.

이는 현대의 AI 편향 문제에서 매우 중요한 논점입니다. 왜냐하면, 차별은 반드시 공격적인 언어로 나타나는 것이 아니기 때문입니다. 오히려, 사회 속에서 오랫동안 살아남은 편견일수록 종종 "선의"나 "칭찬"의 형태를 취합니다.

예를 들어, "노인은 온화하고 돌봄이 좋다"는 표현은 언뜻 보기에 호의적으로 들립니다. 그러나 그것이 동시에 "새로운 것에는 약하다", "판단력이 떨어져 있다", "리더십을 발휘하기보다는 지지받는 쪽"이라는 이미지와 결합된다면, 거기에는 연령에 따른 역할의 고정화가 있습니다.

AI가 이러한 이미지를 반복적으로 생성하면, 사용자는 무의식적으로 그 관점을 받아들일 수 있습니다. 노인 자신이 AI와 대화할 때도, "나는 이제 도전하는 쪽이 아니다", "디지털 기술을 잘 다루는 주체가 아니다"라고 느낄 가능성이 있습니다. AI의 언어는 단순한 문장이 아니라, 인간의 자기 인식이나 사회 인식에 영향을 미칠 수 있습니다.


연구의 방법──AI에 "중립적인 질문"을 던졌다

이 연구에서 흥미로운 점은, 연구팀이 노골적으로 편견을 유도하는 질문을 한 것이 아니라는 점입니다.

사용된 프롬프트는 특정 연령의 인물에 대해 성격을 설명하도록 요구하는 중립적인 것이었습니다. 대상 연령은 10세, 20세, 30세, 40세, 50세, 60세, 70세, 80세, 90세였습니다. 연구팀은 GPT-4o로부터 총 900개의 텍스트 샘플을 수집했습니다.

그 위에, 사회심리학에서 사용되는 "고정관념 내용 모델"에 기반하여 문장을 분석했습니다. 이 모델은 사람들이 사회 집단을 어떻게 인식하는지를 크게 두 가지 축으로 파악합니다. 하나는 "따뜻함"입니다. 이는 친절함, 신뢰성, 배려심, 협조성 등에 관련됩니다. 또 하나는 "능력"입니다. 이는 유능함, 전문성, 효율성, 주체성, 자기 주장 등에 관련됩니다.

이 두 축으로 보면, 편견의 구조는 더 세밀하게 보입니다. 어떤 집단이 "차갑지만 유능하다"고 여겨질 수도 있고, "따뜻하지만 무능하다"고 여겨질 수도 있습니다. 노인에게 향해지는 고정관념은 종종 후자에 가깝습니다. "친절하다", "경험이 풍부하다", "온화하다"는 긍정적인 언어와 맞바꾸어, "경쟁력", "실행력", "새로운 것에 대한 적응력"이 낮게 평가되는 것입니다.

이번 연구에서 드러난 GPT-4o의 경향도 그것과 겹칩니다. 60세 이상의 설명에서는 따뜻함에 관한 표현이 두드러졌고, 능력이나 자기 주장에 관한 표현은 상대적으로 약해졌습니다. 특히 70세 이상에서는 묘사가 균질화되기 쉬운 경향도 지적되고 있습니다. 즉, 나이가 들수록 "개인차"가 아니라 "노인다움"으로 정리되기 쉬워진다는 것입니다.


"친절한 편견"이 위험한 이유

이 연구가 제시하는 문제는, AI가 노인을 나쁘게 말하고 있다는 단순한 이야기가 아닙니다. 오히려, AI는 노인을 "좋은 사람"으로 묘사하고 있습니다. 그래서 위험한 것입니다.

사람은 명백한 차별에는 경계하기 쉽습니다. "노인은 쓸모없다"는 노골적인 표현이 나오면, 많은 사용자가 문제를 인식할 것입니다. 개발자도 필터나 안전 대책으로 쉽게 감지할 수 있습니다.

그러나 "노인은 따뜻하고, 차분하며, 주변을 지지하는 존재입니다"라는 표현은 어떨까요? 이는 언뜻 보기에 문제가 없는 문장으로 보입니다. 그러나 만약 같은 AI가 젊은이들이나 중년층에게는 "혁신적이다", "야심적이다", "리더십이 있다", "문제 해결에 능하다"는 말을 많이 사용한다면, 거기에는 명확한 차이가 생깁니다.

차별은 누군가를 낮추는 말뿐만 아니라, 누군가를 특정한 역할에 가두는 말에도 깃듭니다.

노인을 항상 "지지하는 사람", "지켜보는 사람", "친절한 사람"으로 묘사하는 것은, 그들을 "도전하는 사람", "결정하는 사람", "변혁하는 사람", "기술을 잘 다루는 사람"으로 상상할 기회를 빼앗습니다. 이것이 쌓이면, 고용, 교육, 의료, 행정 서비스, 디지털 지원 등 다양한 장면에서 연령에 따른 대우의 차이로 이어질 수 있습니다.

예를 들어 기업이 AI를 사용해 인재 평가나 채용 문구를 작성할 경우, 모델이 "젊은 사람은 주체적이고 성장력이 있다", "연령이 있는 사람은 안정적이지만 변화에는 약하다"는 함의를 가지고 있다면, 표현이나 판단에 영향을 미칠 가능성이 있습니다. 간호나 의료 장면에서도, 노인을 자율적인 의사 결정자가 아니라 보호받아야 할 존재로 과도하게 묘사함으로써, 본인의 선택권이 경시될 우려가 있습니다.


디지털 에이지즘이란 무엇인가

이번 연구에서 중요한 키워드가 되는 것은 "디지털 에이지즘"입니다. 이는 디지털 기술이나 AI 시스템의 설계, 데이터, 운영, 이용 환경 속에 연령에 기반한 편향이 들어가고, 노인의 참여나 기회를 방해하는 현상을 가리킵니다.

디지털 에이지즘은 단순히 "노인이 스마트폰을 사용하기 어렵다"는 이야기에 그치지 않습니다. 문제는 더 구조적입니다. AI의 학습 데이터에 노인의 다양한 모습이 충분히 포함되어 있지 않습니다. 개발팀에 고령 세대의 시각이 적습니다. 서비스 설계가 젊은 층의 이용 행동을 표준으로 하고 있습니다. 사용자 조사나 테스트에서 노인이 제외되고 있습니다. 이러한 요소가 겹쳐지면서, 기술 자체가 연령 차별을 재생산하게 됩니다.

게다가, AI의 출력은 매우 자연스러운 언어로 제시됩니다. 검색 엔진의 결과 목록이나 광고 카피보다도, 대화형 AI의 답변은 "자신에게 향한 조언"처럼 느껴집니다. 따라서, AI가 만들어내는 고정관념은 사용자의 의식에 조용히 스며들기 쉽습니다.

예를 들어, 어떤 고령 사용자가 "새로운 일에 도전하고 싶다", "창업하고 싶다", "프로그래밍을 배우고 싶다"고 AI에 상담했다고 합시다. 그때 AI가 선의로 "무리하지 않는 범위에서", "주변에 상담하면서", "건강을 최우선으로"라는 신중한 조언만을 반환하는 한편, 젊은 사용자에게는 "적극적으로 도전합시다", "포트폴리오를 만듭시다", "시장을 조사합시다"라고 반환한다면, 거기에는 보이지 않는 차별이 있습니다.

조언의 톤이 다릅니다. 기대치가 다릅니다. 미래의 그리기가 다릅니다. 이것이 디지털 시대의 연령 편향입니다.


SNS의 반응──"역시 AI는 사회의 거울"인가, "검증은 아직 필요"인가

이 주제에 대한 SNS상의 반응은, 공개 검색으로 확인할 수 있는 범위에서는, 폭발적인 확산이라기보다는 AI 윤리, 연구자, 테크계 뉴스를 추적하는 층 사이에서 조용히 주목받고 있는 단계라고 할 수 있습니다. 원 기사 페이지 상에서도, 공개 직후 시점의 공유 수는 제한적이며, 댓글란의 반응도 많이 확인되지 않습니다.

다만, 같은 주제에 대한 SNS상의 수용 방식은 몇 가지 방향으로 나뉘어 있습니다.

첫 번째는 "AI는 사회의 편견을 비추는 거울이다"라는 반응입니다. 생성 AI는 인터넷 상의 방대한 텍스트를 학습하고 있습니다. 거기에 있는 연령관, 직업관, 가족관, 미디어 표상이 편향되어 있다면, AI의 출력도 또한 편향됩니다. 즉, AI가 노인을 "따뜻하지만 능력이 낮다"고 묘사하는 것은, AI만의 문제가 아니라, 인간 사회가 그렇게 그려온 결과가 아닐까 하는 시각입니다.

두 번째는 "긍정적인 언어도 차별이 될 수 있다"는 반응입니다. SNS에서는 성별이나 인종의 편향에 대해서는 이미 많은 논의가 이루어져 왔습니다. 한편으로 연령 편향은 종종 간과됩니다. 노인을 "귀엽다", "온화하다", "치유"라고 다루는 표현은 악의가 없는 만큼 비판받기 어렵습니다. 그러나 그것이 본인의 능력이나 의사 결정력을 가볍게 보는 문화로 이어진다면, 역시 문제라는 목소리가 나오기 쉽습니다.

세 번째는 "연구 대상이 하나의 모델, 하나의 시점에 한정되어 있기 때문에, 일반화에는 주의가 필요하다"는 신중한 반응입니다. 이번 연구는 GPT-4o를 대상으로 한 것이며, 모델은 계속 업데이트됩니다. 또한, 프롬프트의 작성 방식이나 언어, 문화권에 따라 출력은 달라집니다. 따라서, 이 결과만으로 "모든 생성 AI가 같은 편견을 가지고 있다"고 단정하는 것은 이르다는 시각도 타당합니다.

네 번째는 "그래서 평가 방법이 필요하다"는 실무적인 반응입니다. AI를 사회에 통합하는 이상, 모델의 성능을 정답률이나 속도만으로 측정하는 것이 아니라, 어떤 집단을 어떻게 묘사하는지, 어떤 역할을 할당하는지, 누구의 가능성을 좁히지 않는지를 지속적으로 검사할 필요가 있습니다. SNS상의 AI 개발자나 정책 관계자의 논의에서는 이러한 편향 평가를 제품 개발에 어떻게 통합할지가 중요한 논점이 됩니다.


왜 연령 편향은 간과되기 쉬운가

AI 편향의 논의에서는, 지금까지 성별, 인종, 국적, 종교 등이 크게 다루어져 왔습니다. 그것들이 중요하다는 것은 말할 것도 없습니다. 그러나 연령은 의외로 후순위로 밀리기 쉽습니다.

이유 중 하나는 연령이 누구에게나 변화하는 속성이기 때문입니다. 인종이나 출생지와는 달리, 누구나 나이를 먹습니다. 따라서, 연령 차별은 "특정한 누군가에 대한 차별"이라기보다는, "자연스러운 세대 차이"나 "라이프 스테이지의 차이"로 처리되기 쉽습니다.

그러나 실제로는 연령에 기반한 편견은 심각한 영향을 미칩니다. 채용에서 "젊은 사람이 더 유연하다"고 여겨집니다. 의료에서 "고령이라 어쩔 수 없다"고 판단됩니다. 디지털 서비스에서 "노인은 사용하지 않을 것이다"라고 가정됩니다. 교육에서 "지금 배워도 늦다"고 말합니다. 이러한 판단은 개인의 능력이 아니라 연령 카테고리에 기반하고 있습니다.

게다가, 생성 AI가 보급되면서, 이 문제는 새로운 단계에 들어갔습니다. AI는 개인이 문장을 쓸 때, 채용 공고를 만들 때, 광고를 만들 때, 이미지를 생성할 때, 고객 지원에서 응답할 때, 모든 장면에 들어갑니다. 만약 AI가 연령에 관한 고정 관념을 가지고 있다면, 그 편향은 대량의 문장이나 이미지로서 사회에 재배포됩니다.

게다가, 그 편향은 "AI가 말하고 있으니까"라고 신뢰받기 쉽습니다. 인간의 편견이라면 반론할 수 있어도, AI의 출력은 통계적이고 중립적으로 보입니다. 그 중립성 때문에, 편견을 더욱 보이지 않게 만듭니다.


노인을 "한 장의 그림"으로 만들지 않는 것

이번 연구에서 특히 주목해야 할 점은, 70세 이상의 묘사가 균질화되기 쉽다는 지적입니다. 이는 사회가 노인을 하나의 집단으로 묶어 보려는 경향과 겹칩니다.

그러나 70대, 80대, 90대의 사람들은 당연히 일률적이지 않습니다. 일을 계속하는 사람도 있습니다. 새로운 기술을 배우는 사람도 있습니다. 창업하는 사람도 있습니다. 지역 활동을 이끄는 사람도 있습니다. 간호를 받는 사람도 있으면, 누군가를 지원하는 사람도 있습니다. 정치적 의견도, 취미도, 경제 상황도, 건강 상태도, 디지털 스킬도 크게 다릅니다.

그럼에도 불구하고, AI가 "노인다움"을 평균화하여 묘사하면, 다양한 현실은 사라집니다. 이는 이미지 생성 AI에서도 일어날 수 있는 문제입니다. "80세의 인물"이라고 입력하면, 백발, 주름, 지팡이