단 한 마디로 성격이 드러난다? 생성 AI가 '당신다움'을 해석하는 시대

단 한 마디로 성격이 드러난다? 생성 AI가 '당신다움'을 해석하는 시대

"지금 무슨 생각을 하고 있어?"


누군가가 그렇게 물어보고, 당신이 몇십 초 동안 생각나는 대로 이야기한다고 가정해 보자. 오늘 있었던 일, 약간의 불안, 기뻤던 일, 또는 특별한 의미 없는 잡담. 그런 "잡다한 말"만으로도 AI가 당신의 성격 경향을 상당한 정확도로 추정할 수 있다는 연구가 심리학과 AI의 경계를 한 단계 넓혔다.


“성격 진단”이 변화하기 시작했다

지금까지 성격 평가의 중심은 질문지(“외향적이라고 생각한다”, “꼼꼼하다” 등의 항목에 답하는 형식)였다. 이유는 간단하다. 효율적이고 통계적으로 다루기 쉽기 때문이다. 하지만 동시에 "사람의 성격은 문맥이나 상황에 스며드는 것이며, 선택형 답변만으로는 놓치는 부분이 있다"는 비판도 강했다.


여기서 등장하는 것이 생성 AI, 즉 대규모 언어 모델(LLM)이다. 연구에서는 상용 및 일반 사용의 LLM(예: ChatGPT, Claude, LLaMA 등)에 사람들의 "자신의 말"을 읽히고, 빅 파이브(외향성, 협조성, 성실성, 신경증 경향, 개방성)를 추정하게 했다. 포인트는 "심리학 전용으로 훈련된 모델"이 아니라 널리 입수 가능한 LLM을 "그대로" 사용한 것이다.


실험은 "혼잣말"과 "일상의 일기"

연구 설계는 크게 두 가지 계통이다. 하나는 참가자가 "머리에 떠오른 것을 그대로 말하거나 쓰는" 자유 형식의 내용이다. 또 하나는 일상의 짧은 비디오 일기처럼 생활의 일부를 자연스럽게 이야기한 기록이다. 이러한 "자연 언어의 단편"에서 LLM이 성격 질문지에 대한 답변을 추정하고, 본인의 자기 평가와 얼마나 일치하는지를 검증했다.


결과적으로, LLM이 부여한 성격 점수는 자기 평가와 매우 유사한 경향을 보였다. 게다가 여러 LLM을 사용하여 그 평균을 취하는 접근이 더 견고(변동이 적음)했다는 것이다. 또한 기존의 텍스트 분석 방법(고전적인 특징량 기반 방법 등)보다 LLM이 더 잘 작동했다는 점도 시사되었다.


여기서 중요한 것은 "성격이 맞다/맞지 않다"는 오락적인 이야기를 넘어 "일상 언어 속에 성격의 단서가 상상 이상으로 짙게 포함되어 있다"는 방향성이다. 연구자들은 성격이 "자기소개 때만" 드러나는 것이 아니라, 평소의 사고나 이야기 흐름 자체에 짜여 있을 가능성을 강조하고 있다.


성격만이 아니다: 행동, 감정, 정신 건강과도 관련

더 나아가 LLM이 추정한 성격 점수는 일상의 감정, 스트레스, 사회적 행동 등과도 관련될 수 있다고 보고되고 있다. 이는 "성격 추정이 그럴듯한 라벨링에 그치지 않고 현실의 생활 지표와 연결될 가능성이 있다"는 의미로, 응용의 상상을 한층 넓힌다.


예를 들어, 정신 건강 영역에서는 본인이 긴 검사에 임할 수 없는 상황에서도 짧은 일기나 대화에서 상태의 단서를 얻을 수 있을지도 모른다. 교육이나 코칭에서는 성격 특성에 맞춘 피드백의 제공 방식을 조정할 수 있을지도 모른다. 임상 연구에서는 질적 데이터(이야기)를 양적으로 다루는 길이 열릴지도 모른다.


하지만 여기서 오해해서는 안 되는 것은 "AI가 진단할 수 있다"는 이야기가 아니라는 것이다. 연구가 보여주는 것은 어디까지나 "추정된 특성 점수가 특정 지표와 통계적으로 관련되었다"는 범위이다. 의료적 진단이나 치료 판단에는 설명 책임, 재현성, 편향의 검증, 오판 시의 리스크 관리 등 다른 차원의 요건이 필요하다.


"가족보다 맞다"——자극적인 표현의 이면

보도 문맥에서는 "가족이나 친구의 평가보다 맞을 수 있다"는 자극적인 문구가 눈길을 끈다. 확실히 연구에서는 자기 평가와의 일치가 높다는 것이 강조되며, 경우에 따라서는 타자 평가보다 좋을 가능성이 시사되고 있다.


하지만 여기서는 냉정하게 읽어야 한다. 가족이나 친구는 당신의 "생활 전체"를 알고 있는 반면, 평가에는 관계성의 편향도 들어가기 쉽다(관대해지거나 엄격해지거나 특정 장면의 인상에 끌린다). 한편 LLM은 주어진 언어 데이터만을 보지만, 언어 패턴의 통계적 특징에 극단적으로 강하다. 즉 "누가 사람을 더 잘 아는가"가 아니라 "무엇을 재료로, 어떤 기준으로 추정하는가"가 다를 뿐이라고 보는 것이 실태에 가깝다.


SNS에서 확산될 반응: 기대와 소름 돋는 감각

이러한 연구가 나오면 SNS에서는 대개 반응이 양극화된다. 여기서는 실제 게시물의 인용이 아니라 기사 내용에서 예상되는 대표적인 논점을 "게시물 예"로 재구성해 본다(분위기 이해를 위한 예시이며 특정 사용자의 발언이 아니다).


1) "재미있다! 자기 이해에 쓸 수 있다"파

  • 게시물 예:
    "성격 진단은 질문에 답하는 게 귀찮지만, 혼잣말로 알 수 있다면 편하다"
    "일기를 되돌아보는 것보다 AI에게 요약 + 성격 경향을 받는 것이 가능하다"
    "코칭의 입구로서는 편리할 것 같다. 자신의 버릇을 알 수 있다"

이 층은 셀프 헬프나 코칭, 자기 분석의 "마찰"이 줄어드는 것에 기대한다. 특히 심리학에 익숙하지 않은 사람일수록 "어려운 척도보다 자연스러운 말이 더 자신답다"고 느끼기 쉽다.

2) "그거, 감시 사회 아니야?"파

  • 게시물 예:
    "몇십 초의 대화로 성격 추정이 가능하다면, 면접·광고·보험에 사용되는 미래밖에 보이지 않는다"
    "음성 비서가 항상 추정하고 있다면, 프라이버시는 무엇인가?"
    "‘당신은 신경증 경향이 높습니다’라고 멋대로 라벨이 붙는 건 너무 무섭다"


이쪽은 악용의 상상력이 먼저 앞선다. 언어는 SNS, 이메일, 채팅, 회의록 등 생활의 모든 곳에 있다. 만약 "추정"이 멋대로 진행되고, 게다가 본인이 모르는 곳에서 평가에 사용된다면 거부할 수가 없다.

3) "맞다면, 근거를 설명해 줘"파

  • 게시물 예:
    "결국, 어떤 표현이 외향성의 지표가 되는 건가?"
    "편견(성별, 문화, 언어)으로 인해 어긋나지 않는지가 궁금하다"
    "AI가 보고 있는 신호와 심리학이 상정하는 개념이 일치하는가?"


이 층은 투명성과 공정성을 중시한다. LLM의 추정이 고정밀도라도 왜 그렇게 판단했는지를 설명할 수 없다면 현장 도입은 어렵다. 특히 채용, 신용, 보험과 같은 영역에서는 설명 가능성과 이의 제기 시스템이 필수적이다.

4) "연구로서는 흥미롭지만, 과장에는 주의"파

  • 게시물 예:
    "‘가족보다 맞다’는 제목이 너무 강하다. 평가 대상이 빅 파이브의 자기 보고 일치잖아"
    "데이터의 취득 방식에 따라 맞기 쉬워진다. 일반화에는 신중해야 한다"
    "일기나 혼잣말은 내면이 드러나기 쉬워서 오히려 당연할지도"


이 층은 연구 성과를 부정하는 것이 아니라 "적용 범위"와 "말의 강도"를 조정하고 싶어 한다. SNS에서 화제가 된 후 오해한 채 "성격 판정 AI 서비스"가 난립하는 것을 경계하고 있다.


그렇다면 우리는 어떻게 대처해야 할까

이 연구가 보여주는 미래는 편리함과 위험함이 공존하고 있다. 그렇기 때문에 개인과 사회의 양면에서 "보호 방법"을 먼저 생각할 필요가 있다.


개인이 할 수 있는 일

  • 일기, 상담 로그, 음성 메모를 가볍게 외부 서비스에 붙여넣지 않기(특히 개인정보, 건강 정보, 가족 정보)

  • "분석해도 좋은 데이터"와 "절대 주고 싶지 않은 데이터"를 구분하기

  • 추정 결과는 "거울"이 아니라 "온도계" 정도로 다루기(상황에 따라 변동하고 오차도 있다)

사회로서 필요한 것

  • 추정의 이용 목적을 명시하고, 동의 없는 성격 추정을 금지하는 규칙 설계

  • 고위험 영역(채용, 보험, 교육 평가, 사법 등)에서는 감사, 설명, 구제의 시스템을 표준 장비로 할 것

  • 속성 차이(문화, 언어, 연령 등)에 대한 지속적인 검증을 의무화

  • 연구와 상용 이용을 혼동하지 않기("할 수 있다"와 "사용해도 좋다"는 별개)


"당신다움"은 말에 스며들어 있다

결국 이 연구의 핵심은 간단하다.
사람은 성격을 말하지 않아도 성격을 이야기하고 있다.


무심코 선택한 어휘, 감정의 위치, 사건의 잘라내기, 주어의 크기, 미래의 이야기 방식. 그러한 무수한 선택이 당신이라는 사람을 형성하고, 말로서 밖으로 나온다. 그리고 LLM은 그 "스며듦"을 포착하는 데 능숙하다.


우리는 이제 말이 "전달"뿐만 아니라 "추정의 소재"가 되는 시대를 살고 있다.
편리함에 손을 뻗으면서도 라벨 붙이기나 감시에 삼켜지지 않기 위해.
먼저 "말은 상상 이상으로 많은 것을 말하고 있다"는 사실을 아군으로 만드는 것부터 시작하고 싶다.



출처

  1. University of Michigan뉴스의 오리지널 게재 페이지
    https://news.umich.edu/say-whats-on-your-mind-and-ai-can-tell-what-kind-of-person-you-are/

  2. Tech Xplore게재의 전재 기사(연구 개요, 참가자 규모, LLM 예, 시사점의 요약)
    https://techxplore.com/news/2026-01-mind-ai-kind-person.html

  3. Nature Human Behaviour##HTML_TAG_265