음모론자는 "무엇을 말하는가"보다 "어떻게 말하는가"에서 드러난다? 5억 건의 Reddit 게시물이 보여준 언어의 흔적

음모론자는 "무엇을 말하는가"보다 "어떻게 말하는가"에서 드러난다? 5억 건의 Reddit 게시물이 보여준 언어의 흔적

음모론은 "화제"가 아니라 "말투"에 깃드는가——5억 건의 Reddit 게시물을 AI가 분석

음모론을 이야기하는 사람은, 음모론에 대해 이야기하지 않을 때에도, 어디선가 특징적인 말투를 사용하는 것일까.

이러한 질문에 대해 밀라노 공과대학을 중심으로 한 연구팀이 대규모 데이터 분석을 통해 접근했다. 대상이 된 것은 미국에서 시작된 거대 게시판형 SNS "Reddit"에 게시된 5억 건이 넘는 댓글이다. 연구자들은 음모론 관련 대표적인 커뮤니티인 "r/conspiracy"에 참여한 사용자가 뉴스, 과학, 영화, 음악, 요리, DIY, 동물 사진 등 일반적인 커뮤니티에서 어떻게 발언하고 있는지를 조사했다.

연구의 결론은 자극적이다. 음모론 커뮤니티에 참여하는 사용자는 음모론 그 자체를 이야기하지 않는 장소에서도 일정한 언어적 특징을 보였다. 게다가 그 특징은 AI 모델에 의해 높은 정확도로 식별될 수 있었다고 한다.

하지만 이 연구가 보여준 것은 단순한 "음모론자 단어 목록"이 아니다. 오히려 중요한 것은 음모론적인 경향이 어떤 화제에도 똑같이 나타나는 것이 아니라, 참여하고 있는 커뮤니티의 문화나 대화 규칙에 맞춰 변화한다는 점이다.

즉, 음모론을 둘러싼 말은 고정된 라벨이 아니라, 장소에 따라 형태를 바꾸는 "말투"로 나타난다.


5억 건의 게시물에서 드러난 "중립적인 대화"의 위화감

연구팀은 Reddit에서 10년에 걸친 활동을 대상으로, 20개 이상의 주류 커뮤니티에 게시된 댓글을 분석했다. 비교된 것은 r/conspiracy에 참여한 적이 있는 사용자와 그렇지 않은 일반 사용자다.

포인트는 연구자들이 음모론 그 자체의 게시물을 본 것이 아니라는 점이다. 분석 대상은 어디까지나 주류 커뮤니티에서의 발언이다. 예를 들어 영화 감상, 요리 이야기, 음악 취향, 과학 뉴스에 대한 반응, 일상의 사소한 잡담. 겉으로는 정치적이거나 음모론적이지 않은 장면에서의 말이 조사되었다.

그 결과, 기계 학습 모델은 각 커뮤니티 내에서 평균 87%의 정확도로 음모론 커뮤니티 참가자와 비참가자를 식별할 수 있었다고 한다. 이는 단순한 우연이나 특정 토픽에 대한 편향으로 설명하기 어려운 숫자다.

특히 두드러진 것은 분노나 불안을 나타내는 표현, 대립이나 공격성을 띤 말, 병이나 죽음에 관련된 어휘 등이었다. 연구팀은 심리언어학적 특징을 추출하고, 그것을 사용자 단위로 집약하여 모델에 학습시켰다. 즉, 단어 하나를 보고 판단한 것이 아니라, 발언 전체에 포함된 감정이나 인지의 경향을 통계적으로 다뤘다.

예를 들어 같은 "요리" 이야기라도 어떤 사람은 온화하게 레시피나 맛의 변화를 이야기한다. 한편으로 다른 사람은 분노나 불신, 공격적인 표현을 섞어가며 이야기할 수도 있다. 연구가 포착한 것은 바로 그러한 대화의 온도 차이나 세계관의 드러남이었다.


"음모론자의 말"은 존재하지 않는다

이 연구가 흥미로운 것은 음모론 커뮤니티 참가자에게 공통된 특징을 찾으면서도 "만능의 탐지 모델"은 잘 작동하지 않는다고 보여준 점에 있다.

연구팀에 따르면 모든 커뮤니티를 하나의 큰 모델로 식별하려고 하면 커뮤니티별로 만든 개별 모델보다 성능이 떨어졌다. 그 차이는 최대 17포인트에 달했다고 한다.

이는 중요하다.

왜냐하면 SNS상의 언어는 게시자의 내면만으로 결정되는 것이 아니기 때문이다. 뉴스계 커뮤니티에서는 설명적인 말이 많아지고, 유머계 커뮤니티에서는 풍자나 농담이 늘어나며, 취미계 커뮤니티에서는 온화한 어휘가 많아진다. 각각의 장소에는 각각의 "공기"가 있다.

음모론 커뮤니티에 참여하는 사용자도 그 공기에 맞춰 표현을 바꾼다. 연구팀은 이 점을 중시하여 단일의 "음모론스러운 말"을 찾는 것이 아니라 커뮤니티별 문맥에 따른 분석이 필요하다고 지적하고 있다.

이는 SNS의 모더레이션이나 리스크 탐지에 큰 시사점을 가진다. 단순한 NG 단어 방식이나 어디서나 같은 기준을 사용하는 일률적인 AI 탐지로는 실태를 오인할 가능성이 있다. 어떤 커뮤니티에서는 자연스러운 표현이 다른 커뮤니티에서는 강한 식별 신호가 될 수도 있기 때문이다.


참여하기 전부터 징후는 있었는가

더 주목할 점은 이러한 언어적 특징이 사용자가 음모론 커뮤니티에 참여하기 전부터 관찰되었다는 주장이다.

연구에서는 사용자가 r/conspiracy에 명시적으로 참여하기 이전의 주류 커뮤니티에서의 발언도 분석되었다. 그 결과, 식별에 사용할 수 있는 패턴은 참여 직전에 갑자기 생기는 것이 아니라 비교적 안정적으로 존재했다고 한다.

이는 "음모론 커뮤니티에 접했기 때문에 말이 변했다"는 단순한 인과관계로 설명하기 어렵다. 오히려 원래 특정한 불신감이나 감정 표현의 경향을 가진 사용자가 나중에 음모론 커뮤니티로 끌려가는 자기 선택의 측면도 고려할 수 있다.

물론 이것만으로 개인의 심리나 미래의 행동을 단정할 수 있는 것은 아니다. SNS상의 게시물은 성격, 연령, 문화, 정치관, 생활 환경, 그날의 기분, 게시 장소의 공기 등 많은 요소에 좌우된다. 연구팀도 문맥을 무시한 일반화에는 신중한 입장을 취하고 있다.

그럼에도 불구하고 사소한 말의 축적이 온라인상의 커뮤니티 참여나 정보 환경의 변화와 연결될 가능성을 보여준 점에서 이 연구는 매우 시사적이다.


SNS의 반응: 확산은 제한적, 그러나 논점은 무겁다

 

이 연구를 소개한 Phys.org 기사는 공개 직후 단계에서는 큰 논란이나 대규모 논의로 이어지지 않았다. 기사 페이지 상에서도 공유 수는 제한적이며, 댓글도 확인 시점에서는 많지 않았다.

X에서는 일본어 과학계 정보 계정이 "말의 끝에서 드러나는 음모론자성"이라는 취지로 기사를 소개했지만, 검색에서 확인할 수 있는 범위에서는 반응 수는 아직 작다. Mastodon계의 arXiv 자동 게시 봇이나 뉴스 수집 사이트에도 논문 제목이 흘러가고 있으며, 현재 시점에서는 "일반 사용자의 대논쟁"이라기보다는 연구자·과학 뉴스 독자·자동 피드를 통한 초기 확산 단계로 보인다.

LinkedIn에서는 저자인 Francesco Pierri 씨나 Francesco Corso 씨가 ACL 2026에서의 채택이나 관련 연구로서 이 논문에 대해 언급하고 있다. 이 역시 대중적인 논란이라기보다는 계산 사회 과학, 자연 언어 처리, 온라인 안전성의 연구 커뮤니티 내에서 공유되고 있는 인상이 강하다.

하지만 앞으로 이 연구가 널리 읽히면 SNS상에서는 몇 가지 반응이 예상된다.

하나는 모더레이션 강화를 지지하는 입장이다. 음모론이나 극단화, 의료 오정보, 선거 관련 허위 정보는 현실 사회에 영향을 미칠 수 있다. 빠른 단계에서 리스크가 높은 커뮤니티 형성을 파악하고 플랫폼 측이 문맥에 맞는 대응을 취하는 것은 의미가 있다는 관점이다.

반면 표현의 자유나 프라이버시에 대한 우려도 나올 것이다. "음모론을 이야기하지 않는 게시물"에서 미래의 커뮤니티 참여를 추측하는 발상은 사람에 따라 감시적으로 느껴질 수 있다. 비록 연구 목적이라 하더라도 이러한 기술이 실운용되면 오판정이나 레테르 붙이기의 문제는 피할 수 없다.

특히 "분노"나 "불안"이나 "죽음"에 관한 말은 음모론과 무관한 사람도 당연히 사용한다. 병의 경험을 이야기하는 사람, 슬픔을 공유하는 사람, 정치에 대한 불만을 말하는 사람, 사회 문제에 분노하는 사람까지 모두 의심스럽게 여겨져서는 안 된다.

이 연구가 보여줘야 할 것은 "이 사람은 음모론자다"라고 개인을 단정하는 도구가 아니라, 커뮤니티 전체의 언어 환경이나 리스크의 변화를 신중하게 포착하기 위한 실마리일 것이다.


AI에 의한 탐지는 만능이 아니다

평균 87%라는 숫자는 눈길을 끌지만, 뒤집어 보면 오판정도 남는다. 게다가 SNS상에서의 오판정은 단순한 통계상의 실수로 끝나지 않는다. 계정의 제한, 게시물의 삭제, 가시성의 저하, 커뮤니티에서의 배제 등의 형태로 사용자의 표현 기회에 영향을 미칠 가능성이 있다.

또한 연구에서 높은 정확도가 나온 것은 특정 조건에서 설계된 비교 실험 내에서의 이야기다. 실제 SNS 운용에서는 새로운 속어, 풍자, 밈, 문화 차이, 언어 차이, 봇, 트롤, 정치적 캠페인 등이 뒤섞인다. 어떤 시기에 유효했던 특징이 다른 시기에는 통용되지 않을 수도 있다.

더욱이 사용자는 탐지를 의식하면 말을 바꾼다. AI에 의한 감시가 확산되면 노골적인 표현은 줄고, 암호화된 말투나 내부용 은어가 늘어날 가능성도 있다. 이는 극단주의 커뮤니티나 스팸 대책에서도 반복되어 온 문제다.

그렇기 때문에 연구팀이 강조하는 "문맥에 따른 개입"은 중요해진다. 커뮤니티별 규범을 이해하고, 단순한 탐지가 아니라 투명성, 설명 가능성, 이의 제기 시스템을 갖춘 대응이 요구된다.


중립적인 장소는 정말로 중립적인가

이 연구가 던지는 또 하나의 질문은 "중립적인 커뮤니티"란 무엇인가라는 문제다.

우리는 정치 커뮤니티나 음모론 포럼을 특별한 장소로 인식하기 쉽다. 그곳에서는 극단적인 담론이 오가고, 감정이 고조되며, 대립이 생긴다. 한편 요리, 음악, 영화, DIY, 동물 사진 같은 커뮤니티는 더 온화하고 중립적인 장소라고 생각한다.

하지만 연구는 그렇게 단순하지 않다는 것을 보여준다. 사용자는 하나의 커뮤니티에만 존재하는 것이 아니다. 어떤 장소에서는 개 사진에 댓글을 달고, 다른 장소에서는 뉴스에 분노하며, 또 다른 장소에서는 음모론적인 해석에 공감한다. 온라인상의 인격은 여러 공간을 이동하면서 형성된다.

즉, 음모론적인 세계관은 음모론 전용 장소에만 갇혀 있는 것이 아니다. 일상적인 대화, 취미 이야기, 뉴스에 대한 짧은 반응 속에서도 감정의 버릇이나 불신의 구조가 드러날 수 있다.

이는 개인을 의심하기 위한 이야기가 아니다. 오히려 온라인 공간이 얼마나 상호 연결되어 있는지를 이해하기 위한 이야기다. SNS에서는 취미, 정치, 건강, 뉴스, 오락, 분노, 불안, 농담이 같은 계정 안에서 섞인다. 그 섞임을 어떻게 다룰지가 앞으로의 플랫폼 설계의 과제가 된다.


연구가 보여주는 것은 "위험 인물 찾기"가 아니다

이러한 종류의 연구는 다루는 방법을 잘못하면 위험한 방향으로 나아갈 수 있다. 게시물에서 "음모론자스러움"을 간파한다는 표현은 감시 기술이나 프로파일링처럼 들리기 쉽다.

그러나 본래 이 연구가 보여주는 것은 개인을 단죄하는 방법이 아니라 온라인 커뮤니티의 언어적 구조를 이해하기 위한 방법이다. 중요한 것은 음모론이 어떤 감정이나 어휘, 커뮤니티 문화와 결합하면서 확산되는지를 아는 것이다.

연구자들은 만능의 탐지기가 아니라 문맥에 민감한 분석과 개입의 필요성을 강조하고 있다. 이는 플랫폼 운영자에게도, 미디어에게도, 사용자에게도 중요한 시각이다.

왜냐하면 음모론은 단순히 "잘못된 정보"가 아니기 때문이다. 그 안에는 분노, 불안, 소외감, 불신, 공동체에 대한 소속감이 얽혀 있다. 잘못된 정보를 삭제하는 것만으로는 왜 사람들이 그곳에 끌리는지를 알 수 없다.


말은 소속보다 먼저 변화를 알린다

SNS상의 말은 단순한 정보 전달이 아니다. 그 안에는 누구를 믿고, 무엇을 두려워하며, 어떤 공동체에 안심을 느끼는지가 드러난다.

이번 연구는 음모론 커뮤니티에의 참여가 갑작스러운 추락이 아니라 이전부터의 언어적·심리적 경향과 관련되어 있을 가능성을 시사했다. 물론 그것은 운명론이 아니다. 어떤 말을 썼다고 해서 그 사람이 음모론으로 향하는 것은 아니다.

그럼에도 불구하고 거대한 SNS 데이터를 통해 보면 개개의 게시물에서는 보이지 않는 패턴이 떠오른다. 분노나 불안을 띤 말, 병이나 죽음에 대한 언급, 대립적인 말투. 그것들은 하나하나로는 일상적인 표현이지만, 쌓임으로써 어떤 종류의 커뮤니티 참여와 통계적으로 연결된다.

앞으로의 과제는 이 지식을 어떻게 활용할 것인가이다. 감시나 배제에 사용하면 SNS는 더욱 불신을 깊게 할 것이다. 하지만 커뮤니티별 문맥을 이해하고 극단화