阴谋论者是通过“如何表达”而非“表达什么”来显现的吗?5亿条Reddit帖子揭示的语言痕迹

阴谋论者是通过“如何表达”而非“表达什么”来显现的吗?5亿条Reddit帖子揭示的语言痕迹

阴谋论是“话题”还是“叙述方式”——AI分析了5亿条Reddit帖子

谈论阴谋论的人,即使在不谈论阴谋论时,也会使用某种特征性的语言吗?

为了解答这个问题,以米兰理工大学为中心的研究团队通过大规模数据分析进行了研究。研究对象是美国大型论坛型社交网络“Reddit”上发布的超过5亿条评论。研究人员调查了参与阴谋论相关代表性社区“r/conspiracy”的用户在新闻、科学、电影、音乐、烹饪、DIY、动物照片等一般社区中的发言方式。

研究的结论令人振奋。参与阴谋论社区的用户即使在没有谈论阴谋论的地方,也表现出一定的语言特征。而且,这些特征可以通过AI模型以高精度识别。

然而,这项研究所展示的并不是简单的“阴谋论者词汇列表”。更重要的是,阴谋论的倾向并不在所有话题中以同样的方式表现,而是根据参与的社区文化和对话规则而变化。

换句话说,围绕阴谋论的语言不是固定的标签,而是根据场合变化的“叙述方式”。


从5亿条帖子中看到的“中立对话”的不协调感

研究团队分析了Reddit上长达10年的活动,涉及20多个主流社区的评论。比较对象是曾参与过r/conspiracy的用户和一般用户。

关键在于,研究人员并没有查看阴谋论本身的帖子。分析对象是主流社区中的发言。例如电影评论、烹饪讨论、音乐喜好、科学新闻的反应、日常的小谈话。表面上看,这些场景既不政治化也不阴谋论化。

结果显示,机器学习模型能够以平均87%的精度识别出阴谋论社区参与者和非参与者。这一数字难以用单纯的偶然或特定话题的偏见来解释。

尤其显著的是,表达愤怒或焦虑的语言、带有对立或攻击性的词汇、与疾病或死亡相关的词汇等。研究团队提取了心理语言学特征,并将其按用户单位汇总让模型学习。也就是说,判断不是基于单个词,而是统计处理了整个发言中包含的情感和认知倾向。

例如,即使是同样的“烹饪”话题,有的人可能会平和地谈论食谱和味道的改进,而另一些人可能会混杂愤怒、不信任、攻击性的表达。研究捕捉到的正是这种对话的温差和世界观的流露。


“阴谋论者的语言”并不存在

这项研究的有趣之处在于,尽管找到了阴谋论社区参与者的共同特征,但显示出“万能的检测模型”并不能很好地工作。

研究团队指出,如果试图用一个大模型来识别所有社区,性能会比为每个社区制作的单独模型差。差距最大可达17个百分点。

这很重要。

因为,SNS上的语言不仅仅由发布者的内心决定。在新闻类社区中,解释性语言会增多;在幽默类社区中,讽刺和玩笑会增多;在兴趣类社区中,温和的词汇会增多。每个地方都有其特有的“氛围”。

参与阴谋论社区的用户也会根据这种氛围改变表达。研究团队重视这一点,指出需要根据社区的语境进行分析,而不是寻找单一的“阴谋论式语言”。

这对SNS的管理和风险检测具有重要启示。简单的NG词汇方式或在任何地方使用相同标准的统一AI检测可能会误解实际情况。因为在一个社区中自然的表达,在另一个社区中可能成为强烈的识别信号。


参与之前是否已有迹象

另一个值得注意的点是,这些语言特征在用户参与阴谋论社区之前就已被观察到。

研究分析了用户在明确参与r/conspiracy之前在主流社区的发言。结果表明,可用于识别的模式并不是在参与前突然出现的,而是相对稳定地存在。

这难以用“因为接触了阴谋论社区所以语言改变了”这样的简单因果关系来解释。相反,可能是本身具有特定不信任感或情感表达倾向的用户后来被吸引到阴谋论社区,这也可能是自我选择的一个方面。

当然,这并不能断定个人的心理或未来行为。SNS上的帖子受性格、年龄、文化、政治观、生活环境、当天的心情、发布地点的氛围等多种因素影响。研究团队对无视语境的泛化持谨慎态度。

即便如此,这项研究在展示日常语言的积累可能与在线社区参与和信息环境的变化相关联方面具有很强的启示性。


SNS的反应:传播有限,但论点沉重

 

介绍这项研究的Phys.org文章在发布初期并未引起巨大争议或大规模讨论。文章页面上的分享数量有限,评论在检查时也不多。

在X上,日本的科学信息账户以“从言辞中流露出的阴谋论者性格”为主题介绍了这篇文章,但在可确认的范围内,反应数量仍然较少。Mastodon系的arXiv自动发布机器人和新闻收集网站也流传着论文标题,目前看来,这更像是研究者、科学新闻读者、通过自动推送进行的初期传播,而非“大众用户的激烈争论”。

在LinkedIn上,作者Francesco Pierri和Francesco Corso提到了在ACL 2026上的采纳及相关研究。这里也更像是在计算社会科学、自然语言处理、在线安全性研究社区内分享,而非大众性的争议。

不过,如果这项研究被广泛阅读,SNS上可能会出现一些反应。

一种是支持加强管理的立场。阴谋论、激进化、医疗错误信息、选举相关虚假信息可能会对现实社会产生影响。早期掌握高风险社区的形成,并让平台方根据语境采取相应措施是有意义的。

另一方面,关于表达自由和隐私的担忧也可能出现。从“未谈论阴谋论的帖子”推测未来的社区参与,这种想法对某些人来说可能显得监视性。即使是研究目的,如果这种技术被实际运用,误判和贴标签的问题是无法避免的。

尤其是“愤怒”、“不安”或“死亡”相关的词汇,显然也会被与阴谋论无关的人使用。讲述疾病经历的人、分享悲伤的人、表达对政治不满的人、对社会问题感到愤怒的人都不应被一概视为可疑。

这项研究应展示的不是“断定此人为阴谋论者”的工具,而是谨慎捕捉整个社区语言环境和风险变化的线索。


AI检测并非万能

平均87%的数字引人注目,但反过来说也意味着存在误判。而且,SNS上的误判不仅仅是统计上的错误。它可能以限制账户、删除帖子、降低可见性、从社区中排除等形式影响用户的表达机会。

此外,研究中取得高精度是在特定条件下设计的比较实验中实现的。在实际的SNS运营中,新俚语、讽刺、模因、文化差异、语言差异、机器人、恶意用户、政治活动等交织在一起。在某个时期有效的特征在另一个时期可能不再适用。

而且,如果用户意识到检测,他们会改变语言。如果AI监控普及,直白的表达会减少,可能会增加加密的说法和内部用语。这是极端社区和垃圾邮件对策中反复出现的问题。

因此,研究团队强调的“根据语境进行干预”变得尤为重要。理解每个社区的规范,采取透明、可解释、具备异议机制的应对措施,而不是简单的检测。


中立的地方真的中立吗

这项研究提出的另一个问题是,“中立的社区”究竟是什么。

我们倾向于将政治社区或阴谋论论坛视为特殊的地方。在那里,极端言论交织,情绪高涨,产生对立。另一方面,像烹饪、音乐、电影、DIY、动物照片这样的社区被认为是更温和和中立的地方。

然而,研究表明事情并不那么简单。用户并不只存在于一个社区。在一个地方评论狗的照片,在另一个地方对新闻感到愤怒,在再一个地方对阴谋论的解释表示共鸣。在线上的人格是在多个空间中移动并形成的。

也就是说,阴谋论的世界观并不仅仅被封闭在专用的地方。日常的对话、兴趣的讨论、对新闻的简短反应中,也可能流露出情感的习惯和不信任的结构。

这不是为了怀疑个人。而是为了理解在线空间的互联程度。在SNS上,兴趣、政治、健康、新闻、娱乐、愤怒、不安、玩笑在同一个账户中混合。如何处理这种混合将成为未来平台设计的课题。


研究展示的不是“寻找危险人物”

这种研究如果处理不当可能会走向危险的方向。从帖子中识别“阴谋论者特质”的表述容易听起来像监控技术或画像分析。

然而,这项研究真正展示的不是断罪个人的方法,而是理解在线社区语言结构的方法。重要的是了解阴谋论如何与情感、词汇、社区文化结合并传播。

研究人员强调的不是万能的检测器,而是需要对语境敏感的分析和干预。这对平台运营者、媒体和用户都是重要的视角。

因为,阴谋论不仅仅是“错误信息”。其中交织着愤怒、不安、疏离感、不信任、对社区的归属感。仅仅删除错误信息并不能看出人们为何被吸引。


语言比归属更早传递变化

SNS上的语言不仅仅是信息传递。它反映了信任谁、害怕什么、在哪个社区感到安心。

此次研究显示,参与阴谋论社区并非突然的堕落,而可能与之前的语言和心理倾向有关。当然,这不是宿命论。使用某个词并不意味着那个人会走向阴谋论。

即便如此,通过庞大的SNS数据,可以看到在个别帖子中看不到的模式。带有愤怒或不安的语言、对疾病或死亡的提及、对立的叙述方式。这些单独来看是日常表达,但累积起来可能与某种社区参与统计相关。

今后的课题是如何利用这一发现。如果用于监控或排除,SNS可能会加深不信任。但如果用于理解每个社区的语境,及早发现激进化或孤立,并设计更健康的对话,可能会成为改善在线空间的线索。

阴谋论并不是由特定词汇构成的。它是人们的不安、愤怒、归属需求以及社区氛围的结合。此次研究揭示的是,这种复杂的结合也体现在我们日常的语言中。



出处URL

Phys.org:米兰理工大学等的研究概要,超过5亿条Reddit评论分析,平均87%的识别精度,SNS上阴谋论社区研究的定位参考。
https://phys.org/news/2026-06-distinctive-language-reveals-conspiracy-community.html

arXiv论文《Among Us: Language of Conspiracy Theorists on Mainstream Reddit》:研究的原论文。500 million comments、10年分的Reddit活动、20多个主流社区、社区别模型与整体模型的比较、心理语言学特征的详细参考。
https://arxiv.org/abs/2506.05086
https://arxiv.org/html/2506.05086v2

EurekAlert!发布:米兰理工大学的研究发布。研究者评论、DOI、ACL 2026采纳、相关的Jeffrey Epstein案例研究的提及参考。
https://www.eurekalert.org/news-releases/1131478

Francesco Pierri的LinkedIn帖子:作者关于ACL 2026采纳报告及研究内容展示“语境依赖的语言模式”和“社区别的管理”必要性的解释参考。
https://www.linkedin.com/posts/francesco-pierri_nice-coming-back-after-the-easter-break-with-activity-7447191919157280768-zuGL

Francesco Corso的LinkedIn帖子:作者介绍相关研究。阴谋论社区参与者在主流Reddit空间中也表现出可识别的语言模式的研究解释参考。
https://www.linkedin.com/posts/francesco-corso-130299132_cs2italy-activity-7463504662990630913-S7W5

X帖子(Sci佇 Bookends):作为日本语圈初期的SNS介绍例参考。可确认的范围内并非大规模讨论,而