Los teóricos de la conspiración se revelan más por "cómo hablan" que por "qué dicen": huellas lingüísticas en 500 millones de publicaciones de Reddit

Los teóricos de la conspiración se revelan más por "cómo hablan" que por "qué dicen": huellas lingüísticas en 500 millones de publicaciones de Reddit

¿Las teorías de conspiración residen en el "tono" más que en el "tema"?—Análisis de 500 millones de publicaciones de Reddit por IA

¿Las personas que hablan de teorías de conspiración utilizan un lenguaje característico incluso cuando no están hablando de teorías de conspiración?

Un equipo de investigación, liderado por el Politécnico de Milán, abordó esta pregunta mediante un análisis de datos a gran escala. El objeto de estudio fueron más de 500 millones de comentarios publicados en "Reddit", una red social estadounidense tipo foro gigante. Los investigadores examinaron cómo los usuarios que participan en "r/conspiracy", una comunidad representativa de teorías de conspiración, se expresan en comunidades generales como noticias, ciencia, cine, música, cocina, bricolaje y fotos de animales.

Las conclusiones de la investigación son estimulantes. Los usuarios que participan en la comunidad de teorías de conspiración mostraron ciertas características lingüísticas incluso en lugares donde no hablaban de teorías de conspiración. Además, estas características pudieron ser identificadas con alta precisión por un modelo de IA.

Sin embargo, lo que esta investigación demostró no es una simple "lista de palabras de conspiracionistas". Lo importante es que la tendencia conspirativa no se manifiesta de la misma manera en todos los temas, sino que cambia según la cultura de la comunidad y las reglas de conversación.

En otras palabras, el lenguaje en torno a las teorías de conspiración no aparece como una etiqueta fija, sino como un "tono" que se adapta al contexto.


La incomodidad del "diálogo neutral" revelada por 500 millones de publicaciones

El equipo de investigación analizó comentarios publicados en más de 20 comunidades principales de Reddit durante una actividad de 10 años. Se compararon usuarios que alguna vez participaron en r/conspiracy con usuarios generales que no lo hicieron.

El punto clave es que los investigadores no observaron publicaciones sobre teorías de conspiración en sí. El objeto de análisis fueron las expresiones en comunidades principales. Por ejemplo, opiniones sobre películas, discusiones sobre cocina, preferencias musicales, reacciones a noticias científicas y pequeñas charlas cotidianas. Se investigaron palabras que, en apariencia, no eran políticas ni conspirativas.

Como resultado, el modelo de aprendizaje automático pudo identificar a los participantes de la comunidad de teorías de conspiración y a los no participantes con una precisión promedio del 87% dentro de cada comunidad. Este número es difícil de explicar como mera coincidencia o sesgo hacia temas específicos.

Lo que destacó especialmente fueron expresiones de ira o ansiedad, palabras con connotaciones de conflicto o agresión, y vocabulario relacionado con enfermedades o muerte. El equipo de investigación extrajo características psicolingüísticas y las agrupó por usuario para entrenar el modelo. Es decir, no se juzgó por una sola palabra, sino que se trató estadísticamente la tendencia emocional y cognitiva contenida en toda la expresión.

Por ejemplo, en una conversación sobre "cocina", una persona puede hablar tranquilamente sobre recetas e innovaciones en el sabor. Mientras que otra persona puede mezclar expresiones de ira, desconfianza y agresión. La investigación capturó precisamente esas diferencias de temperatura en las conversaciones y las perspectivas del mundo que se reflejan.


No existe un "lenguaje de conspiracionistas"

Lo interesante de esta investigación es que, aunque se encontraron características comunes entre los participantes de la comunidad de teorías de conspiración, se demostró que un "modelo de detección universal" no funciona bien.

Según el equipo de investigación, intentar identificar todas las comunidades con un solo modelo grande resultó en un rendimiento inferior en comparación con los modelos individuales creados para cada comunidad. La diferencia alcanzó hasta 17 puntos.

Esto es importante.

Porque el lenguaje en las redes sociales no se determina solo por el interior del autor. En las comunidades de noticias, hay más palabras explicativas; en las comunidades de humor, aumentan el sarcasmo y las bromas; y en las comunidades de hobbies, hay más vocabulario tranquilo. Cada lugar tiene su propio "ambiente".

Los usuarios que participan en comunidades de teorías de conspiración también cambian su expresión para adaptarse a ese ambiente. El equipo de investigación enfatiza este punto, señalando que se necesita un análisis contextualizado para cada comunidad en lugar de buscar una sola "palabra conspirativa".

Esto tiene grandes implicaciones para la moderación de redes sociales y la detección de riesgos. Un enfoque simple de palabras prohibidas o una detección uniforme de IA con los mismos criterios en todas partes podría llevar a malinterpretaciones de la realidad. Una expresión que es natural en una comunidad puede ser una señal fuerte de identificación en otra.


¿Había señales antes de participar?

Otro punto notable es la afirmación de que estas características lingüísticas se observaron incluso antes de que los usuarios participaran en comunidades de teorías de conspiración.

La investigación también analizó las expresiones en comunidades principales antes de que los usuarios participaran explícitamente en r/conspiracy. Se dice que los patrones utilizables para la identificación existían de manera relativamente estable en lugar de surgir repentinamente justo antes de la participación.

Esto es difícil de explicar como una simple relación causal de "el lenguaje cambió porque se expusieron a la comunidad de teorías de conspiración". Más bien, se podría considerar un aspecto de auto-selección donde los usuarios que ya tienen una tendencia hacia la desconfianza o ciertas expresiones emocionales son atraídos posteriormente hacia la comunidad de teorías de conspiración.

Por supuesto, esto no permite determinar la psicología o el comportamiento futuro de un individuo. Las publicaciones en redes sociales están influenciadas por muchos factores, como la personalidad, la edad, la cultura, las opiniones políticas, el entorno de vida, el estado de ánimo del día y el ambiente del lugar de publicación. El equipo de investigación también adopta una postura cautelosa hacia la generalización sin contexto.

Aun así, este estudio es muy sugestivo en el sentido de que muestra la posibilidad de que la acumulación de palabras casuales esté vinculada a la participación en comunidades en línea y cambios en el entorno informativo.


Reacción en redes sociales: la difusión es limitada, pero el tema es serio

 

El artículo de Phys.org que presentó esta investigación no provocó un gran escándalo ni un debate masivo en sus primeras etapas de publicación. El número de comparticiones en la página del artículo es limitado y, en el momento de la verificación, no había muchos comentarios.

En X, una cuenta de información científica en japonés presentó el artículo con el tema de "la naturaleza conspirativa que se filtra en las palabras", pero en el rango que se puede verificar mediante búsqueda, el número de reacciones aún es pequeño. El título del artículo también ha circulado en bots de publicación automática de arXiv en Mastodon y sitios de recopilación de noticias, y en este momento parece estar en la etapa de difusión inicial a través de investigadores, lectores de noticias científicas y feeds automáticos, más que en un "gran debate de usuarios generales".

En LinkedIn, los autores Francesco Pierri y Francesco Corso han mencionado este artículo como investigación relacionada y su aceptación en ACL 2026. Aquí también, la impresión es que se comparte más dentro de las comunidades de investigación de ciencias sociales computacionales, procesamiento del lenguaje natural y seguridad en línea, en lugar de provocar un escándalo popular.

Sin embargo, si esta investigación se lee ampliamente en el futuro, se pueden esperar algunas reacciones en redes sociales.

Una es la postura que apoya el fortalecimiento de la moderación. Las teorías de conspiración, la radicalización, la desinformación médica y la información falsa relacionada con elecciones pueden afectar la sociedad real. Hay una visión de que tiene sentido que las plataformas comprendan la formación de comunidades de alto riesgo en una etapa temprana y tomen medidas contextuales.

Por otro lado, también surgirán preocupaciones sobre la libertad de expresión y la privacidad. La idea de inferir la futura participación en comunidades a partir de "publicaciones que no hablan de teorías de conspiración" puede parecer vigilante para algunas personas. Incluso si es con fines de investigación, si se implementa esta tecnología, no se pueden evitar problemas de falsos positivos y etiquetado.

Especialmente porque palabras relacionadas con "ira", "ansiedad" y "muerte" son utilizadas naturalmente por personas no relacionadas con teorías de conspiración. Personas que hablan de experiencias de enfermedad, comparten tristeza, expresan descontento con la política o se enojan por problemas sociales no deben ser tratadas como sospechosas en conjunto.

Lo que esta investigación debería mostrar no es una herramienta para determinar a una persona como "conspiracionista", sino una pista para capturar cuidadosamente el entorno lingüístico y los cambios de riesgo de toda la comunidad.


La detección por IA no es infalible

El número promedio del 87% es llamativo, pero por otro lado, también quedan falsos positivos. Además, los falsos positivos en redes sociales no son solo errores estadísticos. Pueden afectar las oportunidades de expresión de los usuarios en forma de restricciones de cuenta, eliminación de publicaciones, disminución de visibilidad o exclusión de la comunidad.

Además, la alta precisión en la investigación se logró en un experimento comparativo diseñado bajo ciertas condiciones. En la operación real de redes sociales, se mezclan nuevos argots, sarcasmos, memes, diferencias culturales, diferencias lingüísticas, bots, trolls y campañas políticas. Las características que fueron efectivas en un momento pueden no serlo en otro.

Además, si los usuarios son conscientes de la detección, cambiarán su lenguaje. Si se generaliza la vigilancia por IA, las expresiones obvias disminuirán y aumentarán las expresiones encriptadas y los términos internos. Este es un problema que se ha repetido en la lucha contra las comunidades extremistas y el spam.

Por eso, la "intervención contextualizada" que enfatiza el equipo de investigación se vuelve importante. Se requiere una respuesta que comprenda las normas de cada comunidad y que no se base en una detección simple, sino que cuente con transparencia, explicabilidad y un sistema de apelación.


¿Es realmente neutral un lugar neutral?

Otra pregunta que plantea esta investigación es el problema de qué es una "comunidad neutral".

Tendemos a ver las comunidades políticas y los foros de teorías de conspiración como lugares especiales. Allí se intercambian discursos extremos, las emociones se intensifican y surgen conflictos. Por otro lado, comunidades como cocina, música, cine, bricolaje y fotos de animales se consideran lugares más tranquilos y neutrales.

Sin embargo, la investigación muestra que no es tan simple. Los usuarios no existen solo en una comunidad. En un lugar comentan fotos de perros, en otro se enojan con las noticias, y en otro más simpatizan con interpretaciones conspirativas. La personalidad en línea se forma mientras se mueve entre múltiples espacios.

En otras palabras, la cosmovisión conspirativa no está confinada solo a lugares dedicados a teorías de conspiración. En conversaciones cotidianas, discusiones sobre hobbies y breves reacciones a noticias, pueden filtrarse hábitos emocionales y estructuras de desconfianza.

Esto no es para sospechar de individuos. Más bien, es para entender cuán interconectados están los espacios en línea. En redes sociales, hobbies, política, salud, noticias, entretenimiento, ira, ansiedad y bromas se mezclan en la misma cuenta. Cómo manejar esa mezcla será un desafío para el diseño de plataformas futuras.


La investigación no busca "cazar personas peligrosas"

Este tipo de investigación puede avanzar en una dirección peligrosa si se maneja incorrectamente. La expresión de "detectar la naturaleza conspirativa a partir de textos" puede sonar como tecnología de vigilancia o perfilamiento.

Sin embargo, lo que realmente muestra esta investigación no es un método para condenar a individuos, sino un método para comprender la estructura lingüística de las comunidades en línea. Lo importante es saber cómo las teorías de conspiración se expanden mientras se conectan con emociones, vocabulario y cultura comunitaria.

Los investigadores enfatizan la necesidad de análisis e intervención sensibles al contexto, en lugar de un detector universal. Esta es una perspectiva importante tanto para los operadores de plataformas, como para los medios y los usuarios.

Porque las teorías de conspiración no son simplemente "información incorrecta". Están entrelazadas con ira, ansiedad, sensación de alienación, desconfianza y sentido de pertenencia a la comunidad. Simplemente eliminar la desinformación no revela por qué las personas son atraídas hacia ella.


Las palabras anuncian cambios antes que la pertenencia

Las palabras en redes sociales no son solo transmisión de información. Reflejan en quién confías, qué temes y en qué comunidad sientes seguridad.

Este estudio sugiere que la participación en comunidades de teorías de conspiración podría estar relacionada con tendencias lingüísticas y psicológicas previas, en lugar de ser una caída repentina. Por supuesto, esto no es determinismo. Usar ciertas palabras no significa que una persona se dirigirá hacia teorías de conspiración.

Aun así, al observar los datos masivos de redes sociales, emergen patrones que no son visibles en publicaciones individuales. Palabras cargadas de ira o ansiedad, menciones a enfermedades o muerte, un tono conflictivo. Cada una de estas puede ser una expresión cotidiana, pero al acumularse, se asocian estadísticamente con la participación en ciertas comunidades.

El desafío futuro es cómo utilizar este conocimiento. Si se usa para vigilancia o exclusión, las redes sociales profundizarán aún más la desconfianza. Pero si se utiliza para comprender el contexto de cada comunidad, identificar la radicalización o el aislamiento temprano y diseñar un diálogo más saludable, podría ser una pista para mejorar el espacio en línea.

Las teorías de conspiración no se componen solo de palabras específicas. Surgen de la superposición de la ansiedad, la ira, el deseo de pertenencia de las personas y el ambiente de la comunidad. Lo que este estudio ha revelado es que esa compleja superposición también se refleja en nuestras palabras cotidianas.



URL de la fuente

Phys.org: Resumen del estudio por el Politécnico de Milán, análisis de más de 500 millones de comentarios de Reddit, precisión de identificación promedio del 87%, posición del estudio sobre comunidades de teorías de conspiración en redes sociales.
https://phys.org/news/2026-06-distinctive-language-reveals-conspiracy-community.html

Artículo de arXiv "Among Us: Language of Conspiracy Theorists on Mainstream Reddit": Documento original del estudio. 500 millones de comentarios, 10 años de actividad en Reddit, más de 20 comunidades principales, comparación de modelos por comunidad y modelo general, detalles de características psicolingüísticas.
https://arxiv.org/