Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

¡Cambiar el futuro del desarrollo de medicamentos! Inteligencia Artificial que maneja el "lenguaje molecular": El potencial del LLM químico que colabora con Rhodium

¡Cambiar el futuro del desarrollo de medicamentos! Inteligencia Artificial que maneja el "lenguaje molecular": El potencial del LLM químico que colabora con Rhodium

2025年08月16日 00:58

1|Puntos clave de las noticias: "Tratar las moléculas como 'lenguaje'" en la IA para el descubrimiento de fármacos

Southwest Research Institute (SwRI) ha anunciado un modelo de lenguaje a gran escala (LLM) especializado en química llamado "GAMES". GAMES comprende y genera SMILES (Simplified Molecular Input Line Entry System), un estándar de la industria que representa estructuras moleculares en cadenas cortas de texto, con el objetivo de acelerar el proceso de descubrimiento de fármacos, incluyendo el cribado virtual. La fecha de lanzamiento es el 14 de agosto de 2025, y también ha sido reportado en Phys.org.swri.org


GAMES está diseñado para integrarse con el software de acoplamiento molecular "Rhodium" de SwRI. Mientras Rhodium se encarga del acoplamiento tridimensional y la visualización de propiedades, GAMES amplía el "lado textual" del espacio de búsqueda, proporcionando candidatos SMILES más diversos y válidos.swri.org


2|Detalles técnicos: Ajuste ligero con LoRA/QLoRA, reducción de SMILES no válidos

Según SwRI, GAMES se ajusta eficientemente utilizando LoRA y QLoRA, reduciendo la carga de hardware y energía necesaria para el aprendizaje y la inferencia. Los experimentos han mostrado un aumento en la generación de SMILES válidos y una disminución en las salidas no válidas. Aunque está en una etapa inicial, se ha mencionado que al integrarse en el flujo de trabajo de Rhodium, podría acelerar el enfoque generalizado de diseño de fármacos.swri.org


El trasfondo de la elección tecnológica radica en tratar la química como "cadenas de texto" en lugar de "gráficos", adaptando las capacidades lingüísticas de los LLM generales al lenguaje químico. Por ejemplo, investigaciones como SmileyLlama y SMILES-Mamba que adaptan y expanden los LLM a modelos de lenguaje químico (CLM) han aumentado desde 2024.


Además, se ha informado que las incrustaciones SMILES utilizando LLM tipo LLaMA igualan o superan a los modelos competidores en la predicción de propiedades moleculares. La dirección de GAMES se posiciona en esta línea de contexto.


3|¿Por qué un LLM que "habla SMILES" acelera el descubrimiento de fármacos?

El descubrimiento de fármacos es un problema de búsqueda para encontrar candidatos "potencialmente terapéuticos" en un vasto espacio químico. SMILES puede representar moléculas como una cadena de texto continua, lo que se adapta naturalmente al área de especialización de los LLM (generación y transformación de secuencias de tokens). Los numerosos candidatos generados como texto se pasan a métodos basados en estructuras como Rhodium, donde se refinan a través de acoplamiento, predicción de propiedades y filtrado. GAMES busca mejorar el rendimiento general al expandir de manera inteligente y rápida esta etapa inicial de "despliegue de candidatos".swri.org


SwRI menciona la clasificación de bibliotecas de compuestos basadas en "drogabilidad" utilizando GAMES y la exploración sistemática de paisajes químicos como direcciones futuras. Esta implementación busca acortar el ciclo de modelos generativos y evaluación de propiedades y seguridad (ADMET), lo que podría aliviar los cuellos de botella en el laboratorio.swri.org


4|Reacciones en redes sociales: se visualizan tanto expectativas como escepticismo

El día del anuncio, la cuenta oficial de X de SwRI anunció "GAMES, el LLM químico que acelera el descubrimiento de fármacos". La comunidad expresó opiniones positivas como "la aplicación de IA en el descubrimiento de fármacos es bienvenida", aunque también se mezclaron reacciones que pedían puntos de referencia específicos y ganancias en operaciones reales.


Por otro lado, en discusiones generales sobre química y LLM en subforos de Reddit de química e IA, se ha repetido el escepticismo de que los LLM (generales) son deficientes en la conversión de SMILES y la estructuración legible por máquina. En un hilo, se compartió la opinión de un experto en quimioinformática de que "los LLM son débiles en SMILES". GAMES afirma abordar este punto débil mediante datos específicos de dominio y ajuste fino para aumentar la "tasa de validez".swri.org


Además, en Hacker News, se ha visto recientemente una perspectiva positiva de que "LLM/AGI podría ser un gran impulso en campos que utilizan muchos experimentos paralelos y simulaciones, como el descubrimiento de fármacos". Sin embargo, también existen contraargumentos que señalan los costos de paralelización y automatización de experimentos húmedos y las limitaciones físicas. La "temperatura" de la comunidad está en una etapa de búsqueda del equilibrio entre expectativas y realidad.


5|Riesgos y limitaciones: "Solo SMILES correctos" no es suficiente

Aunque un LLM puede ordenar el vocabulario correcto, eso no garantiza que sea "sintetizable" o que no tenga "toxicidad o problemas metabólicos". La descripción de GAMES menciona la reducción de SMILES no válidos (mejora de la validez gramatical), pero sugiere que la "adecuación a la realidad" de la sintetizabilidad (SA) y ADMET sigue siendo un área que debe garantizarse mediante evaluación y verificación posteriores.swri.org


Además, en cuanto a la seguridad de los LLM en el ámbito químico, se ha señalado la vulnerabilidad de "escapes" (jailbreak) a través de SMILES o representaciones de procedimientos. Durante la publicación y operación del modelo, es esencial un diseño y gobernanza que eviten la difusión y el uso indebido de información sobre la síntesis de sustancias peligrosas.


6|Contexto de investigación circundante: puente entre "LLM general → lenguaje químico"

Desde 2024, han surgido métodos para adaptar LLM generales al lenguaje químico (SFT, DPO, preentrenamiento auto-supervisado, etc.), y se ha informado su efectividad en la predicción de propiedades moleculares y generación inducida. GAMES puede considerarse un ejemplo de avance en esta tendencia hacia una implementación más orientada a la industria (integración con Rhodium).


Por otro lado, investigaciones pasadas han enseñado que es esencial un diseño de evaluación robusto para el trabajo práctico, evitando fugas mediante la división de datos, la canonicidad, la eliminación de duplicados y comparaciones de referencia realistas. Será interesante observar el nivel de divulgación de métricas de evaluación y datos que SwRI publique en la próxima fase.


7|¿Qué se considera un éxito? KPI desde la perspectiva práctica

  • Equilibrio entre la tasa de SMILES válidos y la novedad: No solo la "tasa de validez", sino también la diversidad química y la facilidad de síntesis (puntuación SA) deben ser mencionadas.

  • Mejora de tareas posteriores: Distribución de puntuaciones de acoplamiento en Rhodium, tasa de aciertos medidos en experimentos de seguimiento, reducción de falsos positivos.

  • Eficiencia computacional: Costos de entrenamiento e inferencia (tiempo de GPU/energía) y mejora en el rendimiento mediante LoRA/QLoRA.swri.org

  • Seguridad: Supresión y detección de la salida de información química peligrosa, registro y sistema de auditoría.


8|Perspectiva editorial: la realidad de la estrategia de "cortar la química con lenguaje"

La importancia de GAMES radica en tratar la química como texto, lo que permite integrar el ecosistema de LLM generales (ajuste fino ligero, diseño de prompts, integración de herramientas) en el descubrimiento de fármacos. Los comentarios de que ya está influyendo en proyectos reales dentro del instituto sugieren una sensación de logro más allá de la prueba de concepto. Sin embargo, su verdadero valor se confirmará solo cuando se demuestreresultados experimentales: la medición y reproducibilidad de compuestos exitosos. Lo que se espera es la publicación de puntos de referencia, verificación externa y un protocolo de evaluación abierto.swri.org


Artículos de referencia

Modelo de lenguaje químico desarrollado para acelerar el descubrimiento de fármacos
Fuente: https://phys.org/news/2025-08-chemistry-llm-faster-drug-discovery.html

Powered by Froala Editor

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.