ข้ามไปที่เนื้อหาหลัก
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア โลโก้
  • บทความทั้งหมด
  • 🗒️ สมัครสมาชิก
  • 🔑 เข้าสู่ระบบ
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • हिंदी
cookie_banner_title

cookie_banner_message นโยบายความเป็นส่วนตัว cookie_banner_and นโยบายคุกกี้ cookie_banner_more_info

การตั้งค่าคุกกี้

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

เปลี่ยนอนาคตของการพัฒนายา! AI ที่ควบคุม "ภาษาของโมเลกุล": ศักยภาพของ LLM ทางเคมีที่ร่วมมือกับ Rhodium

เปลี่ยนอนาคตของการพัฒนายา! AI ที่ควบคุม "ภาษาของโมเลกุล": ศักยภาพของ LLM ทางเคมีที่ร่วมมือกับ Rhodium

2025年08月16日 01:06

1|ประเด็นข่าวสำคัญ――AI สำหรับการค้นคว้ายาที่จัดการ "โมเลกุล" เป็น "ภาษา"

Southwest Research Institute (SwRI) ได้เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) ที่เน้นด้านเคมีชื่อว่า "GAMES" ซึ่ง GAMES สามารถเข้าใจและสร้างโครงสร้างโมเลกุลในรูปแบบสตริงสั้น ๆ ตามมาตรฐานอุตสาหกรรม SMILES (Simplified Molecular Input Line Entry System) โดยมีเป้าหมายเพื่อเร่งกระบวนการค้นคว้ายา รวมถึงการสกรีนเสมือนจริง วันที่เปิดตัวคือวันที่ 14 สิงหาคม 2025 และมีรายงานใน Phys.orgswri.org


GAMES ถูกออกแบบมาเพื่อทำงานร่วมกับซอฟต์แวร์การด็อกกิ้งโมเลกุล "Rhodium" ของ SwRI โดย Rhodium จะจัดการกับการด็อกกิ้งสามมิติและการมองเห็นคุณสมบัติ ในขณะที่ GAMES จะขยายพื้นที่การสำรวจในด้าน "ข้อความ" และมีบทบาทในการจัดหาตัวเลือก SMILES ที่หลากหลายและเหมาะสมมากขึ้นswri.org


2|เนื้อหาทางเทคนิค――การปรับแต่งเบาๆ ด้วย LoRA/QLoRA ลดการสร้าง SMILES ที่ไม่ถูกต้อง

ตามคำอธิบายของ SwRI, GAMES ถูกปรับแต่งอย่างมีประสิทธิภาพด้วยการใช้ LoRA และ QLoRA ซึ่งช่วยลดภาระด้านฮาร์ดแวร์และพลังงานที่ต้องใช้ในการเรียนรู้และการคาดการณ์ ในการทดลองพบว่าอัตราการสร้าง SMILES ที่เหมาะสมเพิ่มขึ้นและการสร้างที่ไม่ถูกต้องลดลง แม้จะอยู่ในขั้นเริ่มต้น แต่มีการกล่าวว่าเมื่อรวมเข้ากับเวิร์กโฟลว์ของ Rhodium อาจเร่งแนวทางการออกแบบยาทั่วไปได้swri.org


เบื้องหลังการเลือกเทคนิคนี้คือแนวโน้มล่าสุดที่จัดการเคมีเป็น "สตริง" แทนที่จะเป็น "กราฟ" และปรับความสามารถทางภาษาของ LLM ทั่วไปให้เข้ากับภาษาทางเคมี ตัวอย่างเช่น การวิจัยที่เปลี่ยนและขยาย LLM เป็นโมเดลภาษาทางเคมี (CLM) เช่น SmileyLlama และ SMILES-Mamba ได้เพิ่มขึ้นตั้งแต่ปี 2024 เป็นต้นไป


นอกจากนี้ยังมีรายงานว่า การฝัง SMILES ด้วย LLaMA-based LLM สามารถเทียบเท่าหรือเหนือกว่ารุ่นคู่แข่งในการทำนายคุณสมบัติของโมเลกุล ทิศทางของ GAMES ถูกวางตำแหน่งในบริบทของแนวโน้มนี้


3|ทำไม "LLM ที่พูด SMILES" ถึงเร่งการค้นคว้ายาได้

การค้นคว้ายาเป็นปัญหาการสำรวจที่ต้องค้นหาตัวเลือกที่ "อาจเป็นยา" จากพื้นที่เคมีขนาดใหญ่ SMILES สามารถแสดงโมเลกุลเป็นสตริงต่อเนื่อง ซึ่งสามารถแมปกับพื้นที่ที่ LLM ถนัด (การสร้างและแปลงลำดับโทเค็น) ได้อย่างเป็นธรรมชาติ ตัวเลือกจำนวนมากที่สร้างเป็นข้อความจะถูกส่งต่อไปยังวิธีการที่ใช้โครงสร้างเช่น Rhodium ผ่านการด็อกกิ้ง การทำนายคุณสมบัติ และการกรองเพื่อคัดเลือก GAMES มีเป้าหมายที่จะปรับปรุง throughput โดยการทำให้ "การขยายตัวเลือก" ฉลาดและเร็วขึ้นswri.org


SwRI ได้ระบุทิศทางในอนาคตโดยการจัดอันดับห้องสมุดสารประกอบตาม "ความเหมือนยา" และการสำรวจภูมิทัศน์เคมีอย่างเป็นระบบ ซึ่งเป็นการลดวงจรของโมเดลการสร้างและการประเมินคุณสมบัติและความปลอดภัย (ADMET) ซึ่งอาจช่วยลดคอขวดในห้องปฏิบัติการได้swri.org


4|ปฏิกิริยาบนโซเชียลมีเดีย――ทั้งความคาดหวังและความสงสัยได้รับการมองเห็น

ในวันประกาศ SwRI ได้ประกาศ "เคมี LLM GAMES ที่เร่งการค้นคว้ายา" บนบัญชี X อย่างเป็นทางการของพวกเขา ในขณะที่มีเสียงตอบรับเชิงบวกจากชุมชนว่า "ยินดีต้อนรับการใช้ AI ในการค้นคว้ายา" แต่ในเธรดทั้งหมดก็มีการเรียกร้องให้มีการวัดผลที่ชัดเจนและผลประโยชน์ในการใช้งานจริง


ในขณะเดียวกัน ในการอภิปรายทั่วไปเกี่ยวกับเคมีและ LLM บน Reddit ในกลุ่มย่อยที่เกี่ยวข้องกับเคมีและ AI มีการแสดงความสงสัยซ้ำ ๆ ว่า "LLM ทั่วไปไม่ถนัดในการแปลง SMILES หรือการจัดโครงสร้างที่เครื่องอ่านได้" ในเธรดหนึ่งมีการแชร์ความคิดเห็นของผู้เชี่ยวชาญ (เคโมอินฟอร์แมติกส์) ว่า "LLM อ่อนแอในด้าน SMILES" จุดสำคัญของ GAMES คือการยืนยันว่าได้เพิ่ม "อัตราความเหมาะสม" ด้วยข้อมูลที่เฉพาะเจาะจงในโดเมนและการปรับแต่งswri.org


นอกจากนี้ บน Hacker News มีมุมมองเชิงบวกที่ว่า "LLM/AGI สามารถเป็นตัวเพิ่มประสิทธิภาพในสาขาที่ใช้การทดลองและการจำลองแบบขนานมากมายเช่นการค้นคว้ายา" อย่างไรก็ตาม ก็มีการโต้แย้งที่ชี้ให้เห็นถึงต้นทุนการทำงานแบบขนานและการทำงานอัตโนมัติของการทดลองเปียก รวมถึงข้อจำกัดทางกายภาพ ความ "อุ่น" ของชุมชนอยู่ในขั้นตอนการค้นหาสมดุลระหว่างความคาดหวังและความเป็นจริง


5|ความเสี่ยงและข้อจำกัด――"SMILES ที่ถูกต้อง" เพียงอย่างเดียวไม่เพียงพอ

แม้ว่า LLM จะสามารถเรียงลำดับคำศัพท์ที่ถูกต้องได้ แต่การที่มัน "สามารถสังเคราะห์ได้" และ "ไม่มีพิษหรือปัญหาการเผาผลาญ" เป็นเรื่องที่แตกต่างกัน การอธิบายของ GAMES กล่าวถึงการลด SMILES ที่ไม่ถูกต้อง (การปรับปรุงความเหมาะสมทางไวยากรณ์) ในขณะที่ความสามารถในการสังเคราะห์ (SA) และ "ความเหมาะสมในความเป็นจริง" ของ ADMET ยังคงเป็นพื้นที่ที่ควรประเมินและตรวจสอบในขั้นตอนถัดไปswri.org


นอกจากนี้ ความปลอดภัยของ LLM ในด้านเคมียังมีการชี้ให้เห็นถึงความเปราะบางของ "การหลบหนี (Jailbreak)" ผ่านการแสดง SMILES หรือขั้นตอนการทำงาน ในการเปิดตัวและการดำเนินการของโมเดล จำเป็นต้องมีการออกแบบและการกำกับดูแลเพื่อป้องกันการแพร่กระจายหรือการใช้ข้อมูลการสังเคราะห์สารอันตรายในทางที่ผิด


6|บริบทของการวิจัยรอบข้าง――การเชื่อมโยง "LLM ทั่วไป→ภาษาเคมี"

ตั้งแต่ปี 2024 เป็นต้นมา มีวิธีการที่ปรับ LLM ทั่วไปให้เข้ากับภาษาเคมี (เช่น SFT, DPO, การเรียนรู้ล่วงหน้าแบบไม่ต้องมีครู) ปรากฏขึ้นอย่างต่อเนื่อง และมีการรายงานประสิทธิภาพในการทำนายคุณสมบัติของโมเลกุลและการสร้างนำทาง GAMES สามารถถือเป็นตัวอย่างที่ก้าวไปข้างหน้าในแนวโน้มนี้ในฐานะการใช้งานที่เน้นอุตสาหกรรม (การเชื่อมโยงกับ Rhodium)


ในขณะเดียวกัน การออกแบบการประเมินที่ทนทานต่อการใช้งานจริง――การแบ่งข้อมูลเพื่อหลีกเลี่ยงการรั่วไหล การทำให้เป็นมาตรฐาน การกำจัดการซ้ำซ้อน การเปรียบเทียบฐานที่เป็นจริง――เป็นสิ่งจำเป็นที่การวิจัยในอดีตได้สอนเรา เราต้องการเห็นระดับการเปิดเผยตัวชี้วัดการประเมินและข้อมูลที่ SwRI จะเปิดเผยในขั้นตอนต่อไป


7|"อะไรที่ทำได้แล้วถือว่าชนะ"――KPI จากมุมมองการปฏิบัติ

  • การรักษาอัตรา SMILES ที่เหมาะสมและความใหม่: ไม่ใช่แค่ "อัตราความถูกต้อง" แต่ยังรวมถึงความหลากหลายทางเคมีและความง่ายในการสังเคราะห์ (คะแนน SA)

  • การปรับปรุงงานในขั้นตอนถัดไป: การกระจายคะแนนการด็อกกิ้งใน Rhodium, อัตราการฮิตที่วัดได้ในการทดลองติดตามผล, การลดการตรวจจับผิด (false positive)

  • ประสิทธิภาพการคำนวณ: ต้นทุนการฝึกอบรมและการคาดการณ์ด้วย LoRA/QLoRA (เวลา GPU/พลังงาน) และขอบเขตการปรับปรุง throughputswri.org

  • ความปลอดภัย: การยับยั้งและตรวจจับการส่งออกข้อมูลเคมีอันตราย, ระบบบันทึกและการตรวจสอบ


8|มุมมองของกองบรรณาธิการ――ความเป็นจริงของกลยุทธ์ "การตัดเคมีด้วยภาษา"

ความสำคัญของ GAMES อยู่ที่การจัดการ "เคมีเป็นข้อความ" ซึ่งนำระบบนิเวศของ LLM ทั่วไป (การปรับแต่งเบาๆ, การออกแบบพรอมต์, การเชื่อมโยงเครื่องมือ) เข้าสู่การค้นคว้ายา ความคิดเห็นที่ว่าได้ส่งผลต่อโครงการจริงในสถาบันวิจัยแล้วอาจเป็นการแสดงถึงความรู้สึกที่เกินกว่า PoC อย่างไรก็ตาม คุณค่าที่แท้จริงจะได้รับการยืนยันเมื่อผลลัพธ์จากการทดลอง――การวัดและการทำซ้ำของสารประกอบที่ฮิต――ได้รับการแสดงให้เห็น สิ่งที่รอคอยคือการเปิดเผยเบนช์มาร์ก, การตรวจสอบภายนอก, และโปรโตคอลการประเมินที่เปิดเผยswri.org


บทความอ้างอิง

เคมี LLM ที่พัฒนาขึ้นเพื่อเร่งการค้นพบยา
ที่มา: https://phys.org/news/2025-08-chemistry-llm-faster-drug-discovery.html

Powered by Froala Editor

← กลับไปที่รายการบทความ

contact |  ข้อกำหนดการใช้งาน |  นโยบายความเป็นส่วนตัว |  นโยบายคุกกี้ |  การตั้งค่าคุกกี้

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア สงวนลิขสิทธิ์