ข้ามไปที่เนื้อหาหลัก
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア โลโก้
  • บทความทั้งหมด
  • 🗒️ สมัครสมาชิก
  • 🔑 เข้าสู่ระบบ
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • हिंदी
cookie_banner_title

cookie_banner_message นโยบายความเป็นส่วนตัว cookie_banner_and นโยบายคุกกี้ cookie_banner_more_info

การตั้งค่าคุกกี้

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

อาลีบาบาเปิดทางสู่อนาคตการเขียนโค้ดด้วย AI! เปิดตัวโมเดลโอเพ่นซอร์สล้ำสมัย

อาลีบาบาเปิดทางสู่อนาคตการเขียนโค้ดด้วย AI! เปิดตัวโมเดลโอเพ่นซอร์สล้ำสมัย

2025年07月24日 01:40

1. พื้นหลังและเป้าหมายของการประกาศ

เมื่อวันที่ 23 กรกฎาคม ตามเวลาประเทศจีน Alibaba ได้เปิดตัวเวอร์ชันพิเศษของ AI สร้างสรรค์ "Qwen3" สำหรับการเขียนโค้ด Qwen3‑Coder ภายใต้ใบอนุญาต Apache 2.0 ตามคำแถลง โมเดลนี้มีขนาดพารามิเตอร์ 8 ประเภท ตั้งแต่ 0.6B ถึง 235B และมีความแข็งแกร่งโดยเฉพาะใน "งาน AI แบบเอเจนต์"Investing.com


"LLM ที่เหมาะสมกับเอเจนต์" เหล่านี้จำเป็นต้องหมุนเวียนกระบวนการอัตโนมัติเช่นการแบ่งงาน การเรียกเครื่องมือ และการตรวจสอบตนเองอย่างรวดเร็ว Alibaba เน้นว่ามันสามารถ "ไม่เพียงแค่สร้าง แต่ยังสามารถทำงานให้เสร็จสิ้นได้" โดยมุ่งหวังผลประโยชน์ร่วมกับธุรกิจคลาวด์


2. ผลลัพธ์ของเบนช์มาร์กและคุณสมบัติทางเทคนิค

คะแนนที่เปิดเผยแสดงว่า DeepSeek‑Coder และ Moonshot K2 ถูกแซงในทุกหมวดหมู่ และบางส่วนเทียบเท่ากับ OpenAI GPT-4 และ Anthropic Claude2 — ด้วยตัวเลขที่โดดเด่นReuters


ในด้านเทคนิค

  • มีสถาปัตยกรรมทั้ง Mixture-of-Experts (MoE) และ Dense

  • โค้ดคอร์ปัสล่าสุด + RLHF ขนาดใหญ่บนคลาวด์ของบริษัท

  • บริบทข้อความยาว 8-32k โทเค็น
    เป็นจุดเด่น โดยเฉพาะอย่างยิ่งโมเดล 30B ของ MoE ที่มีการโฆษณาว่า "ประหยัดหน่วยความจำและรวดเร็ว" และสามารถทำงานในสภาพแวดล้อม GPU ท้องถิ่นได้ ซึ่งกระตุ้นชุมชน OSS


3. ปฏิกิริยาของชุมชน SNS และนักพัฒนา

GitHub

มีคำขอเช่น "ความแม่นยำในการเติมเต็มภาษาระบบเพิ่มขึ้นด้วย Qwen3‑Coder" และ "ต้องการการตั้งค่างบประมาณความคิด" ที่หลั่งไหลเข้ามาใน issueGitHub


Hacker News

  • "ทำการเรียกเครื่องมือได้อย่างสมบูรณ์แบบ ผลลัพธ์แรกใน 7 นาทีบน mac Studio"Hacker News

  • ในทางกลับกัน มีเสียงที่สงสัยว่า "ติดอยู่ในลูปเมื่อใช้พรอมต์ยาว"Hacker News

  • มีผู้ที่ระมัดระวังว่า "ถ้าทำงานบน Runpod ได้ อาจเป็นทางเลือกที่มีต้นทุนต่ำ แต่ยังคงมีความสงสัยในความเป็นไปได้"Hacker News


Stocktwits

ในกระดานข้อความของหุ้น BABA มีความคิดเห็นที่มั่นใจว่า "การสร้างความแตกต่างในธุรกิจคลาวด์กำลังดำเนินไป" โดยมีความรู้สึกที่ไม่เปลี่ยนแปลงจากสัปดาห์ก่อนว่า "Bullish"Investing.com India


4. สภาพแวดล้อมการแข่งขัน: การเปิดโอเพ่นซอร์สของ Baidu ERNIE และคู่แข่งในสหรัฐฯ

เพียงไม่กี่สัปดาห์ก่อน Baidu ได้เปิดบางส่วนของ ERNIE 4.5 ซึ่งยกระดับการแข่งขัน AI ในจีนขึ้นไปอีกขั้นInvesting.com
ในสหรัฐฯ OpenAI กำลังเตรียม CodeGPT และ Anthropic กำลังเตรียม Claude-3.5 ซึ่ง "การเปิดโอเพ่นซอร์สแบบสองขั้วระหว่างตะวันออกและตะวันตก" กำลังเร่งตัวขึ้น กองทุนการลงทุนในฮ่องกงคาดการณ์ว่า "ตลาด LLM สำหรับการพัฒนาซอฟต์แวร์จะมีขนาด 35 พันล้านดอลลาร์ในปี 2028"


5. ผลกระทบทางธุรกิจ

Alibaba ได้นำโมเดลไฮบริด "OSS + คลาวด์ API ที่มีค่าใช้จ่าย" มาใช้ตั้งแต่ต้น และในครั้งนี้ก็ได้เปิดตัวจุดสิ้นสุดเชิงพาณิชย์ผ่าน DashScope พร้อมกัน การแพร่กระจายบน GitHub/HN → PoC ของบริษัท → การคิดค่าบริการคลาวด์ตามการใช้งาน เป็นเส้นโค้งการเติบโตที่ได้รับการสนับสนุนจากตัวอย่างก่อนหน้าของ AWS และ Azure แผนกคลาวด์ของบริษัทภายใต้การนำของ Zhang Yong ที่กลับมา มุ่งหวังที่จะเติบโตอีกครั้ง และ Qwen3‑Coder ถูกวางตำแหน่งเป็นผลิตภัณฑ์เรือธง


6. มุมมองของนักพัฒนา: การใช้งานและความท้าทาย

หัวข้อจุดสำคัญข้อควรระวัง
การทำงานในท้องถิ่นมีรายงานหลายฉบับว่า 8B หรือน้อยกว่าสามารถทำงานได้ใน RTX 4090 ด้วย VRAM 24 GBควรตรวจสอบเวอร์ชันที่รองรับ Flash-Attn
การสร้างเอเจนต์การเรียกเครื่องมืออัตโนมัติมีความแม่นยำสูงการตั้งค่า max_steps เป็นสิ่งจำเป็นเพื่อหลีกเลี่ยง "ลูปความคิด"
การใช้งานเชิงพาณิชย์ไม่มีค่าลิขสิทธิ์ภายใต้ Apache 2.0การใช้เครื่องหมายการค้าและโลโก้ต้องเป็นไปตามข้อกำหนดของ Alibaba


7. แนวโน้มในอนาคต

  1. การกลั่นร่วมกันระหว่าง OSS
    คาดว่าจะมีการเคลื่อนไหวเพื่อย่อขนาดและเพิ่มประสิทธิภาพผ่าน "การกลั่นร่วมกัน" กับ DeepSeek‑Coder และ Gemma3

  2. ทิศทางของกฎระเบียบระหว่างประเทศ
    หากข้อจำกัดในการจัดหาของ GPU และ H100 ยังคงดำเนินต่อไปท่ามกลางกฎระเบียบการส่งออกของจีนและกฎ BIS ของสหรัฐฯ การแข่งขัน "ประหยัดหน่วยความจำ" ของ MoE จะเร่งตัวขึ้น

  3. การขยายเศรษฐกิจนักพัฒนา
    ระบบนิเวศของปลั๊กอินและเครื่องมือที่เน้น OSS LLM จะเติบโตเต็มที่ และ Alibaba มุ่งหวังที่จะสร้างแพลตฟอร์มที่ใหญ่ที่สุดตั้งแต่โปรแกรมย่อย Alipay


8. สรุป

Qwen3‑Coder ไม่ใช่เพียงแค่ "Code-GPT เวอร์ชันจีน" แต่เป็นตัวชี้วัดการมาถึงของยุคเอเจนต์ ในขณะที่ชุมชน OSS ยังคงตรวจสอบประสิทธิภาพ มันมีโอกาสสูงที่จะเป็น "เกมเชนเจอร์" ที่กระตุ้นให้คู่แข่งดำเนินการขั้นต่อไป



บทความอ้างอิง

Alibaba เปิดตัวโมเดล AI สำหรับการเขียนโค้ดแบบโอเพ่นซอร์ส ซึ่งได้รับการยกย่องว่าเป็นโมเดลที่ก้าวหน้าที่สุดจนถึงปัจจุบัน
ที่มา: https://www.investing.com/news/stock-market-news/alibaba-launches-opensource-ai-coding-model-touted-as-its-most-advanced-to-date-4147128

← กลับไปที่รายการบทความ

contact |  ข้อกำหนดการใช้งาน |  นโยบายความเป็นส่วนตัว |  นโยบายคุกกี้ |  การตั้งค่าคุกกี้

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア สงวนลิขสิทธิ์