跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

阿里巴巴引领AI编程的未来!发布最先进的开源模型

阿里巴巴引领AI编程的未来!发布最先进的开源模型

2025年07月24日 01:36

1. 发布背景和目标

北京时间7月23日,阿里巴巴发布了生成AI系列“Qwen3”的编码专用版Qwen3‑Coder,并以Apache 2.0许可证公开。据声明称,该模型提供了从0.6B到235B的8种参数规模,特别在“代理型AI任务”上具有优势。Investing.com


这些“代理适应型LLM”需要快速进行任务分割、工具调用和自我验证等自主过程。阿里巴巴强调“不仅能生成内容,还能完成工作流程”,并瞄准与云业务的协同效应。


2. 基准测试结果和技术特征

在公开的评分中,DeepSeek‑Coder和Moonshot K2在所有项目上被超越,部分与OpenAI GPT‑4和Anthropic Claude2相当——呈现出华丽的数字。Reuters


在技术方面

  • 提供了Mixture‑of‑Experts (MoE) 和Dense两种架构

  • 最新代码语料库+自家云上的大规模RLHF

  • 长文本上下文8‑32k标记
    是关键。尤其是MoE版的30B模型以“省内存且高速”为卖点,能够在本地GPU环境中运行,激发了OSS社区的兴趣。


3. 社交媒体和开发者社区的反应

GitHub

“Qwen3‑Coder提高了系统语言的补全精度”“希望能设置思维预算”等需求在issue中蜂拥而至。GitHub


Hacker News

  • “完美执行了工具调用。在mac Studio上7分钟内完成初次输出”Hacker News

  • 另一方面,“在长提示下陷入循环”的怀疑声音也存在。Hacker News

  • “如果能在Runpod上运行,可能成为低成本替代,但实用性尚不明确”的谨慎派也存在。Hacker News


Stocktwits

在BABA股票论坛上,“云业务的差异化正在推进”的乐观评论占据主导,情绪与上周相比保持不变,为“看涨”。Investing.com India


4. 竞争环境:百度ERNIE的开源化与美国势力

仅在几周前,百度开放了ERNIE 4.5的一部分,进一步提升了中国AI竞争。Investing.com
在美国,OpenAI正在准备CodeGPT,Anthropic正在准备Claude‑3.5,“东西方两极的OSS化多米诺”正在加速。香港的一家投资基金预测,“面向软件开发的LLM市场到2028年将达到350亿美元规模”。


5. 商业影响

阿里巴巴从早期就采取了“OSS+云付费API”的混合模式,这次也同时发布了通过DashScope的商业端点。GitHub/HN的传播→企业PoC→云按量付费的增长曲线,有AWS和Azure的先例支持。该公司云部门在“归来者”张勇的指挥下,旨在重新增长,Qwen3‑Coder被定位为旗舰产品。


6. 开发者视角:使用场景和挑战

标题要点注意事项
本地执行有众多报告称8B以下可以在RTX 4090的24 GB显存中运行需确认推荐的Flash‑Attn兼容版本
代理构建自动工具调用精度高避免“思维循环”需要设置max_steps
商业使用Apache 2.0无需支付版税商标和标志使用需遵循阿里巴巴规定


7. 未来展望

  1. OSS之间的相互蒸馏
    预计通过与DeepSeek‑Coder和Gemma3的“交叉蒸馏”将推动小型化和性能提升的活动。

  2. 国际监管的走向
    在中国出口管制和美国BIS规则之间,如果GPU和H100级别的供应限制持续,MoE型的“省内存竞争”将加速。

  3. 开发者经济圈的扩展
    以OSS LLM为中心的插件和工具生态系统将成熟,阿里巴巴计划自Alipay小程序以来再次构建平台。


8. 总结

Qwen3‑Coder不仅仅是“中国版Code‑GPT”,而是标志着代理时代的到来。在OSS社区继续进行性能验证的过程中,其真正价值将被衡量,并可能成为引发竞争对手下一步行动的“游戏改变者”。



参考文章

阿里巴巴发布开源AI编码模型,被誉为迄今为止最先进的
来源: https://www.investing.com/news/stock-market-news/alibaba-launches-opensource-ai-coding-model-touted-as-its-most-advanced-to-date-4147128

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.