跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

《Meta收购声音的那一天》——通过收购PlayAI加速的“超音频”霸权竞赛

《Meta收购声音的那一天》——通过收购PlayAI加速的“超音频”霸权竞赛

2025年07月14日 01:56

1. 收购快讯与基本信息

2025年7月12日下午,通过Bloomberg传出“Meta完成收购PlayAI”的新闻。NDTV Profit确认的内部备忘录中写道,“PlayAI团队全员将在下周加入Meta,推动语音技术在Meta AI角色、可穿戴设备和语音创作中的应用。”NDTV Profit


PlayAI成立于2016年。由WhatsApp出身的工程师哈马德·赛义德等人开发的语音合成模型“PlayDialog”能够从几秒钟的样本中复制声色,并在40多种语言中生成富有情感的对话。其融资总额据报道为2100万美元。WinBuzzer


2. 收购价格——“4500万美元”的意义

Winbuzzer报道“以约4500万美元(约70亿日元)达成协议”。在生成AI企业估值不断飙升的背景下,作为获得59名人才和技术的价格,许多风险投资公司认为这是“便宜的”。尤其是Meta今年已经投入143亿美元收购了Scale AI 49%的股份,因此也有观点认为这是“小规模收购以分散风险”。WinBuzzer


3. Meta的“声音”路线图——为何此时选择PlayAI

Meta在今年4月推出了搭载Llama 4的“Meta AI”应用程序,并实验性地引入了独特的语音模式。然而,目前的TTS(文本转语音)依赖于通用模型。通过收购PlayAI,Meta计划(1)实现实时通话模式的低延迟化,(2)实现Ray-Ban Meta智能眼镜的全双工语音,(3)推出AI角色的“推声”付费模式。Livemint也分析称这是“同时推动可穿戴设备和语音创作的策略”。mint


4. 社交媒体的反应——支持、反对、玩笑与深度解读

收购宣布后的48小时内,X(前Twitter)、Threads和LinkedIn上充满了三种声音。


温度感代表性帖子(节译)趋势
热情“Ray-Ban将成为翻译和DJ的未来来了!”创作者和AR界
冷嘲“不能创造就买,这是Meta的风格。能整合吗?”LinkedIn工程师群体
担忧“声音克隆只会加速诈骗?”安全研究员


LinkedIn的Voice-AI专家社区中,“Voice AI is having a moment”的帖子在一周内获得了130多个反应,显示出“声音×生成AI的黄金时代到来”的强烈欢迎氛围。LinkedIn


5. 竞争状况——“声音四天王”与Meta的定位

到2025年中,语音AI市场被认为由(1) Amazon Alexa+生成功能、(2) Google Assistant with Bard、(3) Microsoft Copilot Voice、(4) OpenAI ChatGPT Voice组成的“四天王”主导。根据TS2.tech的预测,这一市场到2034年将达到475亿美元,各公司都在争夺如何以自然/多语言/低成本的方式提供其自有模型的“声音”。TS2 Space


在这其中,Meta拥有“社交网络+即时通讯+AR眼镜”这一“无需设备也能始终与用户连接的平台”。通过整合PlayAI,如果能够通过眼镜实现“个人会议翻译”或“耳边学习”,则有可能迅速实现差异化。


6. 人才战争的前沿

在收购后的组织架构中,PlayAI团队将直接隶属于语音搜索专家约翰·沙尔克维克,并与Scale AI创始人亚历山大·王领导的“Meta Superintelligence Labs”进行横向合作。据报道,Meta在6月底从OpenAI挖走了8名研究人员,AI人才争夺战愈演愈烈。WinBuzzerTS2 Space


7. 技术整合的挑战

PlayAI的优势在于“低于数百毫秒的低延迟流媒体TTS”和“高精度语音克隆”,但Meta的各产品在基础设施和API规范上各不相同。过去Instagram的“Threads”因TensorRT优化延迟而推迟语音功能的前例也存在,因此整合面临

  1. 如何实现设备上的NN推理

  2. 遵循隐私法规(如EU AI Act等)

  3. 模型训练数据的版权问题
    这三大障碍。


8. 伦理与监管——“声音克隆”的风险

音频诈骗受害者增加了350%的数据也存在。在只需录音10秒即可生成账户转账指令的时代,Meta如何保证“声音的真实性”。可能的对策包括

  • 克隆使用时的明确标签显示

  • 在音频文件中嵌入水印的“音频水印”

  • 仅本人知道的“声纹密钥”双向认证
    等正在讨论中。


9. 商业模式的扩展

据传Meta正在计划“创作者语音市场”。创作者可以注册自己的语音模型,用户可以为AI角色更换“推声”并付费。由于PlayAI的API可以调整“情感参数”,ASMR、戏剧CD、广告旁白的生成也可以一站式完成。


10. 未来的场景和关注点

  • 2025年Q3:Ray-Ban Meta眼镜将搭载预发布版“Meta Voice Beta”

  • 2026年初:WhatsApp将实现带有实时翻译的“语音聊天”

  • 2026年末:Meta AI角色将提供用户自身声音的“自我声音”功能?


竞争对手Amazon通过Alexa+付费版(月19.99美元)进行盈利,而Meta可能会继续通过将“声音”叠加在社交网络广告模式上提供免费服务。价格、隐私和质量的三角关系中用户将如何选择,值得关注。



参考文章

Meta收购语音AI初创公司PlayAI,继续加强人才
来源: https://www.ndtvprofit.com/business/meta-acquires-voice-ai-startup-playai-continuing-to-add-talent

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.