跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Google翻译进入“读空气”时代:通过Gemini实现“言いたいこと”能够被理解的翻译

Google翻译进入“读空气”时代:通过Gemini实现“言いたいこと”能够被理解的翻译

2025年12月16日 09:07

从“翻译应用很方便”到“翻译成为对话的一部分”

在海外旅行中听不懂店员的一句话。当地讲座或导游的解释太快。或者,当翻译英语习语时,“意义”消失了,文章变成了奇怪的礼貌直译——。


翻译工具的绊脚石不在于单词或语法,而在于“语气”。因为人类之间的对话不仅仅依赖于语言本身,而是依赖于说话方式、含义和文化背景。


Google已经开始以Gemini为前锋,挑战这“最后的壁垒”。2025年12月,Google宣布在Google翻译(及搜索中的翻译功能)中引入加强语境理解的新翻译质量,并在测试版中提供“通过耳机听实时翻译”的体验。blog.google



有什么变化?——优先考虑“想表达的意思”而不是“输入的文字”

此次更新的核心是文本翻译的质变。Google的解释很明确,从“直译”转向“意图的翻译”。
例如,英语中的 “stealing my thunder”,如果只看单词就是“偷我的雷声”,但实际上更接近于“抢功劳/出其不意”。Gemini将改善对这些习语、俚语、地方表达的翻译,朝着从语境中自然翻译的方向发展。blog.google


推广将是分阶段的,首先从美国和印度开始,逐步提供英语和约20种语言(如西班牙语、印地语、中文、日语、德语等)的翻译。可在Android/iOS/网页上使用。blog.google


这种变化看似平淡,但实际上对日常生活影响很大。因为比起难懂的论文,闲聊的氛围、讽刺、简短的回应、社交媒体上的随意表达更让人困扰。如果能减少“单词是对的,但氛围不对”,翻译就能从“是否能沟通”的压力中解放出来。



耳机成为“翻译的出口”:实时语音翻译(测试版)

另一个亮点是可以通过耳机听实时翻译的功能。Google利用Gemini的语音能力,尽可能保留说话者的语气、语调、重音和节奏,将翻译语音传递出来。不仅适用于旅行中的对话,还适用于海外演讲、课程和外语节目观看。blog.google


提供形式为测试版,首先在美国、墨西哥、印度的Android上推出,支持70多种语言,并且据称“任何耳机都可以使用”(iOS和目标国家扩展计划在2026年)。blog.google


重要的是,这标志着“翻译=盯着屏幕的工作”向“翻译=通过耳朵接收的体验”的转变。虽然在屏幕上显示字幕也很方便,但会分散注意力。通过耳朵聆听,可以保持对话的节奏和移动中的体验不断。翻译不再是“行为”,而是“层次”。



翻译应用也向“学习应用”靠拢

此外,Google还将扩展翻译应用内的学习功能。改进对口语练习的反馈,引入类似于“连续天数(streak)”的学习持续机制,并扩大练习功能的提供国家。blog.google


翻译本是为了“立即获得意义”的工具,但随着学习功能的扩展,它可以连接到“下次希望不用翻译就能说出来”。Google翻译正在从工具向“日常伴侣”扩展其定位。Digital Trends



在SNS(主要是Reddit)上看到的反应:期待与不安并存

这次的话题确实充满了“未来科技感”。因此,SNS上的反应也更多是“有条件的期待”而不是不加保留的称赞。


1) “旅行会更轻松”类:最直观的欢迎

在r/technology的评论区,有人直接表达了对实用性的期待。

“这对旅行可能真的很有用。” Reddit
同样地,对于“经常出行的人”“留学、出差”的背景下,耳机翻译的价值是直观的。比字幕更自然的方向也很容易被接受。


2) “现实中的噪音问题”类:安静的演示与嘈杂的现场不同

另一方面,“现场很吵”问题是一个常见的吐槽点。

“你可能需要在一个安静的房间里才能让它工作。” Reddit
噪音、多位说话者、口音、语速。如果这些问题无法解决,使用场景将受到限制。翻译进入耳朵的程度越高,误译的影响也越大。


3) “误译不可笑”类:便利背后的隐忧

同一线程中也分享了误译经历,看似笑话实则切中要害。

“AI经常会提供错误的翻译。” Reddit
实时返回“看似正确的翻译”时,用户往往不再怀疑其正确性。在医疗、法律、商业场景中,这并不是开玩笑的事情。


4) 对“巨头企业掌握翻译”的警惕:便利≠中立

更深入的担忧也存在。

“翻译是由一家跨国公司提供和策划的。” Reddit
翻译不仅涉及语言的意义,还涉及“解释”。也就是说,谁的价值观来解释是个问题。便利性增加的同时,翻译成为社会基础设施,偏见、审查和信息操控的讨论也不可避免。


5) 对“像科幻小说一样”的兴奋与冷嘲热讽的模因

在另一个线程中,也有对发布本身的吐槽和模因化。例如在r/artificial中,有人将帖子链接作为玩笑,或者用笑话表达翻译的不自然。Reddit


新功能在融入生活之前,首先在SNS上被“调侃”是科技的通行仪式。



最终,最大的变化是什么

这次Google翻译的更新看起来不像是功能的增加,而是“改变翻译的前提”。

  • 文本从“直译→意图”(习语和俚语是主战场)blog.google

  • 语音从“屏幕→耳朵”(保护对话和观看体验的连续性)TechCrunch

  • 应用从“翻译→学习”(将持续性设计融入其中)blog.google


当然,现场的噪音、误译,以及“谁掌握翻译的解释权”这些问题依然存在。SNS上的反应在期待和不安之间摇摆,因为每个人都直观地感受到这种“力量”。


翻译越智能,我们就越不得不意识到“翻译的主体”而不是“翻译的词语”。便利的未来已经开始。因此,使用方式和距离感将成为下一个主题。



参考文章

Google翻译终于不仅理解您输入的内容,还理解您的意图。
来源: https://www.digitaltrends.com/phones/google-translate-finally-understands-what-you-meant-not-just-what-you-typed/

由 Froala Editor

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.