未来的办公室并不安静?语音输入AI改变工作方式

未来的办公室并不安静?语音输入AI改变工作方式

键盘的声音消失,办公室里“耳语声”增多的日子

曾几何时,办公室的声音就是键盘的敲击声。

从会议室传出的声音,Slack通知的小电子音,打印机的运作声,有人放下马克杯的声音。在这些声音中,最能象征工作的感觉的,还是打字声。手指停止时是在思考,猛烈敲击时是在集中注意力,按下回车键时,有东西被发送出去。这种身体感受与工作的节奏长期以来是紧密相连的。

然而,在AI时代的办公室中,这种声音景观可能会发生变化。

TechCrunch报道的是,“对着电脑说话的人们”将会增多的未来。起因是AI语音输入应用的普及。使用像Wispr Flow这样的工具,人们可以不再敲键盘,而是直接小声说出自己的想法,应用程序会将其转换为整齐的文章或提示。如果再与Claude Code或Codex这样的编码辅助工具结合使用,开发者可以不再逐字编写代码,而是通过语音指示“实现这样的功能”“查找这个bug的原因”“按照这个规格进行修改”。

也就是说,在未来的办公室里,人们即使没有在开会也在说话。即使没有在打电话,也在对着麦克风说话。看似自言自语的声音,其实是对AI的工作指示。

这不仅仅是输入方法的变化,而是对工作空间规则的震动。

TechCrunch的文章中引用了《华尔街日报》的专题,介绍了硅谷周边语音输入工具使用的扩展情况。一位风险投资家表示,访问初创公司的办公室时,感觉像进入了高档呼叫中心。Gusto的联合创始人Edward Kim也表示,未来的办公室可能会像销售楼层一样充满声音。

这种“销售楼层化”的表述相当具有象征意义。

销售楼层是声音成为工作中心的地方。打电话、解释、说服、在听取对方反应的同时调整语言。传统的工程、写作、企划工作则相对被认为是安静的作业。然而,随着与AI的协作推进,程序员、编辑、市场人员、设计师可能也会像销售人员一样“通过说话来推进工作”。

为什么人们会特意想用语音输入呢?

最大的原因是,能够更容易地输出思考的内容。即使向AI发出简短的命令,也难以获得好的结果。要善用生成AI,需要详细传达背景、目的、限制、偏好、想避免的事情、期望的输出格式等。然而,全部用键盘输入这些内容是麻烦的。特别是反复书写数百字到数千字的提示,即使对打字快的人来说也是负担。

语音输入可以一次性吐露脑中的模糊想法。即使有些口误,AI也会整理。即使以口语形式说话,工具也会将其整形成商务邮件风格、规格书风格、聊天回复风格。使用AI的输入成本降低了。

在SNS和开发者社区中,也有很多人对这一点表示赞赏。在Reddit的一些帖子中,关于Wispr Flow这样的语音输入工具,有“更容易向AI传达长的语境”“邮件和草稿的制作速度加快”“可以在任何应用中使用的系统级语音输入很方便”等反应。特别是在被称为vibe coding的AI支持型开发风格中,与其直接编写细节代码,向AI传达长的意图更为重要,因此与语音的相性很好。

另一方面,反应并不全是称赞。

相反,这个主题有趣的地方在于,技术上虽然方便,但在社会上却相当尴尬。

在TechCrunch的文章中,AI企业家Mollie Amkraut Mueller提到,当她晚上与丈夫并肩工作时,对着电脑小声说话的习惯让对方感到烦躁。结果,夫妻俩开始在不同的地方工作。这是家庭内的事情,但在办公室也可能发生同样的问题。

邻座的人一直在小声说些什么。以为是在打电话,却没有与任何人对话。不知道是在对自己说话还是在对AI说话。内容断断续续地传来,影响了集中力。听到了似乎是机密信息的词语。原本应该是安静的工作空间,总是漂浮着低声的喧哗。

这不仅仅是简单的噪音问题。人声比键盘声更容易引起注意。因为它有语言的意义。具有意义的声音,脑子会自动捕捉。就像在能听到周围对话的咖啡馆里难以工作一样,邻座的“对AI的耳语”,可能比本人想象的更能夺走周围的集中力。

在SNS上的反应中,这种担忧也有所体现。

在Reddit上,有关于语音输入工具的帖子表示“感觉是为一个人在安静的办公室里使用而设计的”“在有孩子或噪音的现实环境中仍然困难”。另有用户指出,虽然语音输入本身是高效的,但对标点符号、语法、Microsoft Teams等特定应用上的行为感到不满。此外,在面向开发者的社区中,语音输入并不是替代所有编码,而是适合特定任务或长说明的冷静看法。

在LinkedIn上也有帖子表示,虽然语音输入可以节省时间,但在办公室中会让周围的人误以为是在对自己说话,因此会移到别的房间使用。这是非常现实的反应。即使工具的性能提高,人际距离感和职场礼仪也不会自动优化。

这里需要问的是,“对AI说话的权利”和“安静工作的权利”的平衡。

开放式办公室本来就被批评不适合集中注意力。视线、闲聊、通知、会议的声音。现在,又加入了AI语音输入这种新声音。如果企业认真接受这种变化,就不能仅仅因为“方便所以使用”而了事。需要重新审视办公室的设计、座位的安排、单间隔间、麦克风的使用规则、机密信息的处理、工作中的音量礼仪等。

例如,未来的办公室可能不仅需要“通话隔间”,还需要“AI输入隔间”。现在已经有越来越多的企业为在线会议设置单间隔间,如果语音AI普及,非会议的日常工作也需要发声空间。或者,降噪麦克风、骨传导麦克风、指向性麦克风、可穿戴设备可能成为标准装备。像键盘和鼠标一样,“个人专用的麦克风环境”可能成为工作工具。

不过,语音输入并不适合所有人。

首先,有些人擅长边说边思考,而有些人擅长边写边思考。写文章的人会明白,打字不仅仅是输入作业。文字出现在屏幕上的过程本身就是思考的整理。边写边察觉到不对劲,删除、重新排列、改写。这个反馈循环与一次性说出大量内容的语音输入不同。

实际上,在SNS上也有指摘指出,语音输入在发言后才看到结果,难以实时修正自己的想法。这是一个重要的论点。语音输入虽然快,但速度并不总是与质量挂钩。反而可能在思考之前就将大量语言抛给AI,之后整理需要花费时间。

其次,是隐私和安全问题。

在职场中出声意味着内容可能被周围人听到。客户信息、公司未公开信息、合同条件、人事信息、代号、战略资料。在将这些输入AI时,如果是键盘,至少需要看屏幕才能知道,但如果是语音,附近的人可能会听到。此外,使用云端语音输入时,音频数据在哪里处理,是否符合企业的安全政策也是问题。

第三,在可访问性方面有很大的潜力。对于手或手臂有负担的人、长时间打字困难的人、想在移动中记笔记的人来说,语音输入可能成为强大的辅助技术。因此,不能仅仅将语音输入视为“新的小工具爱好者的生产力黑客”。它也是增加工作方式选择的技术。

那么,语音输入AI真的会成为办公室的主流吗?

目前来看,可能还处于过渡期。性能在迅速提高,但社会习惯尚未跟上。智能手机在刚出现时,人们在公共场合一直盯着屏幕的行为显得不自然。用无线耳机像自言自语一样通话的样子,最初也很奇怪。现在,许多人已经接受。Wispr的创始人认为“最终会变得普通”也是基于这种延续性。

不过,智能手机、耳机与语音输入AI之间存在差异。智能手机主要夺走了视线,而语音输入则占据了空间。耳机通话可以知道对方是人,但对AI的耳语从周围看意图不明。难以判断是在与某人对话、还是自言自语、还是在谈论机密信息。这种模糊性导致了职场的不适感。

从这个意义上说,今后需要的是“AI语音输入礼仪”。

例如,在办公室内通常不在桌子上长时间进行语音输入。长文提示或编码指示在专用隔间进行。不以周围能听到的音量谈论客户名或公司机密。使用麦克风或耳机,尽量在小声的环境中进行。团队内决定何时可以使用语音输入,何时应避免。这些规则可能在不久的将来成为许多企业的必要措施。

有趣的是,这种变化似乎将“人性”带回工作中,但实际上可能减少人与人之间的对话。

人们不再向旁边的同事咨询,而是小声向AI咨询。不再在白板前讨论,而是各自对着自己的屏幕说话。办公室里声音增多,但这不一定是人与人之间的沟通。相反,可能是每个人都在与自己的AI助手进行封闭的对话。

热闹却孤独的办公室。

这就是语音AI时代奇妙的职场景象。

对企业来说,挑战不是禁止这项技术。或许,即使禁止,扩散的东西还是会扩散。就像AI工具一样,便利的东西会从现场渗透。重要的是设计在哪里、如何、为了什么使用。

语音输入可能加快文章创作、编码、创意产生、邮件回复、会议记录制作、研究笔记等许多工作的速度。特别是在向生成AI传达长语境的工作中,语音比键盘更自然的场合也有。但如果这会夺走周围的集中力,或提高信息泄露的风险,那么在生产力提高的背后会产生其他成本。

在键盘时代,输入更接近于个人身体内部的工作。在语音时代,输入扩展到空间。因此,必须同时考虑个人的效率和集体的舒适。

未来的办公室,真的会被耳语声填满吗?

答案可能是“在某些方面会如此”。并不是所有人整天都在对AI说话。但是,在写邮件、传达代码方针、制作企划草案、整理会议后的笔记时,人们使用语音而不是键盘的场合肯定会增加。

那时,我们是否已准备好接受新的职场声音?

键盘的滴答声作为工作的象征的时代正在结束。接下来听到的,可能是有人对着AI发出的轻声耳语。

而这种声音既是便利的声音,也是未来职场必须解决的新摩擦的声音。

SNS・社区反应要点

 

根据公开搜索确认的范围,反应大致分为三类。

首先,肯定派认为,语音输入使得对AI的指示更长、更具体,提高了邮件或草稿的制作效率以及vibe coding的效率。特别是“可以在任何应用中使用”“容易向AI传达语境”这一点受到支持。

其次,谨慎派认为,语音输入并非万能,适合长说明或草稿,但在细微修正或准确代码编写方面,键盘更好。标点符号、应用行为、快捷键冲突、麦克风质量等实用问题也被指出。

最后,否定・担忧派关注在职场或家庭中对周围造成困扰的问题。虽然在安静的地方容易使用,但在噪音、孩子、同事、会议多的环境中实际上难以使用。也就是说,不仅是技术的完成度,使用环境本身也是普及的障碍。


出处URL

TechCrunch的文章。介绍了Wispr等语音输入应用的扩展,以及办公室可能充满“耳语声”的可能性。
https://techcrunch.com/2026/05/10/get-ready-for-the-whisper-filled-office-of-the-future/

《华尔街日报》的文章。专题报道AI语音输入工具对职场和家庭礼仪、噪音、工作方式的影响。
https://www.wsj.com/tech/typing-is-being-replaced-by-whisperingand-its-way-more-annoying-a804fee7

LinkedIn News的文章。补充信息关于AI语音输入正在改变办公室环境和职场礼仪的论点。
https://www.linkedin.com/news/story/ai-dictation-tools-are-testing-workplace-etiquette-7249316/

Reddit的帖子。使用Wispr Flow的用户表示,在安静环境中很方便,但在有噪音或生活音的现实环境中存在问题。
https://www.reddit.com/r/ProductivityApps/comments/1om7ncn/tried_wispr_flow_for_a_week_its_a_great_idea_but/

Reddit的帖子。开发者讨论使用语音输入工具进行vibe coding或对AI发出指示的反应。
##HTML_TAG_