¿Las oficinas del futuro no serán silenciosas? Cómo la IA de entrada de voz está cambiando la forma de trabajar

¿Las oficinas del futuro no serán silenciosas? Cómo la IA de entrada de voz está cambiando la forma de trabajar

El sonido del teclado se desvanece y aumentan los "susurros" en la oficina

En el pasado, el sonido de la oficina se caracterizaba por el tecleo del teclado.

Las voces que se filtraban de la sala de reuniones, el pequeño sonido electrónico de las notificaciones de Slack, el sonido de la impresora en funcionamiento, el sonido de alguien colocando una taza. Entre todos ellos, lo que más simbolizaba la sensación de estar trabajando era, sin duda, el tecleo. Si los dedos se detenían, significaba que se estaba pensando. Si se tecleaba intensamente, era señal de concentración. Al presionar la tecla Enter, algo se enviaba. Esa sensación corporal y el ritmo del trabajo estuvieron vinculados durante mucho tiempo.

Sin embargo, en la oficina de la era de la IA, ese paisaje sonoro podría cambiar.

TechCrunch destacó un futuro en el que aumentará el número de personas que "hablan con sus computadoras". El detonante es la proliferación de aplicaciones de entrada de voz con IA. Con herramientas como Wispr Flow, las personas pueden hablar en voz baja lo que están pensando en lugar de teclear, y la aplicación lo convierte en un texto coherente o en un prompt. Además, al combinarlo con herramientas de apoyo a la codificación como Claude Code o Codex, los desarrolladores pueden dar instrucciones verbales como "implementa esta función", "busca la causa de este error", o "corrige esto según las especificaciones", en lugar de escribir el código letra por letra.

Es decir, en la oficina del futuro, las personas hablan aunque no estén en una reunión. Hablan al micrófono aunque no estén haciendo una llamada telefónica. Las voces que parecen monólogos son en realidad instrucciones de trabajo para la IA.

Esto no es solo un cambio en el método de entrada, sino un cambio que sacude las reglas del espacio de trabajo.

El artículo de TechCrunch, citando un especial del Wall Street Journal, describe cómo el uso de herramientas de entrada de voz se está extendiendo en Silicon Valley. Un capitalista de riesgo comentó que al visitar las oficinas de startups, se siente como entrar en un centro de llamadas de lujo. Edward Kim, cofundador de Gusto, también mencionó que las oficinas del futuro podrían sonar como un piso de ventas.

La expresión "piso de ventas" es bastante simbólica.

El piso de ventas es un lugar donde la voz es el centro del trabajo. Se hacen llamadas, se explican cosas, se persuade, y se ajustan las palabras mientras se escucha la reacción del interlocutor. En contraste, las tareas de ingeniería, redacción y planificación se han considerado tradicionalmente como trabajos relativamente silenciosos. Sin embargo, a medida que avanza la colaboración con la IA, es posible que los programadores, editores, mercadólogos y diseñadores trabajen "hablando" como lo hacen los vendedores.

¿Por qué las personas querrían ingresar datos con la voz?

La razón principal es que es más fácil expresar la cantidad de pensamiento tal cual. Dar instrucciones breves a la IA no suele producir buenos resultados. Para utilizar eficazmente la IA generativa, es necesario comunicar detalles como el contexto, el propósito, las restricciones, las preferencias, lo que se desea evitar y el formato de salida esperado. Sin embargo, ingresar todo eso con el teclado es tedioso. Especialmente, escribir repetidamente prompts de cientos a miles de caracteres es una carga incluso para quienes escriben rápido.

Con la entrada de voz, se puede expresar rápidamente un pensamiento vago. Aunque se cometan errores al hablar, la IA lo ajusta. Incluso si se habla de manera coloquial, la herramienta lo formatea como un correo electrónico de negocios, un documento técnico o una respuesta de chat. El costo de entrada para dominar la IA se reduce.

En las redes sociales y comunidades de desarrolladores, hay muchas voces que valoran este punto. En algunas publicaciones de Reddit, se observan reacciones como "es más fácil proporcionar un contexto largo a la IA", "se acelera la creación de correos y borradores", y "es conveniente tener una entrada de voz a nivel de sistema que se pueda usar en cualquier aplicación" en relación con herramientas de entrada de voz como Wispr Flow. Especialmente en el estilo de desarrollo asistido por IA llamado vibe coding, es más importante comunicar intenciones largas a la IA que escribir directamente el código detallado, por lo que la voz tiene buena compatibilidad.

Sin embargo, las reacciones no son solo de elogio.

Más bien, lo interesante de este tema es que, aunque técnicamente es conveniente, socialmente puede ser bastante incómodo.

El artículo de TechCrunch también menciona un ejemplo en el que Mollie Amkraut Mueller, emprendedora de IA, irritó a su pareja al hablar en voz baja con su computadora mientras trabajaban juntos por la noche. Como resultado, la pareja decidió trabajar en lugares separados. Aunque esto es un caso doméstico, el mismo problema podría ocurrir en la oficina.

La persona en el asiento de al lado está hablando en voz baja todo el tiempo. Parece que está en una llamada, pero no está hablando con nadie. No se sabe si está hablando contigo o con la IA. Se escuchan fragmentos de la conversación, lo que distrae la concentración. Se oyen palabras que parecen ser información confidencial. En un lugar que se suponía era un espacio de trabajo silencioso, siempre flota un murmullo de voces bajas.

Esto no es simplemente un problema de ruido. La voz humana atrae más atención que el sonido del teclado. Esto se debe a que tiene significado como palabras. Los sonidos con significado son captados automáticamente por el cerebro. Al igual que es difícil trabajar en una cafetería donde se oyen las conversaciones de los demás, los "susurros a la IA" del asiento de al lado pueden distraer más de lo que la persona piensa.

Esta preocupación también se refleja en las reacciones en las redes sociales.

En Reddit, hay publicaciones que sugieren que las herramientas de entrada de voz parecen estar hechas para personas que están solas en una oficina tranquila, y que aún son difíciles de usar en entornos reales con niños o ruido. Además, otro usuario señala que, aunque la entrada de voz es eficiente, hay insatisfacción con la puntuación, la gramática y el comportamiento en aplicaciones específicas como Microsoft Teams. Además, en las comunidades de desarrolladores, hay una visión más sobria de que la entrada de voz es adecuada para ciertas tareas o largas explicaciones, en lugar de reemplazar toda la codificación.

En LinkedIn también hay publicaciones que indican que, aunque la entrada de voz puede ahorrar tiempo, en el lugar de trabajo, las personas pueden malinterpretar que se les está hablando, por lo que se utiliza en una sala separada. Esta es una reacción muy realista. Incluso si mejora el rendimiento de la herramienta, la distancia entre humanos y las normas de etiqueta en el lugar de trabajo no se optimizan automáticamente.

La cuestión aquí es el equilibrio entre el "derecho a hablar con la IA" y el "derecho a trabajar en silencio".

Las oficinas abiertas han sido criticadas por no ser adecuadas para la concentración. Las miradas, las charlas, las notificaciones, las voces de las reuniones. Ahora se añade el nuevo sonido de la entrada de voz de la IA. Si las empresas realmente aceptan este cambio, no bastará con decir simplemente "úsalo porque es conveniente". Será necesario revisar el diseño de la oficina, la disposición de los asientos, las cabinas individuales, las reglas de uso del micrófono, el manejo de información confidencial y las normas de volumen durante el trabajo.

Por ejemplo, en las oficinas del futuro, podría ser necesario tener no solo "cabinas de llamadas", sino también "cabinas de entrada de IA". Actualmente, muchas empresas ya están estableciendo cabinas individuales para reuniones en línea, pero si la IA de voz se generaliza, se requerirán espacios de habla incluso para tareas normales que no sean reuniones. O tal vez, los micrófonos con cancelación de ruido, los micrófonos de conducción ósea, los micrófonos direccionales y los dispositivos portátiles se convertirán en equipamiento estándar. Al igual que el teclado y el ratón, un "entorno de micrófono personal" podría convertirse en una herramienta de trabajo.

Sin embargo, la entrada de voz no es adecuada para todos.

En primer lugar, hay personas que son buenas pensando mientras hablan y otras que son buenas pensando mientras escriben. Cualquiera que escriba sabe que teclear no es solo una tarea de entrada. El proceso de ver aparecer las letras en la pantalla en sí mismo ayuda a organizar el pensamiento. Al escribir, uno se da cuenta de las inconsistencias, borra, reordena y reformula. Ese ciclo de retroalimentación es diferente de la entrada de voz que se hace de una vez.

De hecho, en las redes sociales también hay comentarios que señalan que con la entrada de voz, uno ve el resultado después de hablar, lo que dificulta corregir el pensamiento en tiempo real. Este es un punto importante. La entrada de voz es rápida, pero la rapidez no siempre se traduce en calidad. De hecho, podría haber casos en los que se lanzan muchas palabras a la IA antes de pensar, y luego se necesita tiempo para organizarlas.

En segundo lugar, hay problemas de privacidad y seguridad.

Hablar en voz alta en el lugar de trabajo significa que es posible que el contenido se escuche a los alrededores. Información de clientes, información interna no publicada, condiciones contractuales, información de personal, nombres en clave, documentos estratégicos. Al ingresar estos datos a la IA, con el teclado, al menos no se sabe a menos que se mire la pantalla, pero con la voz, puede llegar a los oídos de las personas cercanas. Además, si se utiliza una entrada de voz basada en la nube, también es un problema dónde se procesan los datos de voz y si se ajusta a la política de seguridad de la empresa.

En tercer lugar, desde el punto de vista de la accesibilidad, hay un gran potencial. Para las personas con problemas en las manos o los brazos, para quienes es difícil teclear durante mucho tiempo, o para quienes desean tomar notas mientras se desplazan, la entrada de voz puede ser una tecnología de asistencia poderosa. Es decir, no es suficiente ver la entrada de voz solo como un "hack de productividad para los amantes de los nuevos gadgets". También es una tecnología que amplía las opciones de trabajo.

Entonces, ¿realmente la IA de entrada de voz se convertirá en la norma en las oficinas?

Por ahora, probablemente estemos en una fase de transición. Aunque el rendimiento está mejorando rápidamente, la adaptación social no ha alcanzado el mismo ritmo. Los teléfonos inteligentes también parecían extraños al principio cuando la gente miraba la pantalla en público. Hablar solo con auriculares inalámbricos también parecía extraño al principio. Ahora, muchas personas lo han aceptado. El fundador de Wispr cree que "eventualmente será normal", y esto se encuentra en esa misma línea.

Sin embargo, hay diferencias entre los teléfonos inteligentes o auriculares y la IA de entrada de voz. Los teléfonos inteligentes principalmente capturan la mirada, pero la entrada de voz captura el espacio. Las llamadas con auriculares permiten saber que se está hablando con otra persona, pero los susurros a la IA son difíciles de interpretar desde el exterior. Es difícil juzgar si se está hablando con alguien, si es un monólogo o si se está hablando de información confidencial. Esta ambigüedad puede llevar a la incomodidad en el lugar de trabajo.

En ese sentido, lo que se necesitará en el futuro es "etiqueta para la entrada de voz de IA".

Por ejemplo, no usar la entrada de voz durante largos períodos en el escritorio habitual dentro de la oficina. Realizar prompts largos o instrucciones de codificación en cabinas dedicadas. No hablar nombres de clientes o información confidencial interna a un volumen que pueda ser escuchado por los alrededores. Usar micrófonos o auriculares y crear un entorno donde se pueda hablar en voz baja. Decidir dentro del equipo en qué situaciones se puede usar la entrada de voz y en cuáles se debe evitar. Estas reglas podrían ser necesarias en muchas empresas en un futuro cercano.

Lo interesante es que, aunque este cambio parece devolver la "humanidad" al trabajo, en realidad podría reducir la conversación entre humanos.

En lugar de consultar al colega de al lado, las personas consultan en voz baja a la IA. En lugar de debatir frente a una pizarra, cada uno habla a su propia pantalla. Aunque aumenten las voces en la oficina, no necesariamente son comunicaciones entre humanos. Más bien, cada persona podría estar teniendo una conversación cerrada con su asistente de IA.

Una oficina ruidosa pero solitaria.

Esa es la extraña imagen del lugar de trabajo en la era de la IA de voz.

El desafío para las empresas no es prohibir esta tecnología. Probablemente, incluso si se prohíbe, lo que es conveniente se extenderá. Al igual que con las herramientas de IA, lo que es útil se difundirá desde el campo. Lo importante es diseñar dónde, cómo y para qué se utiliza.

La entrada de voz tiene el potencial de acelerar muchas tareas, como la redacción de documentos, la codificación, la generación de ideas, la respuesta a correos electrónicos, la creación de actas y las notas de investigación. Especialmente en las tareas de proporcionar un contexto largo a la IA generativa, la voz puede ser más natural que el teclado. Sin embargo, si eso distrae la concentración de los alrededores o aumenta el riesgo de fuga de información, se generará un costo adicional detrás del aumento de la productividad.

En la era del teclado, la entrada era una tarea cercana al interior del cuerpo de la persona. En la era de la voz, la entrada se extiende al espacio. Por eso, es necesario pensar simultáneamente en la eficiencia individual y el confort colectivo.

¿Realmente se llenará el futuro de la oficina con susurros?

Probablemente la respuesta sea "en parte sí". No todas las personas hablarán con la IA todo el día. Sin embargo, en situaciones como escribir correos, transmitir directrices de código, crear borradores de proyectos o organizar notas después de una reunión, es seguro que aumentarán las ocasiones en que las personas usen la voz en lugar del teclado.

En ese momento, ¿estaremos preparados para aceptar el nuevo sonido del lugar de trabajo?

La era en que el sonido del teclado era el símbolo del trabajo está llegando a su fin. Lo que podría escucharse a continuación es el pequeño susurro de alguien hablando con la IA.

Y esa voz es, al mismo tiempo, el sonido de la conveniencia y el nuevo roce que el lugar de trabajo deberá resolver en el futuro.

Puntos clave de las reacciones en redes sociales y comunidades

 

Dentro del alcance que se puede verificar en búsquedas públicas, las reacciones se dividen en tres grandes grupos.

Primero, los defensores valoran que la entrada de voz permite dar instrucciones más largas y específicas a la IA, mejorando la eficiencia en la creación de correos y borradores, y en el vibe coding. Especialmente se apoya el hecho de que "se puede usar en cualquier aplicación" y "es fácil proporcionar contexto a la IA".

En segundo lugar, los cautelosos ven que la entrada de voz no es universal, y que es adecuada para largas explicaciones o borradores, pero para correcciones detalladas o escritura precisa de código, el teclado puede ser mejor. También se señalan problemas prácticos como la puntuación, el comportamiento en cada aplicación, la competencia de atajos y la calidad del micrófono.

Finalmente, los detractores y preocupados ven como un problema el hecho de que en el lugar de trabajo o en el hogar se moleste a los alrededores. Es fácil de usar en lugares tranquilos, pero hay voces que dicen que es difícil de usar en entornos con ruido, niños o muchas reuniones. Es decir, no solo la perfección técnica, sino también