1GPU puede generar 1 segundo de audio en 1 minuto. Microsoft lanza su AI interna ─ ¿Se internalizará el "corazón" de Copilot?

2025年08月30日 08:18

El modelo interno abre el camino hacia una "competencia coexistente"

Microsoft ha decidido implementar seriamente su IA interna. El anuncio se realizó el 28 de agosto de 2025 (hora local). The Verge lo describió como "un nuevo giro en la compleja asociación con OpenAI", posicionándolo como un "modelo competidor" al nivel de GPT-5 o DeepSeek. En otras palabras, la empresa ha avanzado hacia una etapa de "competencia coexistente", colaborando con OpenAI y al mismo tiempo posicionándose en la vanguardia.The Verge

MAI-Voice-1: 1 minuto de audio en menos de 1 segundo con 1 GPU

Uno de los aspectos destacados es el modelo de generación de voz "MAI-Voice-1". Según el anuncio oficial, logra una eficiencia que permite sintetizar un minuto de audio en menos de un segundo con una sola GPU. Ya se ha integrado en funciones como "Copilot Daily", que lee noticias, y en una función que explica temas de manera "estilo podcast", permitiendo probar diferentes calidades de voz y estilos de narración en las demostraciones de Copilot Labs.Microsoft AI

MAI-1-preview: MoE LLM entrenado con aproximadamente 15,000 H100

Otro nuevo modelo, "MAI-1-preview", es un modelo de lenguaje a gran escala de tipo Mixture-of-Experts, especializado en seguir instrucciones. Se han utilizado aproximadamente 15,000 NVIDIA H100 para su pre y post-entrenamiento, comenzando con pruebas públicas en la plataforma de evaluación comunitaria "LMArena" y recopilando comentarios a través de acceso API limitado. Se ha anunciado un despliegue gradual para ciertos usos de texto en Copilot en las próximas semanas.Microsoft AIPYMNTS.com

La filosofía de diseño "óptima para el consumidor"

Mustafa Suleyman de Microsoft AI ha declarado que la prioridad de los modelos internos es la "experiencia del consumidor". La idea es optimizar el "compañero de IA" utilizando activos de datos propios, como la publicidad y la telemetría del consumidor. Considerando el contexto de la empresa de cambiar hacia un enfoque liderado por productos, se puede entender que la internalización busca mejorar el "flujo diario" de Copilot.The Verge

Copilot hacia la "orquestación del mejor modelo"

La empresa planea seguir utilizando los "mejores modelos" de OpenAI y de código abierto, mientras comienza a usar MAI-1-preview en algunas funciones de Copilot. Lo importante es la idea de "orquestar el modelo óptimo para cada caso de uso". En la etapa actual, no se trata de una sustitución completa, sino de que la precisión en la diferenciación marcará la diferencia.Microsoft AI

La ambición de la infraestructura: operación del clúster GB200

El comunicado también menciona que el clúster NVIDIA GB200 de próxima generación está en funcionamiento. Esto significa que la empresa está preparando meticulosamente la capacidad de mejorar sus modelos internos de manera "continua y a gran escala". La capacidad de operar con costos de aprendizaje e inferencia reducidos y actualizaciones frecuentes será un factor diferenciador frente a la competencia.Microsoft AI

Prueba: Copilot Labs y LMArena

El camino de la experiencia ya está abierto. MAI-Voice-1 se puede probar desde Copilot Labs. En cuanto a MAI-1-preview, se puede participar en su evaluación en LMArena, y la empresa también está reclutando testers a través de una API limitada. Antes de la implementación en el producto, se trata de un proceso para identificar "peculiaridades" y "áreas de especialización" junto con la comunidad.Microsoft AI

Reacción en redes sociales: una "doble melodía" de expectativas y precauciones

En X (anteriormente Twitter), el propio Suleyman anunció el "primer modelo interno". Las cuentas técnicas lo difundieron rápidamente, destacando publicaciones que lo ven como "un paso hacia la independencia estratégica de la dependencia de OpenAI".X (formerly Twitter)

Por otro lado, PhoneArena y otros han enfatizado la preocupación por una era en la que "cualquier voz puede ser generada de manera convincente". Hay muchas opiniones que piden medidas para controlar la propagación de deepfakes de voz y establecer métodos de verificación. En Reddit, se discuten preocupaciones sobre "cómo se garantizará la seguridad" y la redefinición de la relación con OpenAI.PhoneArenaReddit

Impacto estratégico: un "nuevo equilibrio" con OpenAI

El modelo interno no busca "disolver" inmediatamente la relación entre OpenAI y Microsoft. Sin embargo, como señala The Verge, ha visualizado una nueva fase en la que la empresa no solo es un "proveedor de modelos de primera categoría" sino también un "competidor". Si pueden internalizar el núcleo de Copilot, podrán acelerar la diferenciación a su propio ritmo.The Verge

Puntos de evaluación futuros

Capacidad: Hasta qué punto las mediciones en LMArena y otros se posicionan en los niveles superiores.
Experiencia: Si la introducción gradual en Copilot mejora la calidad de las respuestas, la velocidad de respuesta y la naturalidad del audio de manera perceptible.
Seguridad: Detección y etiquetado de falsificaciones de voz, control de tasas y trazabilidad en caso de uso indebido.
Economía: Cómo la ventaja de costos de inferencia, como la generación rápida con una sola GPU, afecta la operación.
Gobernanza: Si el diseño de uso combinado con modelos de OpenAI y otros mantiene la transparencia y la delimitación de responsabilidades.Microsoft AI

Conclusión: la internalización no es un "fin" sino un "medio"

La adopción de modelos internos no es un "fin" para competir en el mismo terreno que OpenAI. Es un "medio" para mejorar la experiencia de Copilot en la vida diaria de los usuarios a la velocidad de la empresa. La publicación de MAI-Voice-1 y MAI-1-preview es solo el prólogo de esa historia. La clave del próximo capítulo radica en hasta qué punto se pueden llevar a cabo los datos de rendimiento en el campo, la operación segura y la "orquestación del mejor modelo".Microsoft AI

Artículos de referencia

Microsoft anuncia su primer modelo de IA desarrollado internamente
Fuente: https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai

1GPU puede generar 1 segundo de audio en 1 minuto. Microsoft lanza su AI interna ─ ¿Se internalizará el "corazón" de Copilot?

El modelo interno abre el camino hacia una "competencia coexistente"

MAI-Voice-1: 1 minuto de audio en menos de 1 segundo con 1 GPU

MAI-1-preview: MoE LLM entrenado con aproximadamente 15,000 H100

La filosofía de diseño "óptima para el consumidor"

Copilot hacia la "orquestación del mejor modelo"

La ambición de la infraestructura: operación del clúster GB200

Prueba: Copilot Labs y LMArena

Reacción en redes sociales: una "doble melodía" de expectativas y precauciones

Impacto estratégico: un "nuevo equilibrio" con OpenAI

Puntos de evaluación futuros

Conclusión: la internalización no es un "fin" sino un "medio"

¡Revolución de la IA! ¡ChatGPT apoya completamente tus compras en línea y la preparación de presentaciones!

¡Baidu revoluciona la búsqueda y generación de videos con la revolución de la IA! La nueva veta de oro que Baidu apunta tras la publicidad.

¿Hasta qué punto es "original" la IA generativa?: El punto crítico del copyright a través de huellas digitales - Una nueva técnica de negociación de derechos que convierte lo "similar" en una etiqueta de precio

El "médico de guardia" del espacio es la IA: el comienzo de la "atención médica independiente de la Tierra" que NASA y Google están imaginando. Hacia el nacimiento del doctor IA, el salvavidas de la tripulación rumbo a Marte.

¿La dependencia de la IA nos quita inteligencia o nos libera? ─ La verdadera naturaleza de la "deuda cognitiva" revelada por el MIT

cookie_banner_title

El modelo interno abre el camino hacia una "competencia coexistente"

MAI-Voice-1: 1 minuto de audio en menos de 1 segundo con 1 GPU

MAI-1-preview: MoE LLM entrenado con aproximadamente 15,000 H100

La filosofía de diseño "óptima para el consumidor"

Copilot hacia la "orquestación del mejor modelo"

La ambición de la infraestructura: operación del clúster GB200

Prueba: Copilot Labs y LMArena

Reacción en redes sociales: una "doble melodía" de expectativas y precauciones

Impacto estratégico: un "nuevo equilibrio" con OpenAI

Puntos de evaluación futuros

Conclusión: la internalización no es un "fin" sino un "medio"

¡Revolución de la IA! ¡ChatGPT apoya completamente tus compras en línea y la preparación de presentaciones!

¡Baidu revoluciona la búsqueda y generación de videos con la revolución de la IA! La nueva veta de oro que Baidu apunta tras la publicidad.

¿Hasta qué punto es "original" la IA generativa?: El punto crítico del copyright a través de huellas digitales - Una nueva técnica de negociación de derechos que convierte lo "similar" en una etiqueta de precio

El "médico de guardia" del espacio es la IA: el comienzo de la "atención médica independiente de la Tierra" que NASA y Google están imaginando. Hacia el nacimiento del doctor IA, el salvavidas de la tripulación rumbo a Marte.

¿La dependencia de la IA nos quita inteligencia o nos libera? ─ La verdadera naturaleza de la "deuda cognitiva" revelada por el MIT