Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

1GPU puede generar 1 segundo de audio en 1 minuto. Microsoft lanza su AI interna ─ ¿Se internalizará el "corazón" de Copilot?

1GPU puede generar 1 segundo de audio en 1 minuto. Microsoft lanza su AI interna ─ ¿Se internalizará el "corazón" de Copilot?

2025年08月30日 08:18

El modelo interno abre el camino hacia una "competencia coexistente"

Microsoft ha decidido implementar seriamente su IA interna. El anuncio se realizó el 28 de agosto de 2025 (hora local). The Verge lo describió como "un nuevo giro en la compleja asociación con OpenAI", posicionándolo como un "modelo competidor" al nivel de GPT-5 o DeepSeek. En otras palabras, la empresa ha avanzado hacia una etapa de "competencia coexistente", colaborando con OpenAI y al mismo tiempo posicionándose en la vanguardia.The Verge


MAI-Voice-1: 1 minuto de audio en menos de 1 segundo con 1 GPU

Uno de los aspectos destacados es el modelo de generación de voz "MAI-Voice-1". Según el anuncio oficial, logra una eficiencia que permite sintetizar un minuto de audio en menos de un segundo con una sola GPU. Ya se ha integrado en funciones como "Copilot Daily", que lee noticias, y en una función que explica temas de manera "estilo podcast", permitiendo probar diferentes calidades de voz y estilos de narración en las demostraciones de Copilot Labs.Microsoft AI


MAI-1-preview: MoE LLM entrenado con aproximadamente 15,000 H100

Otro nuevo modelo, "MAI-1-preview", es un modelo de lenguaje a gran escala de tipo Mixture-of-Experts, especializado en seguir instrucciones. Se han utilizado aproximadamente 15,000 NVIDIA H100 para su pre y post-entrenamiento, comenzando con pruebas públicas en la plataforma de evaluación comunitaria "LMArena" y recopilando comentarios a través de acceso API limitado. Se ha anunciado un despliegue gradual para ciertos usos de texto en Copilot en las próximas semanas.Microsoft AIPYMNTS.com


La filosofía de diseño "óptima para el consumidor"

Mustafa Suleyman de Microsoft AI ha declarado que la prioridad de los modelos internos es la "experiencia del consumidor". La idea es optimizar el "compañero de IA" utilizando activos de datos propios, como la publicidad y la telemetría del consumidor. Considerando el contexto de la empresa de cambiar hacia un enfoque liderado por productos, se puede entender que la internalización busca mejorar el "flujo diario" de Copilot.The Verge


Copilot hacia la "orquestación del mejor modelo"

La empresa planea seguir utilizando los "mejores modelos" de OpenAI y de código abierto, mientras comienza a usar MAI-1-preview en algunas funciones de Copilot. Lo importante es la idea de "orquestar el modelo óptimo para cada caso de uso". En la etapa actual, no se trata de una sustitución completa, sino de que la precisión en la diferenciación marcará la diferencia.Microsoft AI


La ambición de la infraestructura: operación del clúster GB200

El comunicado también menciona que el clúster NVIDIA GB200 de próxima generación está en funcionamiento. Esto significa que la empresa está preparando meticulosamente la capacidad de mejorar sus modelos internos de manera "continua y a gran escala". La capacidad de operar con costos de aprendizaje e inferencia reducidos y actualizaciones frecuentes será un factor diferenciador frente a la competencia.Microsoft AI


Prueba: Copilot Labs y LMArena

El camino de la experiencia ya está abierto. MAI-Voice-1 se puede probar desde Copilot Labs. En cuanto a MAI-1-preview, se puede participar en su evaluación en LMArena, y la empresa también está reclutando testers a través de una API limitada. Antes de la implementación en el producto, se trata de un proceso para identificar "peculiaridades" y "áreas de especialización" junto con la comunidad.Microsoft AI


Reacción en redes sociales: una "doble melodía" de expectativas y precauciones

 


En X (anteriormente Twitter), el propio Suleyman anunció el "primer modelo interno". Las cuentas técnicas lo difundieron rápidamente, destacando publicaciones que lo ven como "un paso hacia la independencia estratégica de la dependencia de OpenAI".X (formerly Twitter)


Por otro lado, PhoneArena y otros han enfatizado la preocupación por una era en la que "cualquier voz puede ser generada de manera convincente". Hay muchas opiniones que piden medidas para controlar la propagación de deepfakes de voz y establecer métodos de verificación. En Reddit, se discuten preocupaciones sobre "cómo se garantizará la seguridad" y la redefinición de la relación con OpenAI.PhoneArenaReddit


Impacto estratégico: un "nuevo equilibrio" con OpenAI

El modelo interno no busca "disolver" inmediatamente la relación entre OpenAI y Microsoft. Sin embargo, como señala The Verge, ha visualizado una nueva fase en la que la empresa no solo es un "proveedor de modelos de primera categoría" sino también un "competidor". Si pueden internalizar el núcleo de Copilot, podrán acelerar la diferenciación a su propio ritmo.The Verge


Puntos de evaluación futuros

  1. Capacidad: Hasta qué punto las mediciones en LMArena y otros se posicionan en los niveles superiores.

  2. Experiencia: Si la introducción gradual en Copilot mejora la calidad de las respuestas, la velocidad de respuesta y la naturalidad del audio de manera perceptible.

  3. Seguridad: Detección y etiquetado de falsificaciones de voz, control de tasas y trazabilidad en caso de uso indebido.

  4. Economía: Cómo la ventaja de costos de inferencia, como la generación rápida con una sola GPU, afecta la operación.

  5. Gobernanza: Si el diseño de uso combinado con modelos de OpenAI y otros mantiene la transparencia y la delimitación de responsabilidades.Microsoft AI


Conclusión: la internalización no es un "fin" sino un "medio"

La adopción de modelos internos no es un "fin" para competir en el mismo terreno que OpenAI. Es un "medio" para mejorar la experiencia de Copilot en la vida diaria de los usuarios a la velocidad de la empresa. La publicación de MAI-Voice-1 y MAI-1-preview es solo el prólogo de esa historia. La clave del próximo capítulo radica en hasta qué punto se pueden llevar a cabo los datos de rendimiento en el campo, la operación segura y la "orquestación del mejor modelo".Microsoft AI


Artículos de referencia

Microsoft anuncia su primer modelo de IA desarrollado internamente
Fuente: https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai

Powered by Froala Editor

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.