skip_to_content
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 로고
  • 전체 기사
  • 🗒️ 회원가입
  • 🔑 로그인
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 개인정보처리방침 cookie_banner_and 쿠키 정책 cookie_banner_more_info

쿠키 설정

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

1GPU로 1분 음성을 1초 생성. 마이크로소프트, 자체 AI의 출발 신호 ─ Copilot의 “심장”은 자체화될 것인가

1GPU로 1분 음성을 1초 생성. 마이크로소프트, 자체 AI의 출발 신호 ─ Copilot의 “심장”은 자체화될 것인가

2025年08月30日 08:22

내제 모델이 개척하는 "공존 경쟁"

마이크로소프트가 내제 AI의 본격적인 도입을 결정했다. 발표는 2025년 8월 28일(현지 시간)이었다. The Verge는 "OpenAI와의 복잡한 제휴에 새로운 트위스트"라고 표현하며, GPT-5나 DeepSeek와 어깨를 나란히 하는 "경쟁 모델"로 위치시켰다. 즉, 동사는 OpenAI와 협업하면서도 스스로도 최전선에 서는 "공존 경쟁" 단계로 나아갔다.The Verge


MAI-Voice-1: 1GPU, 1초 미만으로 1분 음성

주목할 만한 것 중 하나는 음성 생성 모델 "MAI-Voice-1"이다. 공식 발표에 따르면, 단일 GPU로 1분의 음성을 1초 미만으로 합성할 수 있는 효율성을 실현했다. 이미 뉴스 읽기 "Copilot Daily"나, 화제를 "팟캐스트 스타일"로 해설하는 기능에 통합되어 있으며, Copilot Labs의 데모에서 화자의 음성 질감이나 말하는 스타일을 바꾸면서 시도할 수 있다.Microsoft AI


MAI-1-preview: H100 약 1.5만 대로 훈련한 MoE LLM

또 다른 신제품 "MAI-1-preview"는 지시 추종에 능한 Mixture-of-Experts형 대규모 언어 모델이다. 사전 및 사후 학습을 포함하여 NVIDIA H100을 약 1만 5천 대 투입하여, 우선 커뮤니티 평가 플랫폼 "LMArena"에서 공개 테스트를 시작하고, 제한된 API 접근으로 피드백을 수집하는 단계다. 몇 주 내에 Copilot의 특정 텍스트 용도로 단계적 롤아웃도 예고되었다.Microsoft AIPYMNTS.com


"컨슈머 최적"이라는 설계 사상

Microsoft AI의 Mustafa Suleyman 씨는 내제 모델의 우선순위를 "컨슈머 경험"에 두겠다고 명확히 해왔다. 광고나 컨슈머의 텔레메트리 같은 자사 데이터 자산을 활용하여, "AI 동반자"에 최적화한다는 발상이다. 제품 주도의 체제로 방향을 전환한 동사의 맥락을 고려하면, Copilot의 "일상 동선"을 다듬기 위한 내제화라고 이해할 수 있다.The Verge


Copilot은 "최고 모델의 오케스트레이션"으로

동사는 앞으로도 OpenAI나 오픈 소스의 "최고 모델"을 병용할 방침을 보이는 한편, MAI-1-preview를 Copilot의 일부 기능에서 사용하기 시작한다. 중요한 것은 "사용 사례별로 최적의 모델을 오케스트레이션한다"는 생각이다. 현 단계에서는 전면 교체가 아니라, 사용 구분의 정밀도가 승부를 가른다.Microsoft AI


인프라의 야심: GB200 클러스터의 가동

발표문에는 차세대 NVIDIA GB200 클러스터가 가동 중이라는 점도 언급되었다. 즉, 동사는 내제 모델을 "지속적이고 대규모"로 개량할 수 있는 계획을 착실히 정비하고 있다. 학습 및 추론 비용을 줄이면서 빈번히 업데이트하는 운영력이 경쟁과의 차이가 될 것이다.Microsoft AI


사용해보기: Copilot Labs와 LMArena

체험 동선은 이미 열려 있다. 음성 생성의 MAI-Voice-1은 Copilot Labs에서 시도 가능하다. LLM 측의 MAI-1-preview는 LMArena에서의 평가에 참여할 수 있으며, 동사는 제한된 API에서도 테스터를 모집하고 있다. 제품에의 구현 전에, 커뮤니티와 함께 "버릇"이나 "특기 영역"을 파악하는 프로세스다.Microsoft AI


SNS의 반향: 기대와 경계의 "이중주"

 


X(구 Twitter)에서는 Suleyman 씨가 직접 "첫 내제 모델"을 고지. 기술 계정도 잇따라 확산하며, "OpenAI 의존에서의 전략적 자립의 한 걸음"이라고 긍정적으로 받아들이는 게시물이 두드러졌다.X (formerly Twitter)


한편으로, PhoneArena 등은 "누구의 목소리라도 그럴듯하게 생성할 수 있는 시대"에 대한 불안을 강조. 음성 딥페이크의 확산이나 검증 수단의 정비를 요구하는 논조도 많다. Reddit에서도 "안전성은 어떻게 보장할 것인가"라는 우려나, OpenAI와의 관계 재정의를 둘러싼 논의가 오가고 있다.PhoneArenaReddit


전략적 영향: OpenAI와의 "새로운 균형"

이번 내제 모델은 OpenAI와 마이크로소프트의 관계를 즉시 "해소"하는 것은 아니다. 그러나 The Verge가 지적하듯이, 동사가 "최상위 모델의 공급자"일 뿐만 아니라 "경쟁자"이기도 하다는 새로운 국면을 시각화했다. Copilot의 심장부를 자사화할 수 있다면, 차별화의 속도를 자사 사정에 맞춰 가속할 수 있다.The Verge


앞으로의 평가 포인트

  1. 실력: LMArena 등에서의 실측이 얼마나 상위에 진입할 것인가.

  2. 체험: Copilot에의 단계 도입으로, 응답 품질, 응답 속도, 음성 자연성이 체감으로 향상될 것인가.

  3. 안전성: 음성 위조의 탐지 및 라벨링, 악용 시의 레이트 제어 및 추적 가능성.

  4. 경제성: 단일 GPU로의 고속 생성 등, 추론 비용의 우위가 운영에 어떻게 영향을 미칠 것인가.

  5. 거버넌스: OpenAI나 타사 모델과의 병용 설계가, 투명성과 책임 분계를 유지할 수 있는가.Microsoft AI


결론: 내제는 "목적"이 아니라 "수단"

내제 모델의 채택은 OpenAI와 같은 무대에서 싸우기 위한 "목적"이 아니다. 사용자의 일상에 들어가는 Copilot 경험을 자사의 속도로 다듬기 위한 "수단"이다. MAI-Voice-1과 MAI-1-preview의 공개는 그를 위한 이야기의 서장에 불과하다. 다음 장의 열쇠는 현장의 성능 데이터와 안전 운영, 그리고 "최고 모델의 오케스트레이션"을 어디까지 해낼 수 있는가에 있다.Microsoft AI


참고 기사

마이크로소프트, 첫 자사 개발 AI 모델 발표
출처: https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai

Powered by Froala Editor

← 기사 목록으로 돌아가기

문의하기 |  이용약관 |  개인정보처리방침 |  쿠키 정책 |  쿠키 설정

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.