AWS re:Invent 2025(12월)가 던진 한 방: “AI 모델을 ‘고객이 직접 훈련’하는 클라우드”로 전환 중
들어가며
2025년 12월 AWS는 re:Invent를 통해 생성형 AI를 “API로 쓰는 단계”에서 “기업이 자기 데이터로 모델/에이전트를 직접 만들고 운영하는 단계”로 밀어 올리는 신규 서비스를 다수 공개했습니다. 같은 달 Azure는 에이전트 거버넌스/지식 관리(Control Plane, IQ)와 Claude 모델 수용으로 ‘운영 가능한 agent 플랫폼’ 쪽을 강화했고, GCP는 Data Cloud 업데이트와 MCP(Model Context Protocol) 지원 확대로 “AI-데이터-거버넌스 연결”을 전면에 내세웠습니다. (aws.amazon.com)
📰 무슨 일이 있었나
- AWS (2025년 12월 2~5일, re:Invent 2025)
- Amazon Nova Forge 공개: 기업이 사전 학습된 모델의 checkpoint를 활용하고, 자사 데이터 + Amazon Nova curated datasets를 섞어 커스텀 모델을 구축하는 방향(일명 “open training”)을 제시했습니다. (aboutamazon.com)
- Amazon Nova 2 라인업 발표(예: Nova 2 Sonic, Nova 2 Lite 등):
- Nova 2 Sonic은 speech-to-speech 기반의 대화형 음성 경험(다국어, 텔레포니 통합 등)을 강조했고,
- Nova 2 Lite는 “빠르고 비용 효율적인 reasoning 모델”과 1M token context window를 전면에 내세웠습니다. (aws.amazon.com)
- 인프라 측면에서 EC2 Trn3 UltraServers(Trainium3, 3nm)를 공개하며 Trainium2 대비 최대 4.4배 compute, 4배 에너지 효율, 칩당 3배 throughput, 4배 faster response 같은 수치를 제시했습니다. (aboutamazon.com)
- 개발 방식 변화와 맞물린 메시지로 “frontier agents”(Kiro / Security / DevOps Agent)도 함께 부각됐습니다. (aboutamazon.com)
- 또한 AWS News Blog는 re:Invent Top announcements 형태로 Nova 2, Nova Forge 등을 포함한 핵심 발표를 정리해 공개했습니다. (aws.amazon.com)
- Azure (2025년 12월, 파트너 업데이트)
- Microsoft Foundry Control Plane (public preview): 여러 환경에서 동작하는 AI agents의 정책/가시성/보안/거버넌스/관측(Observability)를 통합 관리하는 콘셉트를 제시했습니다. (partner.microsoft.com)
- Foundry IQ (public preview): 에이전트의 지식(RAG) 측면에서 통합 endpoint와 소스 라우팅/리트리벌 워크플로우 자동화(Azure AI Search 기반)를 강조했습니다. (partner.microsoft.com)
- Anthropic Claude 모델의 Foundry 내 제공도 명시되어, “모델 선택권 + 거버넌스 프레임”을 같이 가져가는 방향이 드러났습니다. (partner.microsoft.com)
- GCP (2025년 12월)
- Google Cloud Blog의 Data Cloud 업데이트(2025-12-18)에서는 Looker의 셀프서비스 기능 강화, Dataplex(Universal Catalog)에서의 data products(미리 큐레이션된 데이터 패키지), 그리고 MCP 지원 확대(BigQuery/GCE/GKE 등)를 전면에 내세웠습니다. (cloud.google.com)
- 문서 기반으로는 Apigee의 LLM Token Management 정책(GA, 2025-12-23)처럼, LLM 비용/트래픽 제어를 API Gateway 레벨에서 제도화하는 움직임도 확인됩니다. (docs.cloud.google.com)
🔍 왜 중요한가
AWS의 포인트는 “모델을 쓰는 것”에서 “모델을 소유/최적화하는 것”으로의 이동입니다.
Nova Forge가 던지는 메시지는 명확합니다. 기업이 Bedrock 위에서 모델을 호출하는 수준을 넘어, checkpoint 기반 커스터마이징으로 “우리 도메인에 맞는 frontier 모델”을 만들려는 수요를 정면으로 받겠다는 거죠. (aboutamazon.com)Trainium3(Trn3 UltraServer) 수치 경쟁은, 곧 ‘학습·추론 단가’ 경쟁입니다.
2024~2025년의 생성형 AI는 모델 성능도 중요했지만, 실제 조직 입장에선 학습/서빙 비용과 전력 효율이 성패를 갈랐습니다. AWS가 4.4x compute, 4x energy efficiency 같은 지표를 전면에 두는 건 “GPU 의존도를 낮추면서도 대규모 워크로드를 감당하겠다”는 선언에 가깝습니다. (aboutamazon.com)개발자에게 가장 직접적인 변화는 “Agent 운영”이 새 표준이 된다는 점입니다.
AWS는 frontier agents로 SDLC(개발-보안-운영)를 에이전트로 재편하려는 그림을 공개했고, Azure는 Control Plane/IQ로 거버넌스·관측·지식을 플랫폼화합니다. 이제는 “모델이 똑똑한가?”만이 아니라, 에이전트가 안전하게 동작하고(Policy), 추적 가능하며(Observability), 비용이 통제되는가(Token/Quota)가 핵심 체크리스트가 됩니다. (itpro.com)
💡 시사점과 전망
멀티클라우드는 ‘네트워킹 + 거버넌스’가 함께 묶이는 방향으로 진화 중입니다.
2025년 12월 1일 AWS와 Google Cloud가 전용(private) 고속 멀티클라우드 연결을 함께 발표했다는 보도는, “서로 경쟁만 하는 구도”에서 “큰 고객의 멀티클라우드 현실을 전제로 한 상호접속”이 커졌음을 보여줍니다. (timesofindia.indiatimes.com)
(이 흐름이 커지면, 향후 개발자는 특정 클라우드 종속보다 데이터 이동/정책/보안 경계를 더 자주 설계하게 됩니다.)GCP는 ‘데이터 거버넌스 → AI 연결’에 강하게 베팅하고 있습니다.
Dataplex의 data products, Looker-LLM 연결, MCP 지원 같은 업데이트는 “AI는 결국 데이터가 좌우한다”는 관점에 충실합니다. 즉, 모델보다 조직의 데이터 구조화/카탈로그/세맨틱 레이어가 승부처가 될 가능성이 커졌습니다. (cloud.google.com)Azure는 ‘에이전트 운영체제(관리 계층)’ 포지션을 강화합니다.
Control Plane과 IQ는 모델 자체보다도, 기업 환경에서 필수인 정책/가시성/보안/지식 라우팅을 “플랫폼 기본값”으로 만들려는 시도로 읽힙니다. 이 방향은 AWS의 agent 드라이브와 경쟁하면서도, 고객에겐 “운영 가능한 agent 스택”을 빠르게 고를 수 있는 선택지를 늘립니다. (partner.microsoft.com)
🚀 마무리
2025년 12월의 핵심은 한 문장으로 정리됩니다: 클라우드는 이제 AI 모델 호출 인프라가 아니라, ‘모델 커스터마이징 + 에이전트 운영 + 비용/정책 통제’의 종합 플랫폼 경쟁으로 넘어갔다. (aws.amazon.com)
개발자 권장 액션은 3가지입니다.
1) 팀의 GenAI 로드맵을 “API 통합”에서 “Agent 운영(Observability/Policy/Cost)” 중심으로 재작성하기, 2) 도메인 데이터 품질/카탈로그/세맨틱 레이어(예: Looker/Dataplex류) 정비를 우선순위로 올리기, 3) 특정 벤더 고정이 아니라 멀티클라우드 연결/데이터 이동을 포함한 아키텍처를 초기에 가정하고 설계하기. (cloud.google.com)