포스트

5월(2026) 오픈소스 모델 전쟁: Llama·Mistral·Qwen “공개”의 의미가 갈라지기 시작했다

5월(2026) 오픈소스 모델 전쟁: Llama·Mistral·Qwen “공개”의 의미가 갈라지기 시작했다

들어가며

2026년 4~5월은 오픈소스 LLM/VLM 진영이 “성능”뿐 아니라 공개 방식(오픈소스 vs open-weight)라이선스로 본격 분화한 시기였습니다. 특히 Meta(Llama), Mistral, Alibaba(Qwen)가 각자 다른 규칙으로 배포하면서, 실무 개발자는 “어떤 모델이 좋나?”보다 “어떤 모델을 써도 법/운영 리스크가 없나?”를 먼저 따져야 하는 국면으로 들어왔습니다.


📰 무슨 일이 있었나

  • 2026-03-16: Mistral AI가 Mistral Small 4를 공개. 공식 발표에서 Apache 2.0 라이선스로 배포한다고 명시했고(상업적 사용/재배포에 유리), “Small” 라인업임에도 MoE 기반(총 파라미터는 크고, 토큰당 활성 파라미터는 적게)로 비용 대비 성능을 전면에 내세웠습니다. (mistral.ai)
  • 2026-04-16 전후: Qwen 진영에서는 Qwen 3.6 계열이 공개되었다는 흐름이 이어졌고, 공개된 모델은 Apache 2.0로 배포된다고 정리된 자료들이 다수 나왔습니다(예: 3.6-35B-A3B 등). 다만 “어떤 변형이 실제로 weights 공개인지 / API-only인지”는 모델별로 갈려 혼선이 생기기 쉬운 구조입니다. (idlen.io)
  • 2026-04-05~04-17: Meta는 Llama 4 계열 공개 흐름이 있었고, “오픈소스”라는 표현과 달리 Llama Community License(수용 가능한 사용 정책 + 규모/조건 기반 제한)가 계속 핵심 이슈로 남았습니다. 즉, 기술적으로는 open-weight에 가깝지만, OSI 의미의 오픈소스와는 다르다는 논쟁이 반복됩니다. (en.wikipedia.org)
  • (배경) “라이선스 준수” 자체가 업계 전반의 약점이라는 감사/연구 결과도 나오며, 다운스트림(파생 모델/앱)로 갈수록 고지/저작권/라이선스 텍스트가 누락되는 비율이 매우 높다는 지적이 강화됐습니다. (arxiv.org)

🔍 왜 중요한가

1) ‘성능 좋은 공개 모델’이 곧 ‘안전한 선택’이 아니다

  • Mistral Small 4나 Qwen 3.6처럼 Apache 2.0이면, 사내 서비스에 넣을 때 법무/컴플라이언스 관점에서 상대적으로 단순합니다(상업적 사용, 수정/재배포, 파생 모델 운영 등). (mistral.ai)
  • 반면 Llama 계열은 커뮤니티 라이선스와 사용정책이 붙어 “배포/고객사 제공/MAU 규모” 같은 조건이 검토 포인트가 됩니다. 모델 성능이 좋아도, 제품 형태가 B2C로 커지거나 고객사에 재배포되는 순간 라이선스가 아키텍처 결정을 강제할 수 있습니다. (en.wikipedia.org)

2) 파생 모델(derivative) 생태계가 커질수록 ‘라이선스 체인’이 실무를 지배

  • 지금 오픈 모델 흐름은 “업스트림 모델 1개”가 아니라, LoRA/merge/quant/컨텍스트 확장/도메인 튜닝으로 파생이 폭발합니다. 문제는 라이선스 고지·저작권 텍스트·데이터셋 공지 등이 파생 단계에서 사라지기 쉽다는 점이고, 이게 결국 기업 내부의 “모델 공급망” 리스크로 전이됩니다. (arxiv.org)

3) VLM/에이전트 시대엔 ‘모델 1개’보다 ‘운영 가능성’이 더 중요

  • Mistral은 Small 4를 “범용 통합” 방향으로 포지셔닝(멀티태스크/에이전틱/코딩/멀티모달을 한 덩어리로)하면서, 라우팅(모델 분기) 복잡도를 줄이는 그림을 강조합니다. 실무에선 이게 곧 엔드포인트/캐시/관측성/프롬프트 정책을 단순화시키는 효과가 있습니다. (mistral.ai)

💡 시사점과 전망

  • 트렌드 1: “open-weight 경쟁”이 “라이선스 경쟁”으로 이동
    • 앞으로 3~6개월은 “누가 더 똑똑한가”만이 아니라, 누가 더 기업 친화적 라이선스를 유지하는가(Apache 2.0 유지 여부)가 실무 채택을 가를 가능성이 큽니다. Qwen/Mistral 쪽이 Apache 2.0을 유지하면, SI/엔터프라이즈 납품이나 온프레미스 재배포에서 선택받기 쉽습니다. (mistral.ai)
  • 트렌드 2: ‘공개’의 의미가 모델별로 분열(오픈소스/오픈웨이트/API-only 혼재)
    • Qwen은 대체로 “오픈” 라인업이 강하지만, 같은 브랜드 아래에서도 API-only 모델이 끼어들면(혹은 커뮤니티가 그렇게 인식하면) 실무자는 모델명만 보고 의사결정하기 어려워집니다. 즉, 팀 내에 “모델 카드/라이선스 확인”을 CI처럼 강제하는 프로세스가 필요해집니다. (docs.bswen.com)
  • 회의론/리스크: 라이선스가 permissive해도 ‘준수 증빙’이 약하면 문제
    • Apache 2.0이라도, 파생 모델/데이터셋 고지 누락이 누적되면 상업 서비스에서 문제가 될 수 있습니다. “모델이 Apache니까 끝”이 아니라, 다운스트림 아티팩트(quant 파일, 컨테이너, 모델 리포지토리)에 라이선스/NOTICE가 남아 있는지를 확인해야 합니다. (arxiv.org)

🚀 마무리

2026년 5월 시점의 핵심은 “Llama/Mistral/Qwen 중 누가 더 좋나”가 아니라, 우리 제품의 배포 방식과 성장 계획에 맞는 라이선스를 고를 수 있나입니다.

실무자가 지금 할 수 있는 액션은 두 가지입니다. 1) 모델 도입 체크리스트에 ‘라이선스 체인’ 항목을 추가하세요(업스트림 모델 카드, 파생/quant 리포지토리의 LICENSE/NOTICE 포함 여부까지). (arxiv.org)
2) “파일럿은 Llama, 프로덕션은 Apache 2.0 모델”처럼 라이선스에 따라 단계별 전략을 세우세요(성능 실험과 상업 배포의 요구조건이 다릅니다). (mistral.ai)

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.