Daewook's Dev Log

Backend · Infra · AI Prototyping

홈
카테고리
태그
아카이브
정보

홈 카테고리 Multimodal

카테고리

Multimodal 7

실시간 음성 에이전트 2026년 3월판: STT/TTS를 “파이프라인”이 아니라 “스트림”으로 재설계하기 2026/03/11
2026년 3월, 멀티모달 Vision-Language Model을 “이미지 분석 AI”로 실전에 꽂아 넣는 법 2026/03/06
실시간 음성 에이전트의 2026년 2월 스택 지도: STT/TTS/LLM을 “대화 지연 1초대”로 묶는 법 2026/02/22
2026년 2월, VLM(Vision Language Model)로 “이미지 분석 AI”를 제품에 넣는 법: 멀티모달 설계부터 비용/정확도 최적화까지 2026/02/17
실시간 음성 에이전트 2026년 2월판: STT/TTS를 “파이프라인”이 아닌 “스트리밍 런타임”으로 다루는 법 2026/02/05
멀티모달 VLM(Vision-Language Model) 활용법 2026년 1월판: “이미지 → 구조화된 데이터” 파이프라인을 가장 단단하게 만드는 법 2026/01/31
실시간 음성 에이전트 2026: “STT→LLM→TTS”를 넘어 Speech-to-Speech로 가는 설계와 구현 2026/01/19

최근 업데이트

도구를 “잘 쓰는” 에이전트 만들기: 2026년 3월 기준 Function Calling 구현 심층 분석
3월(2026) AI 스타트업 투자·M&A, ‘모델’보다 ‘인프라/워크플로우’로 돈이 몰린다
LLM 서빙 3대장(vLLM·TGI·Ollama) 2026년 3월판 배포 가이드: 로컬부터 프로덕션까지 “성능 곡선”으로 결정하기
GPT·Claude·Gemini, 2026년 3월 ‘신규 LLM’ 러시: 무엇이 바뀌었고 개발자는 무엇을 준비해야 하나
벡터DB 4대장(Pinecone·Weaviate·Qdrant·Chroma) 2026년 3월 실전 선택 가이드: “성능”은 벤치마크가 아니라 워크로드가 결정한다

인기 태그

trend ai news 2026-02 2026-01 2026-03 2025-12 tutorial devops backend

© 2026 Daewook Kwon. 일부 권리 보유

Powered by Jekyll with Chirpy theme

인기 태그

trend ai news 2026-02 2026-01 2026-03 2025-12 tutorial devops backend

새 버전의 콘텐츠를 사용할 수 있습니다.