Daewook's Dev Log

Backend · Infra · AI Prototyping

홈
카테고리
태그
아카이브
정보

홈 태그 llm

태그

llm 11

MMLU와 HumanEval, 점수 하나로 모델을 뽑으면 망하는 이유: 2026년 3월 기준 LLM 벤치마크 해석법 2026/03/08
2026년 3월 기준 LoRA/QLoRA 파인튜닝 실전 튜토리얼: 4-bit NF4 + PEFT + TRL로 “효율”을 끝까지 뽑아내기 2026/03/03
Chain-of-Thought(CoT) 2026 심층 가이드: “생각을 쓰게”가 아니라 “비용/정확도”를 최적화하라 2026/02/26
LLM 성능평가의 함정: 2026년 2월 기준 MMLU·HumanEval 벤치마크를 “숫자”가 아니라 “방법”으로 읽는 법 2026/02/19
2026년 2월 기준: LoRA/QLoRA로 LLM Fine-tuning을 “현실적으로” 끝내는 방법 (원리+실전) 2026/02/14
생각을 “보이게” 만들지 말고 “결과를 강하게” 만들자: 2026년형 Chain of Thought 고급 프롬프트 최적화 2026/02/09
MMLU 점수 90점의 함정: 2026년 2월 기준 LLM 벤치마크(MMLU·HumanEval) 해석 가이드 2026/02/02
LoRA vs QLoRA, 2026년 1월 기준 “진짜 효율”로 LLM Fine-tuning 하는 법 (원리+실전코드) 2026/01/28
Chain of Thought, 2026년식으로 다시 쓰기: “생각을 길게”가 아니라 “검증 가능한 추론 파이프라인”을 설계하라 2026/01/23
AI로 빠르게 프로토타이핑하는 나만의 방법 🤖 2025/12/20
LangChain으로 RAG 시스템 구축하기 📚 2025/12/10

최근 업데이트

도구를 “잘 쓰는” 에이전트 만들기: 2026년 3월 기준 Function Calling 구현 심층 분석
3월(2026) AI 스타트업 투자·M&A, ‘모델’보다 ‘인프라/워크플로우’로 돈이 몰린다
LLM 서빙 3대장(vLLM·TGI·Ollama) 2026년 3월판 배포 가이드: 로컬부터 프로덕션까지 “성능 곡선”으로 결정하기
GPT·Claude·Gemini, 2026년 3월 ‘신규 LLM’ 러시: 무엇이 바뀌었고 개발자는 무엇을 준비해야 하나
벡터DB 4대장(Pinecone·Weaviate·Qdrant·Chroma) 2026년 3월 실전 선택 가이드: “성능”은 벤치마크가 아니라 워크로드가 결정한다

인기 태그

trend ai news 2026-02 2026-01 2026-03 2025-12 tutorial devops backend

© 2026 Daewook Kwon. 일부 권리 보유

Powered by Jekyll with Chirpy theme

인기 태그

trend ai news 2026-02 2026-01 2026-03 2025-12 tutorial devops backend

새 버전의 콘텐츠를 사용할 수 있습니다.