본문으로 건너뛰기

3개 문서가 "training" 태그에 분류되었습니다

모든 태그 보기

GRPO/DPO 학습 Job

레이블링된 preference 데이터셋으로 NeMo-RL(GRPO)·TRL(DPO) 학습 Job을 Karpenter Spot 노드풀 + Volcano Gang Scheduling으로 실행하는 실전 구성.

NeMo 프레임워크

NVIDIA NeMo Framework의 분산 학습, 파인튜닝, TensorRT-LLM 변환 아키텍처