[NAVER Cloud] HyperCLOVA X Multimodal Model Recipe (체험형 인턴)

담당업무 ※ 인턴십 기간 중 부여된 과제에 따라, 아래 업무 중 일부를 중심으로 실무를 경험하게 됩니다. • Vision Language Model 의 주기적인 대규모 학습 공정 수행 • Video 등의 새로운 모달리티 및 Computer-Use 등의 추가 시나리오 대응 • Vision MOE, Vision-RLHF 공정을 위한 데이터 확보 • Multimodal LLM 학습 전체 단계에 이르는 데이터셋 설계 및 평가 • 광범위한 Domain & Task 의 Multimodal LLM 데이터에 대하여 서로의 영향도 및 최종 성능에 미치는 영향 탐구 • 시나리오 특화 데이터 확보 및 최종 모델 성능 영향 증진 • Multimodal Data Filtering Method 개발 및 모델 학습·분석 • 최적의 Data Recipe 탐색을 위한 Curation Method 개발 및 모델 학습·분석