[NAVER Cloud] Model Driven Multimodal LLM Curation (경력)

담당업무 Model Driven Vision DATA Curation • Vision Language Model 생산 전체 단계에 이르는 학습 및 평가 데이터 설계 • 데이터 품질 향상을 위한 모델 기반의 학습 데이터 Assessment 및 Filtering 에 대한 방법론 탐구 • 최적의 Recipe 탐색을 위한 Curation 방법론 개발 및 모델 학습 • 광범위한 Domain & Task의 Dataset에 대하여 서로의 영향도 및 최종 모델 성능에 미치는 영향 탐구 • 문제 풀이 및 Reasoning 영역을 포함한 특화 데이터 확보 및 최종 모델 성능 영향 증진 • Foundation 모델 개발을 위한 대규모 Pretraining 데이터 설계 • Reasoning 성능 향상을 위한 RLVR Reward 및 관련 데이터 설계 자격요건