LLM Research Engineer (Pre-training) (신입/경력)

카카오, LLM 사전 학습 연구 엔지니어 신입·경력 공개 채용

카카오가 자사 Language Model Training팀에서 LLM Research Engineer(Pre-training) 직무의 신입·경력 채용을 진행한다. 이 팀은 카카오의 자체 대규모 언어 모델인 Kanana를 연구·개발하고, 이를 기반으로 카카오 서비스 전반에 기여하는 역할을 맡고 있다. 이번 채용은 해당 모델의 사전 학습 전 과정에 직접 참여할 연구 엔지니어를 찾는 자리로, 정규직으로 채용될 예정이다.

합류하게 되면 추론 및 학습에 효율적인 LLM 구조 탐색 및 최적화(e.g. Mixture of Experts, Gated Delta Net, Kimi Linear), 비용 효율화를 위한 학습 최적화 및 데이터 최적화(e.g., Fp-8 training, Dataset mixture search), 비용 효율적인 언어 모델 학습을 위한 알고리즘 연구 및 응용(e.g., Pruning & Distillation, Hyperparameter transfer, Scaling law, Optimizer), LLM 학습을 위한 대규모 데이터 수집, 생성 및 메타 정보 부착기술 개발 및 연구(e.g. Synthetic dataset generation) 업무를 담당하게 된다. 모델 구조의 효율화부터 학습 알고리즘 연구, 데이터 파이프라인 구축까지 LLM 사전 학습의 전 과정에 걸친 폭넓은 연구 개발을 경험하게 된다.

지원 자격으로는 CS·AI·ML 등 관련 전공 석사 이상 혹은 이에 준하는 관련 프로젝트 경험을 보유하신 분, Data·Model·Pipeline·Context·Expert Parallel 등 Model parallel 기반의 모델 학습 경험, 연구·개발에 대한 지속적인 관심과 새로운 기술·업무에 대한 도전 정신을 가지신 분을 요구한다. 우대사항으로는 Low-precision training 관련 연구·개발 경험(e.g., FP8/MXFP4 학습 시 수치 안정성 확보, loss scaling, tensor-wise/block-wise scaling 전략 설계), Quantization-Aware Training(QAT) 및 저비트 양자화(W4A8, W4A16 등) 환경에서의 LLM 학습 경험(e.g., STE 기반 학습, rotation/smoothing 기법 적용, PTQ 대비 품질 회복), Knowledge Distillation을 활용한 모델 압축 연구 경험(e.g., logit/feature-level distillation, on-policy distillation, teacher-student 학습 파이프라인 설계), LLM 관련 kernel 개발 경험(e.g., Triton, CUDA 기반 custom kernel), Data·Model·Pipeline·Context·Expert Parallel 등 분산 학습 전략 설계 및 프레임워크(e.g., Megatron-LM, DeepSpeed, FSDP) 기여 경험, LLM 학습 데이터의 품질 향상과 평가를 위한 연구 개발 경험 및 페타바이트 수준의 텍스트 데이터 수집 및 분산 처리 경험, 대규모 클러스터 환경(e.g., GPU·TPU)에서 초거대 모델 학습을 위한 최적화 경험(e.g., communication overlap, activation recomputation, memory-efficient optimizer)을 갖춘 지원자를 우대한다.

이번 채용은 정규직으로 경기도 판교에서 근무하게 되며, 지원 접수는 채용 시 마감으로 운영된다. 지원 절차는 서류전형(CV 첨부 필수)을 시작으로 코딩테스트, 사전인터뷰, 1차 인터뷰(사전과제), 2차 인터뷰, 처우 협의를 거쳐 최종 합격 및 입사로 이어진다. 자세한 내용은 '카카오'의 홈페이지에서 확인할 수 있다.