LLM Research Engineer (신입/경력)

◆ 직원 유형
정규직

◆ 영입인원
0 명

◆ 조직소개

Language Model Training팀은 카카오의 자체 Large Language Model인 Kanana를 A부터 Z까지 연구 및 개발하고, 이를 기반으로 카카오의 여러 서비스에 기여하고 있습니다. 자체 언어 모델인 Kanana를 최고 수준으로 개발하고 싶은 분들의 지원을 기다립니다.

참고) 연구결과

Kanana-2 개발기 (1): Pre-training에서의 의사결정들을 중심으로 (link)
Kanana-2 개발기 (2): 개선된 post-training recipe를 중심으로 (link)
데이터는 없지만 LLM은 학습하고 싶어 - Code, Math 데이터 개발기 (link)

◆ 업무내용

Post-training을 위한 데이터 수집 및 생성 기술 개발 및 연구
Post-training에서 필요한 환경 개발 및 이를 이용한 강화 학습
(e.g. environment scaling)
Post-training 학습 파이프라인 고도화를 위한 개발 및 연구
(e.g. domain-parallel rl)
Post-training 학습 효율화 연구 (e.g. asynchronous rl)
분산 컴퓨팅을 바탕으로 학습 코드 구현 및 최적화 (e.g. Multi-node 혹은 device에서 slime, verl 등의 프레임워크를 이용한 학습)

◆ 지원자격

CS/AI/ML 등 관련 전공 석사 이상 혹은 이에 준하는 관련 프로젝트 경험을 보유하신 분
Torch distributed, deepspeed, ray 등의 분산처리를 이용한 언어 모델 학습 경험을 보유하신 분
SFT 와 RL 등을 포함한 LLM Post-training 경험을 보유하신 분
연구/개발에 대한 지속적인 관심과 새로운 기술/업무에 대한 도전 정신을 가지신 분
연구/개발에 그치는 것뿐만 아니라 이를 서비스 시나리오로 연결하는 것에 대한 관심을 가지신 분

◆ 우대사항

LLM을 목적에 맞게 Fine-tuning 해서 서비스에 기여한 경험을 보유하신 분
Data/Model/Pipeline/Context/Expert Parallel 등 Model parallel 관련 연구 개발 경험을 보유하신 분
대규모 GPU/TPU 클러스터 환경에서 초거대 모델 학습을 위한 최적화 경험을 보유하신 분
강화 학습에 대한 이론과 엔지니어링 측면에서의 높은 이해도를 보유하신 분
LLM Post-training을 위한 데이터의 품질 향상과 평가를 위한 연구 개발 경험을 보유하신 분
LLM Post-training 관련 논문 출판 경험을 보유하신 분

◆ 지원프로세스

서류전형(CV 첨부 필수) > 코딩테스트 > 사전인터뷰 > 1차 인터뷰(사전과제) > 2차 인터뷰 > 처우 협의 > 최종 합격 및 입사

※ 지원서 제출 시 CV는 '포트폴리오' 란에 첨부해주시면 됩니다.
※ 영입 진행 상황에 따라 전형이 추가/변경될 수 있습니다.

◆ 근로제도
• 완전선택근무제
해당 포지션은 월 총 근무시간 범위 내에서 크루 스스로 하루의 업무 시작 및 종료 시간을 설정하여 자율적으로 몰입하여 근무할 수 있는 <완전선택근무제>를 적용받습니다.
• 월 1일 리커버리데이
매월 마지막 주 금요일은 크루의 휴식과 충전을 위한 <리커버리데이>로 운영됩니다.
• 주 1일 원격근무
업무와 협업의 효율성을 우선으로 하여, 리커버리데이가 없는 주에는 <주 1일 원격근무>가 가능합니다.

#Algorithm/ML