[ºÎ¼¼Ò°³]
HyperCLOVA X´Â Çѱ¹¾î¿Í Çѱ¹ ¹®È¿¡ Æ¯ÈµÈ Foundation Model·Î NAVERÀÇ ´Ù¾çÇÑ ºñÁî´Ï½º¿Í ¿¬±¸ °³¹ß¿¡ Æø³Ð°Ô Ȱ¿ëµÇ°í ÀÖ½À´Ï´Ù. ÀúÈñ ÆÀÀº HyperCLOVA XÀÇ Alignment LearningÀ» ´ã´çÇϸç, ML/AI ±â¼úÀ» Ȱ¿ëÇØ LLMÀÇ ¼º´É°ú °¡´É¼ºÀ» È®ÀåÇÏ´Â µ¥ ÁýÁßÇϰí ÀÖ½À´Ï´Ù. Alignment LearningÀº AI ¸ðµ¨ÀÌ Àΰ£ÀÇ °¡Ä¡°ü°ú Àǵµ¸¦ Á¤È®È÷ ÀÌÇØÇÔÀ¸·Î½á »ç¿ëÀÚ¿¡°Ô ÃÖ´ëÇÑÀÇ À¯¿ë¼º(Helpfulness)À» Á¦°øÇÏ´Â µ¿½Ã¿¡ ³ôÀº ¼öÁØÀÇ ¾ÈÀü¼º(Safety)À» È®º¸ÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù. À̸¦ À§ÇØ °¨µ¶ÇнÀ, °ÈÇнÀ µî ´Ù¾çÇÑ ML ¾Ë°í¸®ÁòºÎÅÍ µ¥ÀÌÅÍ ÇÕ¼º ¹× Á¤Á¦, Æò°¡ÁöÇ¥ °³¹ß µî LLM ÇнÀ°ú °ü·ÃµÈ ´Ù¾çÇÑ ±â¼úµéÀ» ¿¬±¸°³¹ßÇϰí ÀÖ½À´Ï´Ù. HyperCLOVA X°¡ Agent·Î¼ º¹ÀâÇÑ ¹®Á¦¸¦ ´Ü°èÀûÀ¸·Î ÇØ°áÇϱâ À§ÇØ Ãß·Ð(reasoning)À» Çϰí, ÇÔ¼ö È£Ãâ(function call)À̳ª ÄÚµå ÀÎÅÍÇÁ¸®ÅÍ(code interpreter)¿Í °°Àº ´Ù¾çÇÑ µµ±¸¸¦ Ȱ¿ëÇÏ¿© ´Éµ¿ÀûÀ¸·Î ¹®Á¦¸¦ ÇØ°áÇϵµ·Ï ÇнÀÇϴ ü°è¸¦ ±¸ÃàÇϰí ÀÖ½À´Ï´Ù. ÀúÈñ´Â ÀÌ¿Í °°ÀÌ ÀÌ·ÐÀûÀÎ ¿¬±¸ºÎÅÍ ½ÇÁ¦ ¼ºñ½º ÀÀ¿ë±îÁö LLM Àü ºÐ¾ß¿¡ °ÉÃÄ µµÀüÀûÀÎ °úÁ¦µéÀ» ޱ¸Çϰí ÀÖ½À´Ï´Ù. AI°¡ »ç¶÷°ú ´õ ±íÀÌ »óÈ£ÀÛ¿ëÇϰí, ½º½º·Î Ãß·ÐÀ» ÅëÇØ ¹®Á¦¸¦ ÇØ°áÇÏ´Â ¶È¶ÈÇÑ Agent°¡ µÇµµ·Ï ¸¸µå´Â ¹Ì¼Ç¿¡ ¿Á¤ÀûÀ¸·Î ÇÔ²²ÇÒ ºÐµéÀ» ±â´Ù¸®°í ÀÖ½À´Ï´Ù.
[´ã´ç¾÷¹«]
- LLM ÇнÀ ¾Ë°í¸®Áò °íµµÈ: SFT, Online/Offline RL µîÀÇ ÇнÀ ½ÇÇè ¹× Reasoning, Function Call, Code Agent µî post-training Àü¹ÝÀÇ ¼º´É °³¼±¿¡ ÇÊ¿äÇÑ ¿¬±¸¿Í ½ÇÇè µî
- µ¥ÀÌÅÍ ÇÕ¼º ¹× Æò°¡: ¸ðµ¨ ÇнÀ¿¡ ÇÊ¿äÇÑ °íÄ÷¸®Æ¼ µ¥ÀÌÅÍ ÇÕ¼º ¹× ÇÊÅ͸µ ¹× ÇнÀ °á°ú¸¦ È®ÀÎÇÒ ¼ö ÀÖ´Â Á¤·®Àû Æò°¡ ÁöÇ¥ °³¹ß µî
- LLM ÇнÀ¿¡ ÇÊ¿äÇÑ ¿£Áö´Ï¾î¸µ: ´ë±Ô¸ð ºÐ»ê ÇнÀ, MLOps, ±×¸®°í ÇнÀ Àü °úÁ¤À» ¹ÝÀÚµ¿ÈÇÒ ¼ö ÀÖ´Â ÆÄÀÌÇÁ¶óÀÎ °³¹ß, MoE °³¹ß µî
- LLM Safety Çâ»ó: HCXÀÇ Safety Policy¸¦ Á¤ÀÇÇϰí, À̸¦ ÇнÀÇϱâ À§ÇÑ µ¥ÀÌÅÍ Á¦ÀÛ ¹× Æò°¡ ÁöÇ¥ °³¼±, Rule-based Reward ModelÀ» ÅëÇÑ °ÈÇнÀ ½ÇÇè µî
- Inference ÃÖÀûÈ ¸ðµ¨¸µ: Speculative Decoding, Knowledge Distillation°ú °°Àº Ãß·Ð °úÁ¤À» È¿À²ÈÇÒ ¼ö ÀÖ´Â ½ÇÇè µî
[ÀÚ°Ý¿ä°Ç]
- ±¹³»¡¤¿Ü Á¤±Ô´ëÇÐ AI/ML ºÐ¾ß Àü°ø ¹Ú»ç °úÁ¤ Á¹¾÷ÀÚ È¤Àº AI/ML ºÐ¾ß Àü°ø ¼®»ç °úÁ¤ Á¹¾÷ ÈÄ °ü·Ã ¾÷¹« °æÇè N³â ÀÌ»ó º¸À¯ÇϽŠºÐ
- ´ë±Ô¸ð ºÐ»ê GPU ȯ°æ¿¡¼ LLM ¸ðµ¨ÀÇ ÇнÀ ¹× Ãß·ÐÀ» À§ÇÑ Äڵ庣À̽º °³¹ßÇÑ °æÇèÀÌ ÀÖÀ¸½Å ºÐ
- Data curation/synthesis/augmentation/refinement °ü·Ã ¾÷¹« ¹× ¿¬±¸ °æÇèÀÌ ÀÖÀ¸½Å ºÐ
- ÀÚµ¿ÈµÈ Æò°¡ ÁöÇ¥(metric) °³¹ßÀ» Æ÷ÇÔÇÏ¿© ML ½ÇÇèÀ» ¼³°èÇÏ°í ±× °á°ú¸¦ ºÐ¼®ÇÑ °æÇèÀÌ ÀÖÀ¸½Å ºÐ
- Pytorch/Huggingface/DeepSpeed/FSDP/vLLM/trl/verl µî LLM °ü·Ã ¿ÀǼҽº ¶óÀ̺귯¸® »ç¿ë ¹× °³¹ß °æÇèÀÌ ÀÖÀ¸½Å ºÐ
[¿ì´ë»çÇ×]
- LLM¿¡¼ Áß±Ô¸ð Å©±â ÀÌ»ó ¸ðµ¨(7B~70B)ÀÇ ºÐ»ê ÇнÀ °æÇèÀÌ ÀÖ´Â ºÐ(DeepSpeed, FSDP, Megatron µî)
- ½ÇÁ¦ Á¦Ç° ¶Ç´Â ¼ºñ½º¿¡ Àû¿ëµÈ LLM ¸ðµ¨ ÇнÀ ¹× ¹èÆ÷ °æÇèÀÌ ÀÖ´Â ºÐ
- ICML, ICLR, NeurIPS, ACL, EMNLP, NAACL µî AI/NLP ºÐ¾ß žƼ¾î ÇÐȸ¿¡¼ ³í¹® ¹ßÇ¥ ÀÌ·ÂÀÌ ÀÖ´Â ºÐ
[ÀüÇüÀýÂ÷]
¼·ù ÀüÇü(±â¾÷¹®ÈÀûÇÕµµ °Ë»ç ¹× Á÷¹« Å×½ºÆ® Æ÷ÇÔ) ¢º Á÷¹« ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× Á¾ÇÕ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý
¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇüº° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù.
¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³»µå¸± ¿¹Á¤ÀÔ´Ï´Ù.
[±Ù¹«Áö]
°æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮)
¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.
[±âŸ»çÇ×]
- º» °ø°í´Â Ÿ °ø°í¿Í Áߺ¹Áö¿øÀÌ ºÒ°¡´ÉÇϸç, ±âÁøÇàÇÑ Æ÷Áö¼Ç¿¡ ´ëÇÑ ÀüÇüÀÌ ¸ðµÎ ¸¶¹«¸® µÇ¸é ´Ù¸¥ Æ÷Áö¼ÇÀ¸·Î Áö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- ÇØ¿Ü ÃâÀå¿¡ °á°Ý »çÀ¯°¡ ¾ø´Â ºÐ¸¸ Áö¿ø °¡´ÉÇÕ´Ï´Ù.
- º´¿ª Àǹ«¸¦ ÇÊÇÑ ÀÚ È¤Àº ¸éÁ¦µÈ ÀÚ¿¡ ÇÑÇØ ÀÔ»çÁö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- Áö¿ø¼ »ó ÇãÀ§ ±âÀç°¡ Àְųª Á¦Ãâ ¼·ù°¡ ÇãÀ§ÀÎ °æ¿ì ÇÕ°ÝÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- Á¦ÃâµÈ Áö¿ø¼´Â [My page- Áö¿øÇöȲ]¿¡¼ È®ÀÎ °¡´ÉÇϸç, °ø°í ¸¶°¨ Àü±îÁö ȨÆäÀÌÁö¿¡¼ ¼öÁ¤ ¹× Áö¿ø öȸ°¡ °¡´ÉÇÕ´Ï´Ù.
- º» °ø°í´Â ÀÎÀç ¼±¹ß ¿Ï·á ½Ã Á¶±â ¸¶°¨µÉ ¼ö ÀÖÀ¸¸ç, ÇÊ¿ä ½Ã ¸ðÁý ±â°£ÀÌ ¿¬ÀåµÉ ¼ö ÀÖ½À´Ï´Ù.
- ±¹°¡À¯°øÀÚ ¹× Àå¾ÖÀÎ µî Ãë¾÷º¸È£ ´ë»óÀÚ´Â °ü°è¹ý·É¿¡ µû¶ó ¿ì´ëÇÕ´Ï´Ù.
- ±¹°¡À¯°øÀÚÀÇ °¡»êÁ¡ ºÎ¿©¸¦ ¹Þ±â À§Çؼ´Â º»ÀÎÀÌ 'Ãë¾÷Áö¿ø ´ë»óÀÚ Áõ¸í¼'¸¦ ȸ»ç¿¡ Á¦ÃâÇØ¾ß ÇÕ´Ï´Ù.
- Á¦ÃâÇØÁֽŠÁö¿ø¼ÀÇ °ËÅä °á°ú ¹ßÇ¥´Â Áö¿ø¼¿¡ µî·ÏÇϽŠÀ̸ÞÀÏ·Î °³º° ¾È³»µå¸³´Ï´Ù.
- ÀÔ»ç ÈÄ 3°³¿ùÀÇ ¼ö½À ±â°£À» Àû¿ëÇÏ¸ç Æò°¡¿¡ µû¶ó ¼ö½À ±â°£ÀÌ ¿¬ÀåµÇ°Å³ª ä¿ëÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- ¹®ÀÇ»çÇ×Àº NAVER Cloud ä¿ë ȨÆäÀÌÁö 1:1 ¹®ÀÇ·Î Á¢¼öÇØÁֽñ⠹ٶø´Ï´Ù.