¡ß Á÷¿ø À¯Çü
Á¤±ÔÁ÷
¡ß ¿µÀÔÀοø
0 ¸í
¡ß Á¶Á÷¼Ò°³
Language Model TrainingÆÀÀº īī¿ÀÀÇ ÀÚü Large Language ModelÀÎ Kanana¸¦ AºÎÅÍ Z±îÁö ¿¬±¸ ¹× °³¹ßÇϰí, À̸¦ ±â¹ÝÀ¸·Î īī¿ÀÀÇ ¿©·¯ ¼ºñ½º¿¡ ±â¿©Çϰí ÀÖ½À´Ï´Ù. ÀÚü ¾ð¾î ¸ðµ¨ÀÎ Kanana¸¦ ÃÖ°í ¼öÁØÀ¸·Î °³¹ßÇÏ°í ½ÍÀº ºÐµéÀÇ Áö¿øÀ» ±â´Ù¸³´Ï´Ù.
Âü°í) ¿¬±¸°á°ú
- Kanana-2 °³¹ß±â (1): Pre-training¿¡¼ÀÇ ÀÇ»ç°áÁ¤µéÀ» Áß½ÉÀ¸·Î (link)
- Kanana-2 °³¹ß±â (2): °³¼±µÈ post-training recipe¸¦ Áß½ÉÀ¸·Î (link)
- µ¥ÀÌÅÍ´Â ¾øÁö¸¸ LLMÀº ÇнÀÇÏ°í ½Í¾î - Code, Math µ¥ÀÌÅÍ °³¹ß±â (link)
¡ß ¾÷¹«³»¿ë
- Post-trainingÀ» À§ÇÑ µ¥ÀÌÅÍ ¼öÁý ¹× »ý¼º ±â¼ú °³¹ß ¹× ¿¬±¸
- Post-training¿¡¼ ÇÊ¿äÇÑ È¯°æ °³¹ß ¹× À̸¦ ÀÌ¿ëÇÑ °È ÇнÀ
(e.g. environment scaling) - Post-training ÇнÀ ÆÄÀÌÇÁ¶óÀÎ °íµµÈ¸¦ À§ÇÑ °³¹ß ¹× ¿¬±¸
(e.g. domain-parallel rl) - Post-training ÇнÀ È¿À²È ¿¬±¸ (e.g. asynchronous rl)
- ºÐ»ê ÄÄÇ»ÆÃÀ» ¹ÙÅÁÀ¸·Î ÇнÀ ÄÚµå ±¸Çö ¹× ÃÖÀûÈ (e.g. Multi-node ȤÀº device¿¡¼ slime, verl µîÀÇ ÇÁ·¹ÀÓ¿öÅ©¸¦ ÀÌ¿ëÇÑ ÇнÀ)
¡ß Áö¿øÀÚ°Ý
- CS/AI/ML µî °ü·Ã Àü°ø ¼®»ç ÀÌ»ó ȤÀº ÀÌ¿¡ ÁØÇÏ´Â °ü·Ã ÇÁ·ÎÁ§Æ® °æÇèÀ» º¸À¯ÇϽŠºÐ
- Torch distributed, deepspeed, ray µîÀÇ ºÐ»ê󸮸¦ ÀÌ¿ëÇÑ ¾ð¾î ¸ðµ¨ ÇнÀ °æÇèÀ» º¸À¯ÇϽŠºÐ
- SFT ¿Í RL µîÀ» Æ÷ÇÔÇÑ LLM Post-training °æÇèÀ» º¸À¯ÇϽŠºÐ
- ¿¬±¸/°³¹ß¿¡ ´ëÇÑ Áö¼ÓÀûÀÎ °ü½É°ú »õ·Î¿î ±â¼ú/¾÷¹«¿¡ ´ëÇÑ µµÀü Á¤½ÅÀ» °¡Áö½Å ºÐ
- ¿¬±¸/°³¹ß¿¡ ±×Ä¡´Â °Í»Ó¸¸ ¾Æ´Ï¶ó À̸¦ ¼ºñ½º ½Ã³ª¸®¿À·Î ¿¬°áÇÏ´Â °Í¿¡ ´ëÇÑ °ü½ÉÀ» °¡Áö½Å ºÐ
¡ß ¿ì´ë»çÇ×
- LLMÀ» ¸ñÀû¿¡ ¸Â°Ô Fine-tuning ÇØ¼ ¼ºñ½º¿¡ ±â¿©ÇÑ °æÇèÀ» º¸À¯ÇϽŠºÐ
- Data/Model/Pipeline/Context/Expert Parallel µî Model parallel °ü·Ã ¿¬±¸ °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
- ´ë±Ô¸ð GPU/TPU Ŭ·¯½ºÅÍ È¯°æ¿¡¼ ÃÊ°Å´ë ¸ðµ¨ ÇнÀÀ» À§ÇÑ ÃÖÀûÈ °æÇèÀ» º¸À¯ÇϽŠºÐ
- °È ÇнÀ¿¡ ´ëÇÑ À̷аú ¿£Áö´Ï¾î¸µ Ãø¸é¿¡¼ÀÇ ³ôÀº ÀÌÇØµµ¸¦ º¸À¯ÇϽŠºÐ
- LLM Post-trainingÀ» À§ÇÑ µ¥ÀÌÅÍÀÇ Ç°Áú Çâ»ó°ú Æò°¡¸¦ À§ÇÑ ¿¬±¸ °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
- LLM Post-training °ü·Ã ³í¹® ÃâÆÇ °æÇèÀ» º¸À¯ÇϽŠºÐ
¡ß Áö¿øÇÁ·Î¼¼½º
¼·ùÀüÇü(CV ÷ºÎ Çʼö) > ÄÚµùÅ×½ºÆ® > »çÀüÀÎÅͺä > 1Â÷ ÀÎÅͺä(»çÀü°úÁ¦) > 2Â÷ ÀÎÅͺä > ó¿ì ÇùÀÇ > ÃÖÁ¾ ÇÕ°Ý ¹× ÀÔ»ç
¡Ø Áö¿ø¼ Á¦Ã⠽à CV´Â 'Æ÷Æ®Æú¸®¿À' ¶õ¿¡ ÷ºÎÇØÁÖ½Ã¸é µË´Ï´Ù.
¡Ø ¿µÀÔ ÁøÇà »óȲ¿¡ µû¶ó ÀüÇüÀÌ Ãß°¡/º¯°æµÉ ¼ö ÀÖ½À´Ï´Ù.
¡ß ±Ù·ÎÁ¦µµ
• ¿ÏÀü¼±Åñٹ«Á¦
ÇØ´ç Æ÷Áö¼ÇÀº ¿ù ÃÑ ±Ù¹«½Ã°£ ¹üÀ§ ³»¿¡¼ Å©·ç ½º½º·Î ÇÏ·çÀÇ ¾÷¹« ½ÃÀÛ ¹× Á¾·á ½Ã°£À» ¼³Á¤ÇÏ¿© ÀÚÀ²ÀûÀ¸·Î ¸ôÀÔÇÏ¿© ±Ù¹«ÇÒ ¼ö ÀÖ´Â <¿ÏÀü¼±Åñٹ«Á¦>¸¦ Àû¿ë¹Þ½À´Ï´Ù.
• ¿ù 1ÀÏ ¸®Ä¿¹ö¸®µ¥ÀÌ
¸Å¿ù ¸¶Áö¸· ÁÖ ±Ý¿äÀÏÀº Å©·çÀÇ È޽İú ÃæÀüÀ» À§ÇÑ <¸®Ä¿¹ö¸®µ¥ÀÌ>·Î ¿î¿µµË´Ï´Ù.
• ÁÖ 1ÀÏ ¿ø°Ý±Ù¹«
¾÷¹«¿Í Çù¾÷ÀÇ È¿À²¼ºÀ» ¿ì¼±À¸·Î ÇÏ¿©, ¸®Ä¿¹ö¸®µ¥À̰¡ ¾ø´Â ÁÖ¿¡´Â <ÁÖ 1ÀÏ ¿ø°Ý±Ù¹«>°¡ °¡´ÉÇÕ´Ï´Ù.
#Algorithm/ML