ºÎ¼¼Ò°³
ÀúÈñ ºÎ¼´Â HyperCLOVA ¸¦ ±â¹ÝÀ¸·Î, À̹ÌÁö¿Í ºñµð¿À µîÀÇ Multimodal µµ¸ÞÀÎÀ¸·ÎÀÇ ±â´É È®ÀåÀ» À§ÇÑ ¾ÆÅ°ÅØÃ³ ¼³°è ¹× ¸ðµ¨ »ý»êÀ» ´ã´çÇÏ´Â ÆÀ ÀÔ´Ï´Ù. ÃÖÁ¾ÀûÀ¸·Î´Â Native Multimodal ¹× ÀÔÃâ·Â Ãø¸é¿¡¼ Any to Any ±îÁöÀÇ È®ÀåÀ» ¸ñÇ¥·Î Çϰí ÀÖ½À´Ï´Ù.
2024³â 9¿ù Çѱ¹ ÃÖÃÊ·Î Vision LLM ±â´ÉÀ» HyperCLOVA X ¿¡ ¼ºñ½º ½ÃÀÛÇÏ¿´°í ƯÈ÷ ¿ÃÇØ 4¿ù¿¡´Â ´ëÇѹα¹ AI »ýŰ踦 À§ÇÏ¿© ¿ª½Ã ±¹³» ÃÖÃÊ·Î »ó¾÷¿ë ¿ÀǼҽº AI ¸ðµ¨À» °ø°³Çß½À´Ï´Ù(¸µÅ©). Global Frontier Big Tech ¿Í °æÀïÇϱâ À§ÇØ NAVERÀÇ ÀÚ»êÀÎ µ¥ÀÌÅÍ¿Í ±â¼ú Ãø¸é¿¡¼ ¿À·§µ¿¾È ÃàÀûµÈ °æÇè°ú ¿ì¼öÇÑ ÀÎÀ縦 ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ÇÁ·ÎÁ§Æ®¿¡ µµÀüÇϰí ÀÖ½À´Ï´Ù.
´ë¿ë·®ÀÇ Computing°ú ¾çÁúÀÇ µ¥ÀÌÅÍ´Â Machine Learning ¿¡ ÀÖ¾î ÇÙ½ÉÀÔ´Ï´Ù. Computing ÀÚ¿øÀº »ý»êÀ» ¹Ýº¹ÇÒ ¶§¸¶´Ù ºñ¿ë¿¡ »êÀÔÀÌ µÇ±â¿¡, ÇнÀ È¿À²¼º ¹× ¼º´É Çâ»óÀ» À§ÇØ µ¥ÀÌÅ͸¦ Á¤±³ÇÏ°Ô Filtering Çϰí CurationÇÏ´Â °ÍÀÌ Áß¿äÇÕ´Ï´Ù. ÇØ´ç µ¥ÀÌÅ͵éÀ» ¿©·¯ ¹æ¹ý·ÐÀ» ÅëÇÏ¿© (Model Driven) ÇнÀ °øÁ¤À» ´ÜÃàÇÏ°í µ¥ÀÌÅÍ¿Í ¸ðµ¨ÀÇ »óÈ£ÀÛ¿ëÀ» ޱ¸Çϸç SOTA ¼öÁØÀÇ ¼º´É °³¼±À» ¸ñÇ¥·Î ÇÕ´Ï´Ù.
´ã´ç¾÷¹«
Model Driven Vision DATA Curation
• Vision Language Model »ý»ê Àüü ´Ü°è¿¡ À̸£´Â ÇнÀ ¹× Æò°¡ µ¥ÀÌÅÍ ¼³°è
• µ¥ÀÌÅÍ Ç°Áú Çâ»óÀ» À§ÇÑ ¸ðµ¨ ±â¹ÝÀÇ ÇнÀ µ¥ÀÌÅÍ Assessment ¹× Filtering ¿¡ ´ëÇÑ ¹æ¹ý·Ð ޱ¸
• ÃÖÀûÀÇ Recipe Ž»öÀ» À§ÇÑ Curation ¹æ¹ý·Ð °³¹ß ¹× ¸ðµ¨ ÇнÀ
• ±¤¹üÀ§ÇÑ Domain & TaskÀÇ Dataset¿¡ ´ëÇÏ¿© ¼·ÎÀÇ ¿µÇâµµ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É¿¡ ¹ÌÄ¡´Â ¿µÇâ Ž±¸
• ¹®Á¦ Ç®ÀÌ ¹× Reasoning ¿µ¿ªÀ» Æ÷ÇÔÇÑ Æ¯È µ¥ÀÌÅÍ È®º¸ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É ¿µÇâ ÁõÁø
• Foundation ¸ðµ¨ °³¹ßÀ» À§ÇÑ ´ë±Ô¸ð Pretraining µ¥ÀÌÅÍ ¼³°è
• Reasoning ¼º´É Çâ»óÀ» À§ÇÑ RLVR Reward ¹× °ü·Ã µ¥ÀÌÅÍ ¼³°è
ÀÚ°Ý¿ä°Ç
• ¹Ú»ç ÇÐÀ§ º¸À¯ÀÚ È¤Àº 2³â ÀÌ»óÀÇ À¯°ü ¾÷¹« °æ·ÂÀ» º¸À¯ÇϽŠºÐ
• Vision Language Model (LLaVA, Qwen VL, DeepSeek VL µî)ÀÇ ±¸Á¶ ¹× ÇнÀ °úÁ¤¿¡ ´ëÇÑ »ó¼¼ÇÑ ÀÌÇØµµ¸¦ °®Ã߽ŠºÐ
• Code Level ÀÇ °æÇèÀ» º¸À¯ÇϽŠºÐ
• Distributed Training ¹× ¸ðµ¨ °¡¼Ó¿¡ ´ëÇÑ ÀÌÇØ ¶Ç´Â °æÇè (DeepSpeed Zero, Megatron, Nemo, vLLM, sglang µî)À» º¸À¯ÇϽŠºÐ
• °¢ ÇнÀ ´Ü°è º° Vision LLM µ¥ÀÌÅÍÀÇ Æ¯¼º, Á¾·ù¿¡ ´ëÇÑ ÀÌÇØ°¡ ÀÖÀ¸½Å ºÐ
• Python ¹× LLM °³¹ß °ü·Ã Library, FW, Platform(Pytorch, Hugging Face) Ȱ¿ë ´É·ÂÀ» º¸À¯ÇϽŠºÐ
¿ì´ë»çÇ×
• »ó¿ë ¼öÁØÀÇ Vision Language Model °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ
• ´ë±Ô¸ð GPU Infra ¿î¿ë °æÇè (Multinode, Slurm, K8S)À» º¸À¯ÇϽŠºÐ
• ´ë±Ô¸ð µ¥ÀÌÅÍ ¿£Áö´Ï¾î¸µ °æÇè (Ray, Spark)À» º¸À¯ÇϽŠºÐ
• Top-tier ³í¹® 1ÀúÀÚ ÀÌ·ÂÀÌ ÀÖÀ¸½Å ºÐ
• LLM, VLM °ü·Ã ÇÐÀ§¸¦ º¸À¯ÇϽŠºÐ
• Challenge Âü°¡ °æÇè ¶Ç´Â »óÀ§ ÀÔ»ó °æÇèÀ» º¸À¯ÇϽŠºÐ
• ÃÖ¼Ò 3°³¿ù ÀÌ»ó ¼Ò¿äµÈ ÆÀ ÇÁ·ÎÁ§Æ®¸¦ ¼º°øÀûÀ¸·Î ¿Ï·áÇÑ °æÇè°ú ÇØ´ç ÇÁ·ÎÁ§Æ®¸¦ ¼º°øÀ¸·Î À̲ö µ¥¿¡ ±â¿©µµ°¡ ³ôÀ¸½Å ºÐ
• »ó±â ´ã´ç¾÷¹« Áß Çϳª¸¦ ÁøÇàÇÔ¿¡ ÀÖ¾î ÃÖ°í ¼öÁØÀÇ ¿ª·®À» º¸À¯ÇϽŠºÐ
ÀüÇüÀýÂ÷ ¹× ±âŸ»çÇ×
[ÀüÇüÀýÂ÷]
¼·ù ÀüÇü(±â¾÷¹®ÈÀûÇÕµµ °Ë»ç ¹× Á÷¹« Å×½ºÆ® Æ÷ÇÔ) ¢º 1Â÷ ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× 2Â÷ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý
¡Ø 1Â÷ ÀÎÅͺä ÀüÇü¿¡ Job Talk ¹× ³í¹® ¼¼¹Ì³ª°¡ Æ÷Ç﵃ ¼ö ÀÖ½À´Ï´Ù.
¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿ µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇü º° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù.
¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³» µå¸± ¿¹Á¤ÀÔ´Ï´Ù.
[±Ù¹«Áö]
°æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮)
¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.