ºÎ¼­¼Ò°³ ÀúÈñ ºÎ¼­´Â HyperCLOVA ¸¦ ±â¹ÝÀ¸·Î, À̹ÌÁö¿Í ºñµð¿À µîÀÇ Multimodal µµ¸ÞÀÎÀ¸·ÎÀÇ ±â´É È®ÀåÀ» À§ÇÑ ¾ÆÅ°ÅØÃ³ ¼³°è ¹× ¸ðµ¨ »ý»êÀ» ´ã´çÇÏ´Â ÆÀ ÀÔ´Ï´Ù. ÃÖÁ¾ÀûÀ¸·Î´Â Native Multimodal ¹× ÀÔÃâ·Â Ãø¸é¿¡¼­ Any to Any ±îÁöÀÇ È®ÀåÀ» ¸ñÇ¥·Î Çϰí ÀÖ½À´Ï´Ù. 2024³â 9¿ù Çѱ¹ ÃÖÃÊ·Î Vision LLM ±â´ÉÀ» HyperCLOVA X ¿¡ ¼­ºñ½º ½ÃÀÛÇÏ¿´°í ƯÈ÷ ¿ÃÇØ 4¿ù¿¡´Â ´ëÇѹα¹ AI »ýŰ踦 À§ÇÏ¿© ¿ª½Ã ±¹³» ÃÖÃÊ·Î »ó¾÷¿ë ¿ÀǼҽº AI ¸ðµ¨À» °ø°³Çß½À´Ï´Ù(¸µÅ©). Global Frontier Big Tech ¿Í °æÀïÇϱâ À§ÇØ NAVERÀÇ ÀÚ»êÀÎ µ¥ÀÌÅÍ¿Í ±â¼ú Ãø¸é¿¡¼­ ¿À·§µ¿¾È ÃàÀûµÈ °æÇè°ú ¿ì¼öÇÑ ÀÎÀ縦 ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ÇÁ·ÎÁ§Æ®¿¡ µµÀüÇϰí ÀÖ½À´Ï´Ù. ´ë¿ë·®ÀÇ Computing°ú ¾çÁúÀÇ µ¥ÀÌÅÍ´Â Machine Learning ¿¡ ÀÖ¾î ÇÙ½ÉÀÔ´Ï´Ù. Computing ÀÚ¿øÀº »ý»êÀ» ¹Ýº¹ÇÒ ¶§¸¶´Ù ºñ¿ë¿¡ »êÀÔÀÌ µÇ±â¿¡, ÇнÀ È¿À²¼º ¹× ¼º´É Çâ»óÀ» À§ÇØ µ¥ÀÌÅ͸¦ Á¤±³ÇÏ°Ô Filtering Çϰí CurationÇÏ´Â °ÍÀÌ Áß¿äÇÕ´Ï´Ù. ÇØ´ç µ¥ÀÌÅ͵éÀ» ¿©·¯ ¹æ¹ý·ÐÀ» ÅëÇÏ¿© (Model Driven) ÇнÀ °øÁ¤À» ´ÜÃàÇÏ°í µ¥ÀÌÅÍ¿Í ¸ðµ¨ÀÇ »óÈ£ÀÛ¿ëÀ» ޱ¸Çϸç SOTA ¼öÁØÀÇ ¼º´É °³¼±À» ¸ñÇ¥·Î ÇÕ´Ï´Ù. ´ã´ç¾÷¹« Model Driven Vision DATA Curation • Vision Language Model »ý»ê Àüü ´Ü°è¿¡ À̸£´Â ÇнÀ ¹× Æò°¡ µ¥ÀÌÅÍ ¼³°è • µ¥ÀÌÅÍ Ç°Áú Çâ»óÀ» À§ÇÑ ¸ðµ¨ ±â¹ÝÀÇ ÇнÀ µ¥ÀÌÅÍ Assessment ¹× Filtering ¿¡ ´ëÇÑ ¹æ¹ý·Ð ޱ¸ • ÃÖÀûÀÇ Recipe Ž»öÀ» À§ÇÑ Curation ¹æ¹ý·Ð °³¹ß ¹× ¸ðµ¨ ÇнÀ • ±¤¹üÀ§ÇÑ Domain & TaskÀÇ Dataset¿¡ ´ëÇÏ¿© ¼­·ÎÀÇ ¿µÇâµµ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É¿¡ ¹ÌÄ¡´Â ¿µÇâ Ž±¸ • ¹®Á¦ Ç®ÀÌ ¹× Reasoning ¿µ¿ªÀ» Æ÷ÇÔÇÑ Æ¯È­ µ¥ÀÌÅÍ È®º¸ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É ¿µÇâ ÁõÁø • Foundation ¸ðµ¨ °³¹ßÀ» À§ÇÑ ´ë±Ô¸ð Pretraining µ¥ÀÌÅÍ ¼³°è • Reasoning ¼º´É Çâ»óÀ» À§ÇÑ RLVR Reward ¹× °ü·Ã µ¥ÀÌÅÍ ¼³°è ÀÚ°Ý¿ä°Ç • ¹Ú»ç ÇÐÀ§ º¸À¯ÀÚ È¤Àº 2³â ÀÌ»óÀÇ À¯°ü ¾÷¹« °æ·ÂÀ» º¸À¯ÇϽŠºÐ • Vision Language Model (LLaVA, Qwen VL, DeepSeek VL µî)ÀÇ ±¸Á¶ ¹× ÇнÀ °úÁ¤¿¡ ´ëÇÑ »ó¼¼ÇÑ ÀÌÇØµµ¸¦ °®Ã߽ŠºÐ • Code Level ÀÇ °æÇèÀ» º¸À¯ÇϽŠºÐ • Distributed Training ¹× ¸ðµ¨ °¡¼Ó¿¡ ´ëÇÑ ÀÌÇØ ¶Ç´Â °æÇè (DeepSpeed Zero, Megatron, Nemo, vLLM, sglang µî)À» º¸À¯ÇϽŠºÐ • °¢ ÇнÀ ´Ü°è º° Vision LLM µ¥ÀÌÅÍÀÇ Æ¯¼º, Á¾·ù¿¡ ´ëÇÑ ÀÌÇØ°¡ ÀÖÀ¸½Å ºÐ • Python ¹× LLM °³¹ß °ü·Ã Library, FW, Platform(Pytorch, Hugging Face) Ȱ¿ë ´É·ÂÀ» º¸À¯ÇϽŠºÐ ¿ì´ë»çÇ× • »ó¿ë ¼öÁØÀÇ Vision Language Model °³¹ß °æÇèÀ» º¸À¯ÇϽŠºÐ • ´ë±Ô¸ð GPU Infra ¿î¿ë °æÇè (Multinode, Slurm, K8S)À» º¸À¯ÇϽŠºÐ • ´ë±Ô¸ð µ¥ÀÌÅÍ ¿£Áö´Ï¾î¸µ °æÇè (Ray, Spark)À» º¸À¯ÇϽŠºÐ • Top-tier ³í¹® 1ÀúÀÚ ÀÌ·ÂÀÌ ÀÖÀ¸½Å ºÐ • LLM, VLM °ü·Ã ÇÐÀ§¸¦ º¸À¯ÇϽŠºÐ • Challenge Âü°¡ °æÇè ¶Ç´Â »óÀ§ ÀÔ»ó °æÇèÀ» º¸À¯ÇϽŠºÐ • ÃÖ¼Ò 3°³¿ù ÀÌ»ó ¼Ò¿äµÈ ÆÀ ÇÁ·ÎÁ§Æ®¸¦ ¼º°øÀûÀ¸·Î ¿Ï·áÇÑ °æÇè°ú ÇØ´ç ÇÁ·ÎÁ§Æ®¸¦ ¼º°øÀ¸·Î À̲ö µ¥¿¡ ±â¿©µµ°¡ ³ôÀ¸½Å ºÐ • »ó±â ´ã´ç¾÷¹« Áß Çϳª¸¦ ÁøÇàÇÔ¿¡ ÀÖ¾î ÃÖ°í ¼öÁØÀÇ ¿ª·®À» º¸À¯ÇϽŠºÐ ÀüÇüÀýÂ÷ ¹× ±âŸ»çÇ× [ÀüÇüÀýÂ÷] ¼­·ù ÀüÇü(±â¾÷¹®È­ÀûÇÕµµ °Ë»ç ¹× Á÷¹« Å×½ºÆ® Æ÷ÇÔ) ¢º 1Â÷ ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× 2Â÷ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý ¡Ø 1Â÷ ÀÎÅͺä ÀüÇü¿¡ Job Talk ¹× ³í¹® ¼¼¹Ì³ª°¡ Æ÷Ç﵃ ¼ö ÀÖ½À´Ï´Ù. ¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿ µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇü º° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù. ¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼­ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³» µå¸± ¿¹Á¤ÀÔ´Ï´Ù. [±Ù¹«Áö] °æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮) ¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.