[NAVER Cloud] Model Driven Multimodal LLM Curation (°æ·Â)
ºÎ¼­¼Ò°³ ÀúÈñ ºÎ¼­´Â HyperCLOVA X¸¦ ±â¹ÝÀ¸·Î, À̹ÌÁö¿Í ºñµð¿À µîÀÇ Multimodal µµ¸ÞÀÎÀ¸·ÎÀÇ ±â´É È®ÀåÀ» À§ÇÑ ¾ÆÅ°ÅØÃ³ ¼³°è ¹× ¸ðµ¨ »ý»êÀ» ´ã´çÇϰí ÀÖ½À´Ï´Ù. ÃÖÁ¾ÀûÀ¸·Î´Â Native Multimodal ¹× ÀÔÃâ·Â Ãø¸é¿¡¼­ Any-to-Any ±îÁöÀÇ È®ÀåÀ» ¸ñÇ¥·Î Çϰí ÀÖ½À´Ï´Ù. 2024³â 9¿ù Çѱ¹ ÃÖÃÊ·Î Vision LLM ±â´ÉÀ» HyperCLOVA X ¿¡ Àû¿ëÇØ ¼­ºñ½º¸¦ ½ÃÀÛÇÏ¿´°í, ƯÈ÷ 2025³â 4¿ù¿¡µµ ¿ª½Ã ´ëÇѹα¹ AI »ýŰ踦 À§ÇÏ¿© ±¹³» ÃÖÃÊ·Î »ó¾÷¿ë ¿ÀǼҽº AI ¸ðµ¨À» °ø°³Çß½À´Ï´Ù.(°ü·Ã ¸µÅ© Click) ³ª¾Æ°¡ Global Frontier Big Tech ¿Í °æÀïÇϱâ À§ÇØ NAVERÀÇ ÀÚ»êÀÎ µ¥ÀÌÅÍ¿Í ±â¼ú Ãø¸é¿¡¼­ ¿À·§µ¿¾È ÃàÀûµÈ °æÇè°ú ¿ì¼öÇÑ ÀÎÀ縦 ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ÇÁ·ÎÁ§Æ®¿¡ µµÀüÇϰí ÀÖ½À´Ï´Ù. ´ë¿ë·®ÀÇ Computing°ú ¾çÁúÀÇ µ¥ÀÌÅÍ´Â Machine Learning ¿¡ ÀÖ¾î ÇÙ½ÉÀÔ´Ï´Ù. Computing ÀÚ¿øÀº »ý»êÀ» ¹Ýº¹ÇÒ ¶§¸¶´Ù ºñ¿ë¿¡ »êÀÔÀÌ µÇ±â¿¡, ÇнÀ È¿À²¼º ¹× ¼º´É Çâ»óÀ» À§ÇØ µ¥ÀÌÅ͸¦ Á¤±³ÇÏ°Ô Filtering Çϰí CurationÇÏ´Â °ÍÀÌ Áß¿äÇÕ´Ï´Ù. À̸¦ À§ÇØ ÇØ´ç µ¥ÀÌÅ͵éÀ» ¿©·¯ ¹æ¹ý·ÐÀ» ÅëÇÏ¿© (Model Driven) ÇнÀ °øÁ¤À» ´ÜÃàÇÏ°í µ¥ÀÌÅÍ¿Í ¸ðµ¨ÀÇ »óÈ£ÀÛ¿ëÀ» ޱ¸Çϸç SOTA ¼öÁØÀÇ ¼º´É °³¼±À» ¸ñÇ¥·Î ÇÕ´Ï´Ù. ´ã´ç¾÷¹« Model Driven Vision DATA Curation • Vision Language Model »ý»ê Àüü ´Ü°è¿¡ À̸£´Â ÇнÀ ¹× Æò°¡ µ¥ÀÌÅÍ ¼³°è • µ¥ÀÌÅÍ Ç°Áú Çâ»óÀ» À§ÇÑ ¸ðµ¨ ±â¹ÝÀÇ ÇнÀ µ¥ÀÌÅÍ Assessment ¹× Filtering ¿¡ ´ëÇÑ ¹æ¹ý·Ð ޱ¸ • ÃÖÀûÀÇ Recipe Ž»öÀ» À§ÇÑ Curation ¹æ¹ý·Ð °³¹ß ¹× ¸ðµ¨ ÇнÀ • ±¤¹üÀ§ÇÑ Domain & TaskÀÇ Dataset¿¡ ´ëÇÏ¿© ¼­·ÎÀÇ ¿µÇâµµ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É¿¡ ¹ÌÄ¡´Â ¿µÇâ Ž±¸ • ¹®Á¦ Ç®ÀÌ ¹× Reasoning ¿µ¿ªÀ» Æ÷ÇÔÇÑ Æ¯È­ µ¥ÀÌÅÍ È®º¸ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É ¿µÇâ ÁõÁø • Foundation ¸ðµ¨ °³¹ßÀ» À§ÇÑ ´ë±Ô¸ð Pretraining µ¥ÀÌÅÍ ¼³°è • Reasoning ¼º´É Çâ»óÀ» À§ÇÑ RLVR Reward ¹× °ü·Ã µ¥ÀÌÅÍ ¼³°è