[NAVER Cloud] HCX Multimodal DATA Filtering & Curation (üÇèÇü ÀÎÅÏ)
ºÎ¼­¼Ò°³ ÀúÈñ ºÎ¼­´Â HyperCLOVA ¸¦ ±â¹ÝÀ¸·Î, À̹ÌÁö¿Í ºñµð¿À µîÀÇ Multimodal µµ¸ÞÀÎÀ¸·ÎÀÇ ±â´É È®ÀåÀ» À§ÇÑ ¾ÆÅ°ÅØÃ³ ¼³°è ¹× ¸ðµ¨ »ý»êÀ» ´ã´çÇϰí ÀÖ½À´Ï´Ù. ÃÖÁ¾ÀûÀ¸·Î´Â Native Multimodal ¹× ÀÔÃâ·Â Ãø¸é¿¡¼­ Any to Any ±îÁöÀÇ È®ÀåÀ» ¸ñÇ¥·Î Çϰí ÀÖÀ¸¸ç, 2024³â 9¿ù Çѱ¹ ÃÖÃÊ·Î Vision LLM ±â´ÉÀ» HyperCLOVA X ¿¡ ¼­ºñ½º ½ÃÀÛÇÏ¿´½À´Ï´Ù. ¶ÇÇÑ ¿ÃÇØ 4¿ù¿¡´Â ´ëÇѹα¹ AI »ýŰ踦 À§ÇÏ¿© ±¹³» ÃÖÃÊ·Î »ó¾÷¿ë ¿ÀǼҽº AI ¸ðµ¨À» °ø°³ÇÏ¿´½À´Ï´Ù. (¸µÅ©) Global Frontier Big Tech ¿Í °æÀïÇϱâ À§ÇØ NAVER ÀÇ ÀÚ»êÀÎ µ¥ÀÌÅÍ¿Í ±â¼ú Ãø¸é¿¡¼­ ¿À·§µ¿¾È ÃàÀûµÈ °æÇè°ú ¿ì¼öÇÑ ÀÎÀç Ç®À» ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ÇÁ·ÎÁ§Æ®¿¡µµ µµÀüÇϰí ÀÖ½À´Ï´Ù. À̸¦ À§ÇØ È®º¸µÈ µ¥ÀÌÅÍ´Â ¿©·¯ µµ¸ÞÀΰú Å×½ºÅ©¿¡ °ÉÃÄ ¸Å¿ì ±¤¹üÀ§ÇÏ¸ç ¾çµµ »ó´çÇÑ ¼öÁØ¿¡ µµ´ÞÇØ ÀÖ½À´Ï´Ù. ÇнÀ È¿À²¼ºÀ» Áõ´ë½Ã۰í Àü¹ÝÀûÀÎ ¸ðµ¨ ¼º´ÉÀÇ Çâ»óÀ» ²ÒÇÏ´Â °ÍÀ» ¸ñÇ¥·Î Ãß°¡ÀûÀÎ ¾çÁúÀÇ µ¥ÀÌÅ͸¦ ¹ß±¼Çϰí Á¦ÀÛÇϰųª, ±âÁ¸¿¡ È®º¸µÈ µ¥ÀÌÅ͵éÀ» ¿©·¯ ¹æ¹ý·ÐÀ» ÅëÇÏ¿©(Model Driven) Á¤±³ÇÏ°Ô Filtering Çϰí Curation ÇÔÀ¸·Î½á ÃÖÀûÀÇ Data Recipe¸¦ Ž»öÇØ ³ª°¡°í ÀÖ½À´Ï´Ù. ´ã´ç¾÷¹« • Multimodal LLM ÇнÀ Àüü ´Ü°è¿¡ À̸£´Â ÇнÀ ¹× Æò°¡ Dataset Design • ±¤¹üÀ§ÇÑ Domain & Task ÀÇ Multimodal LLM Data¿¡ ´ëÇÏ¿© ¼­·ÎÀÇ ¿µÇâµµ ¹× ÃÖÁ¾ ¼º´É¿¡ ¹ÌÄ¡´Â ¿µÇâ Ž±¸ • ½Ã³ª¸®¿À Ưȭ µ¥ÀÌÅÍ È®º¸ ¹× ÃÖÁ¾ ¸ðµ¨ ¼º´É ¿µÇâ ÁõÁø • Multimodal Data Filtering Method °³¹ß ¹× ¸ðµ¨ ÇнÀ ¹× ºÐ¼® • ÃÖÀûÀÇ Data Recipe Ž»öÀ» À§ÇÑ Curation Method °³¹ß ¹× ¸ðµ¨ ÇнÀ ¹× ºÐ¼® Áö¿øÀÚ°Ý • ±¹³»/¿Ü Á¤±Ô´ëÇÐ(Çлç) ÀçÇлý ¶Ç´Â ±âÁ¹¾÷ÀÚ • ÀÎÅÏ½Ê ±â°£(¾à 3°³¿ù) µ¿¾È Full-Time ±Ù¹«°¡ °¡´ÉÇϽŠºÐ • Multimodal Language Model (LLaVA, Qwen VL, DeepSeek VL)¿¡ ´ëÇÑ ±âº»ÀûÀÎ Áö½Ä ¹× ÇнÀ °úÁ¤¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐ • °¢ ÇнÀ ´Ü°èº° Multimodal LLM µ¥ÀÌÅÍÀÇ Æ¯¼º, Á¾·ù¿¡ ´ëÇÑ ÀÌÇØ ¹× ½Å±Ô µ¥ÀÌÅÍ µðÀÚÀÎ ´É·ÂÀ» °®Ã߽ŠºÐ • Python Ȱ¿ë ´É·ÂÀ» °®Ã߽ŠºÐ