ÀúÈñ ºÎ¼´Â ºñµð¿À ÀÌÇØ, °´Ã¼ ÀνÄ, ¿µ»ó »ý¼ºÀ» ÁÖÁ¦·Î ÃֽŠAI ±â¼úÀ» ¿¬±¸¡¤°³¹ßÇϰí ÀÖÀ¸¸ç, À̸¦ ±â¹ÝÀ¸·Î ÇÑ ´Ù¾çÇÑ ºñµð¿À ±â¹Ý ¼ºñ½ºÀÇ °íµµÈ ¹× ½Å±Ô ¼ºñ½º âÃâÀ» ÇÔ²²Çϰí ÀÖ½À´Ï´Ù.
Video Understanding, Perception, GenerationÀÇ ¼¼ ºÐ¾ß¸¦ Áß½ÉÀ¸·Î, ÃֽŠ³í¹® ±â¹Ý ¸®¼Ä¡´Â ¹°·Ð ½ÇÁ¦ ¼ºñ½º Àû¿ëÀ» À§ÇÑ ½ÇÇè°ú ÃÖÀûȱîÁö ¿¬±¸¿¡¼ ¼ºñ½º Àû¿ë±îÁö Àü °úÁ¤À» ¾Æ¿ì¸£´Â End-to-End ¿¬±¸Á¶Á÷ÀÔ´Ï´Ù.
ƯÈ÷ Long-form Video, Multi-modal Reasoning, 3D Vision, Diffusion µî ºü¸£°Ô ¹ßÀüÇÏ´Â ¿¬±¸ Æ®·»µå¸¦ ¼±µµÇϸç, Video-Language ¸ðµ¨, °´Ã¼ ÃßÀû/ºÐÇÒ, Á¦¾î °¡´ÉÇÑ ¿µ»ó »ý¼º°ú °°Àº °í³À̵µÀÇ ½ÇÁ¦ ¹®Á¦¿¡ µµÀüÇÒ ¼ö ÀÖ´Â ¿¬±¸ ȯ°æÀ» Á¦°øÇÕ´Ï´Ù.
¶ÇÇÑ ¿¬±¸ ¼º°ú´Â µ¥¸ð ¼öÁØ¿¡ ¸Ó¹«¸£Áö ¾Ê°í, ½ÇÁ¦ À¯Àú µ¥ÀÌÅ͸¦ ±â¹ÝÀ¸·Î ÇÑ ¼ºñ½º Àû¿ë ¹× °íµµÈ °úÁ¤¿¡ Á÷Á¢ ¿¬°áµÇ¾î, ¿¬±¸ÀÇ ½ÇÁúÀûÀÎ ÀÓÆÑÆ®¸¦ ¸¸µé¾î°¥ ¼ö ÀÖ½À´Ï´Ù.
ºñµð¿À ±â¹Ý ¸®¼Ä¡¿¡ °ü½É ÀÖ´Â ºÐÀ̶ó¸é, ´Ù¾çÇÑ µµ¸ÞÀÎÀÇ ½Çµ¥ÀÌÅ͸¦ Ȱ¿ëÇÑ representation ÇнÀ, »ý¼º ¸ðµ¨ ¼³°è, ÀÎ½Ä ÆÄÀÌÇÁ¶óÀÎ ±¸¼º µîÀ» ÀÚÀ¯·Ó°Ô Ž»öÇØº¸½Ç ¼ö ÀÖÀ¸¸ç, º»ÀÎÀÇ Àǻ翡 µû¶ó ¸ðµ¨ ¼ºù ¹× MLOps °ü·Ã ¾÷¹«µµ Æø³Ð°Ô °æÇèÇÒ ¼ö ÀÖ½À´Ï´Ù.
AI ±â¼ú·Î ºñµð¿À¸¦ 'ÀÌÇØÇϰí, ÀνÄÇϸç, âÁ¶ÇÏ´Â' ±â¼ú¿¡ °ü½É ÀÖÀ¸½Å ºÐµéÀÇ ¸¹Àº Áö¿ø ¹Ù¶ø´Ï´Ù.
¾Æ·¡ÀÇ 2°³ÀÇ ¸ðÁý ºÎ¹® Áß 1°³ Á÷¹«¸¦ ¼±ÅÃÇÏ¿© Áö¿øÇϽñ⠹ٶø´Ï´Ù.
1) Video AI - Understanding
2) Video AI - Generation
[´ã´ç¾÷¹«]
1. ÃֽŠVideo AI ¸ðµ¨ °³¹ß ¹× °ËÁõ
- Long-form Video, Temporal Reasoning, Representation Learning µî Video UnderstandingÀ» À§ÇÑ ¸ðµ¨ÀÇ ¼³°è, ÇнÀ, Æò°¡
- ÃֽŠ¿¬±¸ Æ®·»µå¸¦ ¹Ý¿µÇÑ ³í¹® ±â¹Ý ¸ðµ¨ ±¸Çö ¹× ¼º´É ÀçÇö
2. Video AI Àü¿ë ML ÆÄÀÌÇÁ¶óÀÎ °³¹ß
- ´Ù¾çÇÑ ½Çµ¥ÀÌÅÍ ±â¹ÝÀ¸·Î ÇÑ ´ë±Ô¸ð ÇнÀ ÆÄÀÌÇÁ¶óÀÎ ±¸¼º ¹× ÀÚµ¿È
- ÇнÀ È¿À²¼º°ú ¹Ýº¹ ½ÇÇèÀ» À§ÇÑ MLOps Ä£ÈÀû ±¸Á¶ ¼³°è
3. Video-Language ¸ÖƼ¸ð´Þ ¸ðµ¨ °³¹ß
- ÅØ½ºÆ®, ºñµð¿À, ¿Àµð¿À °£ÀÇ ÀÇ¹Ì ¿¬°áÀ» ´Ù·ç´Â VLM, VideoLLM ¸ðµ¨ ¿¬±¸ ¹× ±¸Çö
- Instruction-tuning, Multimodal alignment, Retrieval-augmented generation µîÀÇ Ãֽбâ¹ý Àû¿ë
4. ´ë±Ô¸ð ºñµð¿À µ¥ÀÌÅÍ Àüó¸® ¹× Ȱ¿ë
- ºñµð¿À µ¥ÀÌÅͼÂÀÇ ¼öÁý, Ŭ·»Â¡, ¸ÖƼ¸ð´Þ ¶óº§¸µ, È¿À²ÀûÀÎ Àüó¸® ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà
- Self-supervised pretraining, noisy label ó¸® µî µ¥ÀÌÅÍ ±â¹Ý representation ÇнÀ ¼³°è
5. Video Understanding ±â¹Ý AI ¼ºñ½º °³¹ß
- ½ÇÁ¦ ¼ºñ½º¸¦ À§ÇÑ ¸ðµ¨ °æ·®È, ÀÀ´ä ½Ã°£ °³¼±, ¼º´É °íµµÈ µî End-to-End Model Engineering
- »ç¿ëÀÚ Çǵå¹é°ú µµ¸ÞÀΠƯ¼ºÀ» ¹Ý¿µÇÑ ÇÏÀ̶óÀÌÆ® ±¸°£ Ãßõ ¿£Áø °³¹ß
[´ã´ç¾÷¹«]
1. ÃֽŠVideo Diffusion ¸ðµ¨ ¿¬±¸ ¹× °íµµÈ
- °æÀï»ç ´ëºñ Â÷º°ÈµÈ °íǰÁú ¿µ»ó »ý¼º °á°ú È®º¸¸¦ À§ÇÑ ¸ðµ¨ ¼³°è ¹× ÇнÀ Àü·« °³¹ß
- Preference Optimization, RLHF, Diffusion DPO, GRPO µî »ç¿ëÀÚ ¼±È£ ±â¹Ý ¼º´É Çâ»ó ±â¹ý ¿¬±¸
- ¿µ»ó »ý¼º ¸ðµ¨ÀÇ Á¤·®/Á¤¼º Æò°¡¸¦ À§ÇÑ µ¥ÀÌÅͼ ±¸Ãà ¹× ÁöÇ¥ ¼³°è
2. Diffusion ¸ðµ¨ÀÇ °í¼ÓÈ ¹× °æ·®È
- Inference ºñ¿ë Àý°¨À» À§ÇÑ Distillation, Quantization, Token/Time-step Caching µî È¿À²È ±â¹ý ¿¬±¸
- ½ÇÁ¦ ¼ºñ½º ¼öÁØÀÇ ½Ç½Ã°£¼º, ¸Þ¸ð¸® »ç¿ë ÃÖÀûȸ¦ À§ÇÑ ±¸Á¶ °³¼± ¹× ¸ðµ¨ Æ©´×
3. Long Video Generation ±â¼ú °³¹ß
- ¼ö ÃÊ~¼ö ºÐ ´ÜÀ§ÀÇ ±æÀÌ ÀÖ´Â ÀÚ¿¬½º·¯¿î ¿µ»óÀ» »ý¼ºÇϱâ À§ÇÑ ±â¹ý ¿¬±¸
4. Video µ¥ÀÌÅͼ ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà ¹× ¿£Áö´Ï¾î¸µ
- °íǰÁú ¿µ»ó »ý¼ºÀ» À§ÇÑ ´ë±Ô¸ð ºñµð¿À µ¥ÀÌÅͼ ¼öÁý ¹× Á¤Á¦
- ´Ù¾çÇÑ µµ¸ÞÀο¡ ¸ÂÃá ÇÊÅ͸µ/Ŭ·»Â¡/¾î³ëÅ×ÀÌ¼Ç ÀÚµ¿È ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà ¹× ¿î¿µ
5. ½Ç¼ºñ½º Àû¿ëÀ» À§ÇÑ Video Generation ¸ðµ¨ ¿£Áö´Ï¾î¸µ
- »ý¼º ¸ðµ¨ÀÇ ½ÇÁ¦ ¼ºñ½º ¿¬µ¿À» À§ÇÑ ¸ðµ¨ ÆÐŰ¡, API ¼ºù, ¹èÆ÷ ÀÚµ¿È µî MLOps ¾÷¹« °æÇè
- µµ¸ÞÀÎ Çǵå¹éÀ» ¹Ý¿µÇÑ ¸ðµ¨ ¼º´É °³¼± ¹× Ä¿½ºÅ͸¶ÀÌ¡, latency-performance trade-off Á¶Á¤
- ±âȹ¡¤UX¡¤ÇÁ·ÐÆ®¿£µå¡¤¼¹ö °³¹ßÀÚ¿Í Çù¾÷ÇÏ¿© »ý¼º ¸ðµ¨ ±â¹Ý ¼ºñ½º °íµµÈ
- ±¹³»/¿Ü Á¤±Ô´ëÇÐ ¹Ú»ç ÇÐÀ§ º¸À¯ÀÚ È¤Àº 2³â ÀÌ»óÀÇ À¯°ü ¾÷¹« °æÇèÀÌ ÀÖÀ¸½Å ºÐ
- Computer Vision, Video Processing, Multimodal °ü·Ã ±â¼ú °³¹ß °æÇèÀÌ ÀÖÀ¸½Å ºÐ
- PyTorch, Huggingface µî AI Model °³¹ß ¹× Ãß·ÐÀ» À§ÇÑ Framework¿¡ Àͼ÷ÇϽŠºÐ
- ´ë±Ô¸ð ºÐ»ê ÈÆ·Ã ¹× ¸ðµ¨ °¡¼ÓÈ °ü·Ã °æÇèÀ» º¸À¯ÇϽŠºÐ
- AI ±â¹Ý ¼ºñ½º °³¹ß/ÇÁ·ÎÁ§Æ®¿¡ ³ôÀº ±â¿©µµ·Î ¼º°ø °æÇèÀ» º¸À¯ÇϽŠºÐ
- Challenge ÀÔ»ó ¶Ç´Â Top-tier ³í¹® °æÇèÀ» º¸À¯ÇϽŠºÐ
Àú´Â ÄÄÇ»ÅÍ ºñÀü Àü°øÀ¸·Î ¹Ú»çÇÐÀ§¸¦ ÃëµæÇÑ µÚ, VideoÆÀ¿¡ ÇÕ·ùÇß½À´Ï´Ù.
À̰÷¿¡¼´Â ÃֽŠAI¸ðµ¨µéÀ» ¿¬±¸°³¹ßÇÏ´Â °ÍÀº ¹°·Ð, ½ÇÁ¦ »ç¿ëÀÚµéÀÌ »ç¿ëÇÒ ¼ö ÀÖµµ·Ï ±âȹÇÏ°í ¼ºñ½º¸¦ ±¸ÇöÇÏ´Â °æÇèµµ ÇÒ ¼ö ÀÖ¾î ¸¸Á·½º·´½À´Ï´Ù. ¹Ú»ç°úÁ¤ µ¿¾È¿¡´Â ¼¼»ó¿¡ ¾ø´Â ±â¼úÀ» °³¹ßÇÑ´Ù´Â Á¡¿¡¼ º¸¶÷À» ´À³¢´Â ÇÑÆí, ÀÌ·¯ÇÑ ±â¼úÀÌ ½ÇÁ¦·Î ¾î¶»°Ô Ȱ¿ëµÉ ¼ö ÀÖÀ»Áö¿¡ ´ëÇÑ °í¹Îµµ ÄǴµ¥¿ä. ¿©±â¿¡¼´Â ±× ±â¼úÀÌ ½ÇÁ¦ ¼ºñ½º·Î ¿¬°áµÇ´Â °úÁ¤À» Á÷Á¢ °æÇèÇÒ ¼ö ÀÖ¾î, ÇÑÃþ ´õ ¼ºÀåÇÒ ¼ö ÀÖ´Â °è±â°¡ µÇ¾ú½À´Ï´Ù. ¶ÇÇÑ, AI ¸ðµ¨ °³¹ß°ú MLOps µî ´Ù¾çÇÑ ºÐ¾ß¿¡¼ ÀÚ±ØÀ» ÁÖ´Â ÈǸ¢ÇÑ ÆÀ¿øµé°ú ÇÔ²² ÀÏÇϸé¼, ²ÙÁØÈ÷ ¼ºÀåÇÒ ¼ö ÀÖ´Â µ¿·ÂÀ» ¾òÀ» ¼ö ÀÖ´Ù´Â Á¡µµ Å« ÀåÁ¡À̶ó°í »ý°¢ÇÕ´Ï´Ù.
[ÀüÇüÀýÂ÷]
¼·ù ÀüÇü(±â¾÷¹®ÈÀûÇÕµµ °Ë»ç ¹× Á÷¹« Å×½ºÆ® Æ÷ÇÔ) ¢º 1Â÷ ÀÎÅÍºä ¢º ·¹ÆÛ·±½ºÃ¼Å© ¹× 2Â÷ ÀÎÅÍºä ¢º ó¿ìÇùÀÇ ¢º ÃÖÁ¾ÇÕ°Ý
¡Ø ÀüÇü ÀýÂ÷´Â ÀÏÁ¤ ¹× »óȲ¿¡ µû¶ó º¯µ¿ µÉ ¼ö ÀÖÀ¸¸ç, ÀüÇü º° °á°ú¿¡ µû¶ó ÀýÂ÷(Ãß°¡ ÀÎÅÍºä µî)°¡ Ãß°¡µÉ ¼ö ÀÖ½À´Ï´Ù.
¡Ø Á¤ÇØÁø °á°ú ¹ßÇ¥ ÀÏÁ¤Àº ¾øÀ¸¸ç, Áö¿ø¼ °ËÅä ÈÄ ¸éÁ¢ ÀÏÁ¤Àº ´ë»óÀÚ¿¡°Ô °³º°·Î ¾È³» µå¸± ¿¹Á¤ÀÔ´Ï´Ù.
[±Ù¹«Áö]
°æ±â ¼º³²½Ã ºÐ´ç±¸ ºÒÁ¤·Î 6 (±×¸°ÆÑÅ丮)
¡Ø ±Ù¹«Áö´Â ȸ»ç ³»ºÎ »çÁ¤¿¡ µû¶ó º¯µ¿µÉ ¼ö ÀÖ½À´Ï´Ù.
[±âŸ»çÇ×]
- º» °ø°í´Â Ÿ °ø°í¿Í Áߺ¹Áö¿øÀÌ ºÒ°¡´ÉÇϸç, ±âÁøÇàÇÑ Æ÷Áö¼Ç¿¡ ´ëÇÑ ÀüÇüÀÌ ¸ðµÎ ¸¶¹«¸® µÇ¸é ´Ù¸¥ Æ÷Áö¼ÇÀ¸·Î Áö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- ÇØ¿Ü ÃâÀå¿¡ °á°Ý »çÀ¯°¡ ¾ø´Â ºÐ¸¸ Áö¿ø °¡´ÉÇÕ´Ï´Ù.
- º´¿ª Àǹ«¸¦ ÇÊÇÑ ÀÚ È¤Àº ¸éÁ¦µÈ ÀÚ¿¡ ÇÑ ÇØ ÀÔ»çÁö¿øÀÌ °¡´ÉÇÕ´Ï´Ù.
- Áö¿ø¼ »ó ÇãÀ§ ±âÀç°¡ Àְųª Á¦Ãâ ¼·ù°¡ ÇãÀ§ÀÎ °æ¿ì ÇÕ°ÝÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- Á¦ÃâµÈ Áö¿ø¼´Â [My page- Áö¿øÇöȲ]¿¡¼ È®ÀÎ °¡´ÉÇϸç, °ø°í ¸¶°¨ Àü±îÁö ȨÆäÀÌÁö¿¡¼ ¼öÁ¤ ¹× Áö¿ø öȸ°¡ °¡´ÉÇÕ´Ï´Ù.
- º» °ø°í´Â ÀÎÀç ¼±¹ß ¿Ï·á ½Ã Á¶±â ¸¶°¨µÉ ¼ö ÀÖÀ¸¸ç, ÇÊ¿ä ½Ã ¸ðÁý ±â°£ÀÌ ¿¬Àå µÉ ¼ö ÀÖ½À´Ï´Ù.
- ±¹°¡À¯°øÀÚ ¹× Àå¾ÖÀÎ µî Ãë¾÷º¸È£ ´ë»óÀÚ´Â °ü°è¹ý·É¿¡ µû¶ó ¿ì´ëÇÕ´Ï´Ù.
- ±¹°¡À¯°øÀÚÀÇ °¡»êÁ¡ ºÎ¿©¸¦ ¹Þ±â À§Çؼ´Â º»ÀÎÀÌ 'Ãë¾÷Áö¿ø ´ë»óÀÚ Áõ¸í¼'¸¦ ȸ»ç¿¡ Á¦ÃâÇØ¾ß ÇÕ´Ï´Ù.
- Á¦ÃâÇØ ÁֽŠÁö¿ø¼ÀÇ °ËÅä °á°ú ¹ßÇ¥´Â Áö¿ø¼¿¡ µî·ÏÇϽŠÀ̸ÞÀÏ·Î °³º° ¾È³» µå¸³´Ï´Ù.
- ÀÔ»ç ÈÄ 3°³¿ùÀÇ ¼ö½À ±â°£À» Àû¿ëÇÏ¸ç Æò°¡¿¡ µû¶ó ¼ö½À ±â°£ÀÌ ¿¬ÀåµÇ°Å³ª ä¿ëÀÌ Ãë¼ÒµÉ ¼ö ÀÖ½À´Ï´Ù.
- ¹®ÀÇ»çÇ×Àº NAVER Cloud ä¿ë ȨÆäÀÌÁö 1:1 ¹®ÀÇ·Î Á¢¼öÇØÁֽñ⠹ٶø´Ï´Ù.