SKT ÀÚü LLMÀÎ A.X ±â¹Ý ´ëÈÇü ÀΰøÁö´ÉÀ» ÇÔ²² ¹ßÀü½ÃÄÑ ³ª°¥ ºÐÀ» ã½À´Ï´Ù.
ÀÚü Pre-trained LLMÀ» °¡Áö°í Supervised fine-tuningºÎÅÍ RLHF/RLAIF, DPO µîÀÇ cutting-edgeÇÑ alignment
±â¼úÀ» Àû¿ëÇÏ¿© ´ëÈÇü ¾ð¾î¸ðµ¨À» °³¹ßÇÕ´Ï´Ù.
´ëÈÇü ¾ð¾î¸ðµ¨ÀÇ ÀÚµ¿ Æò°¡ ¹æ¹ýÀ» Á÷Á¢ ¼³°èÇÏ°í ¸ðµ¨ÀÇ °Á¡°ú ¾àÁ¡À» ÆÄ¾ÇÇϸç Áö¼ÓÀûÀÎ ¸ðµ¨ °íµµÈ¿¡ ÁÖ·ÂÇÕ´Ï´Ù.
¶ÇÇÑ AI¸¦ Ȱ¿ëÇÏ¿© cost-effectiveÇÏ°Ô ¸ðµ¨À» ¸¸µå´Â ¹æ¹ý¿¡ ´ëÇÑ ¿¬±¸/°³¹ß¿¡ Âü¿©ÇÕ´Ï´Ù.
SKÅÚ·¹ÄÞÀÇ ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ßÀº µµÀüÀûÀ̰í âÀÇÀûÀÎ ÇÁ·ÎÁ§Æ®°¡ µÉ °ÍÀÔ´Ï´Ù.
ÇÔ²² ¼ºÀåÇÏ¸ç »õ·Î¿î Áö½Ä°ú °æÇèÀ» ¸¸µé¾î ³ª°¡´Â ÀÏÀ» ÇÔ²² ÇÏ½Ç ¶Ù¾î³ ¿¬±¸°³¹ßÀÚºÐÀ» ±â´Ù¸®°í ÀÖ½À´Ï´Ù.
- ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ß
- Alignment tuning ±â¼ú (Human/AI Feedback) ±â¹Ý ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ß
- µµ¸ÞÀÎ Æ¯È ´ëÈÇü ¾ð¾î ¸ðµ¨ °³¹ß
- Data augmentation, automatic evaluation ±â¼ú ¿¬±¸/°³¹ß
- µ¥ÀÌÅÍ ¼³°è/È®Àå/Á¤Á¦, ¸ðµ¨ ÇнÀ/Æò°¡ ÇÁ·Î¼¼½º ¹Ýº¹À» ÅëÇÑ Áö¼ÓÀûÀÎ ¸ðµ¨ ¼º´É °íµµÈ