[´ã´ç¾÷¹«] ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ß - Alignment tuning ±â¼ú (Human/AI Feedback) ±â¹Ý ´ëÈÇü ¾ð¾î¸ðµ¨ °³¹ß - µµ¸ÞÀÎ Æ¯È ´ëÈÇü ¾ð¾î ¸ðµ¨ °³¹ß - Data augmentation, automatic evaluation ±â¼ú ¿¬±¸/°³¹ß - µ¥ÀÌÅÍ ¼³°è/È®Àå/Á¤Á¦, ¸ðµ¨ ÇнÀ/Æò°¡ ÇÁ·Î¼¼½º ¹Ýº¹À» ÅëÇÑ Áö¼ÓÀûÀÎ ¸ðµ¨ ¼º´É °íµµÈ
|
[ÀÚ°Ý¿ä°Ç] ÃÑ °æ·Â : ÃÑ 3³â ÀÌ»ó ÇзÂ/Àü°ø : ¼®»çÀÌ»ó / ÄÄÇ»ÅÍ°øÇÐ, ¼öÇÐ µî °ü·Ã Àü°ø
<Çʿ俪·® ¹× °æÇè> - µö·¯´× ±â¹Ý ¾ð¾î ó¸®, ¾ð¾î/´ëÈ ¸ðµ¨ °ü·Ã ¿¬±¸/°³¹ß °æÇè - ML ¾Ë°í¸®Áò ¹× µö·¯´× ±â¹Ý ¾ð¾î¸ðµ¨¿¡ ´ëÇÑ ½ÉÃþ Áö½Ä ¹× °³¹ß ¿ª·® - ÃֽŠML ¹æ¹ý·ÐÀ» ºü¸£°Ô ½ÀµæÇÏ°í prototypingÇÏ¿© ºÐ¼®ÇÒ ¼ö ÀÖ´Â ¿ª·® - ´Ù¾çÇÑ task Á¤ÀÇ¿¡ µû¶ó ¾ð¾î¸ðµ¨ÀÇ fine-tuning ¹æ¹ýÀ» ¼³°èÇÏ°í ±¸ÇöÇÒ ¼ö ÀÖ´Â ¿ª·®
|