±¹³»´ë±â¾÷


¾÷¹«: ÀÚü Pre-Trained LLMÀ» °¡Áö°í Supervised Fine-TuningºÎÅÍ RLHF/RLAIF, DPO µîÀÇ Cutting-EdgeÇÑ Alignment

±â¼úÀ» Àû¿ëÇÏ¿© ´ëÈ­Çü ¾ð¾î¸ðµ¨À» °³¹ß

- Alignment Tuning ±â¼ú (Human/AI Feedback) ±â¹Ý ´ëÈ­Çü ¾ð¾î¸ðµ¨ °³¹ß

- µµ¸ÞÀΠƯȭ ´ëÈ­Çü ¾ð¾î ¸ðµ¨ °³¹ß

- Data Augmentation, Automatic Evaluation ±â¼ú ¿¬±¸/°³¹ß

- µ¥ÀÌÅÍ ¼³°è/È®Àå/Á¤Á¦, ¸ðµ¨ ÇнÀ/Æò°¡ ÇÁ·Î¼¼½º ¹Ýº¹À» ÅëÇÑ Áö¼ÓÀûÀÎ ¸ðµ¨ ¼º´É °íµµÈ­


[ÀÚ°Ý¿ä°Ç]

- ±¹³»¿Ü ´ëÇÐÁ¹¾÷ ¹× ¼®»ç ÀÌ»ó ( AIºÐ¾ß ¹Ú»ç ÇÐÀ§ ¼ÒÁöÀÚ (¾ð¾î¸ðµ¨ Àü°ø) ¿ì´ë)

- ´ëÈ­Çü ¾ð¾î¸ðµ¨/¼­ºñ½º »ó¿ë °³¹ß °æÇè 3³â ÀÌ»ó

- µö·¯´× ±â¹Ý ¾ð¾î ó¸®, ¾ð¾î/´ëÈ­ ¸ðµ¨ °ü·Ã ¿¬±¸/°³¹ß °æÇè º¸À¯

- ML ¾Ë°í¸®Áò ¹× µö·¯´× ±â¹Ý ¾ð¾î¸ðµ¨¿¡ ´ëÇÑ ½ÉÃþ Áö½Ä ¹× °³¹ß ¿ª·® º¸À¯

- ÃֽŠML ¹æ¹ý·ÐÀ» ºü¸£°Ô ½ÀµæÇÏ°í PrototypingÇÏ¿© ºÐ¼®ÇÒ ¼ö ÀÖ´Â ¿ª·® º¸À¯ 

- ´Ù¾çÇÑ Task Á¤ÀÇ¿¡ µû¶ó ¾ð¾î¸ðµ¨ÀÇ Fine-Tuning ¹æ¹ýÀ» ¼³°èÇÏ°í ±¸ÇöÇÒ ¼ö ÀÖ´Â ¿ª·® º¸À¯

- Multi-GPU, Multi-Node ȯ°æ¿¡¼­ÀÇ ¾ð¾î ¸ðµ¨ ÃÖÀûÈ­ ¹× ºÐ»êÇнÀ ±â¼ú/°æÇè ¿ì´ë

- NLP/ML/DL °ü·Ã ÁÖ¿ä ÇÐȸ ³í¹® ½ÇÀû º¸À¯ ¿ì´ë


[Á¦Ãâ¼­·ù]
À̷¼­¿¡ ¿¬¶ôó, ÇöÀ翬ºÀ, Èñ¸Á¿¬ºÀ ±âÀç
Á¦ÃâÇÑ ¼­·ù´Â ÀÏü ¹ÝȯÇÏÁö ¾ÊÀ½
±¹¹®À̷¼­


[ÀüÇü¹æ¹ý]
¼­·ùÀüÇü, ¸éÁ¢ÀüÇü


´ã´çÀÚ : Tim ÀÌ»ç (Pincus Korea)
¹®ÀÇó : ***-****-****
À̸ÞÀÏ : ******@*******.***