[´ã´ç¾÷¹«] [Á÷¹«ÀÇ ¸ñÀû/¸ñÇ¥] ºñÁî´Ï½º ¸ñÇ¥¿¡ ¸Â´Â Ç÷§Æû/¼ºñ½º °³¹ßÀ» À§ÇØ ÇÊ¿äÇÑ 1) Machine Learning Model °³¹ß 2) Model InferenceÃÖÀûȸ¦ À§ÇÑ Engineering°³¹ßÀÚ¸¦ ä¿ëÇϰíÀÚ ÇÔ
[ä¿ë»çÀ¯] µ¥ÀÌÅÍ ±â¹ÝÀÇ ¿¹Ãø/Ãßõ ¸ðµ¨ ¹× ȸ»ç ¼ºñ½º ¿ä°Ç¿¡ ¸Â´Â Machine Model °³¹ß»Ó¸¸ ¾Æ´Ï¶ó ½ÇÁ¦ ¼ºñ½º ȯ°æ¿¡¼ÀÇ ºü¸¥ ÀÀ´ä¼º°ú ³ôÀº ó¸® È¿À²¼º È®º¸¸¦ À§ÇÑ Engineering °¡´É Àοø ÇÊ¿ä
[ÁÖ¿ä ¾÷¹«] - ¼ºñ½º ¸ñÀû¿¡ ÃÖÀûÈµÈ ¸ÂÃãÇü ¸ðµ¨ ¼³°è ¹× ±¸Çö - ±âÁ¸ ¸ðµ¨ÀÇ ¼º´É °³¼± ¹× ¸ðµ¨ ÀçÇнÀ ÀÚµ¿È ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà - ½Å±Ô ¼ºñ½º ·±ÄªÀ» À§ÇÑ µö·¯´× ±â¹Ý ¸ðµ¨ ¿¬±¸ ¹× ½ÇÇè - ´ë±Ô¸ð »ç¿ëÀÚ ¿äûÀ» °í·ÁÇÑ ½Ç½Ã°£ Ãß·Ð(inference) ȯ°æ ±¸Ãà ¹× ÃÖÀûÈ - GPU ¸®¼Ò½º È¿À²È, Ãß·Ð latency °³¼± ¹× A/B Å×½ºÆ® Àû¿ë
[Çʼö¿ä°Ç] - ÄÄÇ»ÅͰøÇÐ, Àü»êÇÐ, Åë°èÇÐ, AI °ü·Ã Àü°ø ¼®»ç ÀÌ»ó - Ãßõ ½Ã½ºÅÛ, ¿¹Ãø ¸ðµ¨, ÀÚ¿¬¾îó¸®(LLM), À½¼ºÀνÄ/ÇÕ¼º µî ½ÇÁ¦ ¼ºñ½º Àû¿ë °æÇè - Python ±â¹ÝÀÇ ¸Ó½Å·¯´×/µö·¯´× °³¹ß °æÇè (PyTorch µî) - ¸ðµ¨ ÇнÀ, °ËÁõ, ¼º´É Æ©´× Àü °úÁ¤¿¡ ´ëÇÑ ÀÌÇØ - µ¥ÀÌÅÍ Àüó¸® ¹× ºÐ¼® ¿ª·® º¸À¯ (Pandas, NumPy µî) - ¿µ¾î ÀÇ»ç¼ÒÅë ´É·Â
[¿ì´ë¿ä°Ç] - ´ë¿ë·® µ¥ÀÌÅÍ ±â¹Ý ¸ðµ¨ ÇнÀ °æÇè (GPU Ŭ·¯½ºÅÍ, ºÐ»ê ÇнÀ µî) - ³í¹® ±â¹Ý ¸ðµ¨ ¸®¼Ä¡ ¹× Ä¿½ºÅ͸¶ÀÌ¡ ¿ª·® - ±ÝÀ¶±Ç ÇÁ·ÎÁ§Æ® °æÇè
[Çʿ俪·®] 1) ¸Ó½Å·¯´×/µö·¯´× Áö½Ä - »çÀüÇнÀ ¸ðµ¨ ´Ù¿î·Îµå ¹× ¹Ì¼¼Á¶Á¤ (Fine-tuning) - LoRA, QLoRA, PEFT µî ÆÄ¶ó¹ÌÅÍ È¿À²Àû Æ©´× ±â¹ý 2) ÆÄÀÎÆ©´× ¹× ¹èÆ÷ - ÇнÀ µ¥ÀÌÅÍ ±¸Ãà (prompt-response Çü½Ä) - ¸ðµ¨ ÆÄÀÎÆ©´× (GPU ¸Þ¸ð¸® È¿À² °í·Á) - ¸ðµ¨ °æ·®È ¹× Ãß·Ð ÃÖÀûÈ (Quantization, ONNX, TensorRT µî) 3) API ¹èÆ÷: FastAPI + Docker + GPU ¼¹ö 4) ÇÁ·Î±×·¡¹Ö & ¼ÒÇÁÆ®¿þ¾î ¿£Áö´Ï¾î¸µ : Python (Çʼö), ±× ¿Ü Java, C++, R µîµµ Ȱ¿ë 5) ÄÚµå ±¸Á¶È, ¹öÀü °ü¸®(Git), Å×½ºÆ®, ¸ðµâÈ µî
[ÀüÇüÀýÂ÷] - 1Â÷ ¼·ù ÀüÇü - 2Â÷ ¸éÁ¢ ÀüÇü - »çÀü°í¿ë½É»ç
[Á¦Ãâ¼·ù] - ±¹¹®À̷¼, »ó¼¼°æ·Â±â¼ú¼
[±Ù¹«ºÎ¼ ¹× Á÷±Þ/Á÷Ã¥]
|
[ÀÚ°Ý¿ä°Ç] °æ·Â: °æ·Â 5³â¡è ÇзÂ: ¼®»çÁ¹¾÷ Á÷¹«±â¼ú: µö·¯´×
|