[NAVER Cloud] ´ë±Ô¸ð GPU Ŭ·¯½ºÅÍ ±â¹Ý MLOps Platform °³¹ß (°æ·Â)
ºÎ¼¼Ò°³
ÀúÈñ Á¶Á÷Àº ÆÀ³×À̹ö AI/MLÀÇ ÇÙ½ÉÀÎ MLOps PlatformÀ» °³¹ßÇÏ°í ¿î¿µÇϸç, ´ë±Ô¸ð GPU Cluster¸¦ È¿À²ÀûÀ¸·Î Ȱ¿ëÇÏ´Â ÀÏÀ» ´ã´çÇϰí ÀÖ½À´Ï´Ù. ÀúÈñ´Â µ¥ÀÌÅÍ Áغñ, ´ë±Ô¸ð ºÐ»ê ÇнÀ, ±×¸®°í ¸ðµ¨ ¼ºù¿¡ À̸£´Â ML ¶óÀÌÇÁ»çÀÌŬ Àü¹ÝÀ» Áö¿øÇÏ´Â Ç÷§ÆûÀ» Á¦°øÇÕ´Ï´Ù. ÆÀ³×À̹öÀÇ ´Ù¾çÇÑ ¼ºñ½º¿¡¼ °ËÁõµÈ ÀúÈñ Ç÷§ÆûÀº ³×À̹öŬ¶ó¿ìµåÀÇ ´ë±Ô¸ð ÄÄÇ»ÆÃ ȯ°æÀ» ±â¹ÝÀ¸·Î ÇÑ ´Ù¾çÇÑ GPUaaS ¼ºñ½ºÀÇ ÄÚ¾î Ç÷§ÆûÀ¸·Î¼ ±Û·Î¹ú ½ÃÀåÀ¸·Î ³ª¾Æ°¡°í ÀÖ½À´Ï´Ù.
• [µ¥ÀÌÅÍ] ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ´ë±Ô¸ð µ¥ÀÌÅ͸¦ È¿À²ÀûÀ¸·Î °ü¸®Çϰí Ȱ¿ëÇÒ ¼ö ÀÖµµ·Ï, Hugging Face ÀÎÅÍÆäÀ̽º ±â¹ÝÀÇ µ¥ÀÌÅÍ Ç÷§Æû°ú ´ë±Ô¸ð º´·Ä 󸮸¦ Áö¿øÇÏ´Â °ü¸®Çü ETL ½Ã½ºÅÛÀ» °³¹ßÇϰí Á¦°øÇÕ´Ï´Ù.
• [ÇнÀ] ±¹³» ÃÖ°í ¼öÁØÀÇ GPU ÀÎÇÁ¶ó¿¡¼ ´ë±Ô¸ð ML ºÐ»ê ÇнÀ ¿öÅ©·Îµå°¡ ¾ÈÁ¤ÀûÀ¸·Î ¼öÇàµÉ ¼ö ÀÖµµ·Ï, Kubernetes ±â¹ÝÀÇ MLOps Ç÷§Æû ÇÙ½É ±¸¼º ¿ä¼Ò¸¦ °³¹ßÇÏ°í °íµµÈÇÕ´Ï´Ù.
• [¼ºù] AI/ML ¸ðµ¨ÀÇ ¾ÈÁ¤ÀûÀÎ ¼ºùÀ» Áö¿øÇϰí, ¸ðµ¨ ¼ºù¿¡ Æ¯ÈµÈ ±â´ÉÀ» Á¦°øÇÏ´Â È®Àå °¡´ÉÇÑ Ç÷§ÆûÀ» °³¹ßÇÏ°í ¿î¿µÇÕ´Ï´Ù.
±Ã±ØÀûÀ¸·Î ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ÀÎÇÁ¶óÀÇ º¹À⼺¿¡¼ ¹þ¾î³ª ÇÙ½É ¸ðµ¨ÀÇ ½ÇÇè°ú ¹èÆ÷¿¡¸¸ ÁýÁßÇÒ ¼ö Àִ ȯ°æÀ» Á¦°øÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù.
[Âü°íÀÚ·á]
• [DAN 24] HyperCLOVA X, MLOps·Î Hyperscale AI °³¹ßÀÇ »õ·Î¿î ÀåÀ» ¿´Ù
• https://dan.naver.com/24/sessions/599
• [DAN 25] MLXP: GPU È¿À²È¸¦ ¼±µµÇÏ´Â ´ë±Ô¸ð MLOps Ç÷§Æû
• https://dan.naver.com/25/sessions/679
´ã´ç¾÷¹«
• Kubernetes ±â¹Ý MLOps Ç÷§Æû(µ¥ÀÌÅÍ, ÇнÀ, ¼ºù) ¼³°è, °³¹ß ¹× °íµµÈ (Operator, Scheduler µî ÇÙ½É ±¸¼º ¿ä¼Ò °³¹ß Æ÷ÇÔ)
• ´ë±Ô¸ð µ¥ÀÌÅÍ ÀúÀå, ó¸®, °ü¸®¸¦ À§ÇÑ µ¥ÀÌÅÍ Ç÷§Æû ¹× º´·Ä µ¥ÀÌÅÍ Ã³¸®(Spark, Ray), ETL ÆÄÀÌÇÁ¶óÀÎ(Kubeflow pipeline, Airflow) ±¸Ãà ¹× ÃÖÀûÈ
• ML ÇнÀ ÇÁ·¹ÀÓ¿öÅ©(PyTorch, DeepSpeed, etc.) ±â¹Ý ´ë±Ô¸ð ºÐ»ê ÇнÀ È¿À² ÃÖÀûÈ/µð¹ö±ë/ÇÁ·ÎÆÄÀϸµ µµ±¸ °³¹ß, °í¼Ó ³×Æ®¿öÅ© ±â¼ú(InfiniBand, RoCE, etc.) ¿¬±¸ ¹× Ç÷§Æû Àû¿ë
• ¾ÈÁ¤ÀûÀ̰í È®Àå °¡´ÉÇÑ ML ¸ðµ¨ ¼ºù ½Ã½ºÅÛ ¹× Ã߷Рȯ°æ(vLLM, Kserve, llm-d, etc.) °³¹ß, LLM Gateway(K8s Gateway API ±â¹Ý ǰÁú/ºñ¿ë ÃÖÀûÈ ¶ó¿ìÆÃ, ÀÚµ¿ ¸ðµ¨ Fallback µî) ±â´É ±¸Çö, ¸ðµ¨ ¹èÆ÷ ÀÚµ¿È ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà
• SRE °üÁ¡¿¡¼ MLOps PlatformÀÇ ¾ÈÁ¤Àû ¿î¿µÀ» À§ÇÑ ½Ã½ºÅÛ °íµµÈ (MLOps Observability ±¸Ãà, ¸ð´ÏÅ͸µ, CI/CD, Àå¾Ö ŽÁö ¹× º¹±¸, °¡¿ë¼º °³¼± µî)
• ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ½±°Ô »ç¿ëÇÒ ¼ö ÀÖ´Â SDK ¹× API, Event-driven ÀÚµ¿È ½Ã½ºÅÛ °³¹ß
• ³×À̹öŬ¶ó¿ìµåÀÇ ´ë±Ô¸ð ÄÄÇ»ÆÃ ȯ°æ ±â¹Ý GPUaaS ¼ºñ½ºÀÇ ÄÚ¾î Ç÷§Æû °³¹ß ¹× ±Û·Î¹ú ¼ºñ½ºÈ