[NAVER Cloud] ´ë±Ô¸ð GPU Ŭ·¯½ºÅÍ ±â¹Ý MLOps Platform °³¹ß (°æ·Â)
ºÎ¼­¼Ò°³ ÀúÈñ Á¶Á÷Àº ÆÀ³×À̹ö AI/MLÀÇ ÇÙ½ÉÀÎ MLOps PlatformÀ» °³¹ßÇÏ°í ¿î¿µÇϸç, ´ë±Ô¸ð GPU Cluster¸¦ È¿À²ÀûÀ¸·Î Ȱ¿ëÇÏ´Â ÀÏÀ» ´ã´çÇϰí ÀÖ½À´Ï´Ù. ÀúÈñ´Â µ¥ÀÌÅÍ Áغñ, ´ë±Ô¸ð ºÐ»ê ÇнÀ, ±×¸®°í ¸ðµ¨ ¼­ºù¿¡ À̸£´Â ML ¶óÀÌÇÁ»çÀÌŬ Àü¹ÝÀ» Áö¿øÇÏ´Â Ç÷§ÆûÀ» Á¦°øÇÕ´Ï´Ù. ÆÀ³×À̹öÀÇ ´Ù¾çÇÑ ¼­ºñ½º¿¡¼­ °ËÁõµÈ ÀúÈñ Ç÷§ÆûÀº ³×À̹öŬ¶ó¿ìµåÀÇ ´ë±Ô¸ð ÄÄÇ»ÆÃ ȯ°æÀ» ±â¹ÝÀ¸·Î ÇÑ ´Ù¾çÇÑ GPUaaS ¼­ºñ½ºÀÇ ÄÚ¾î Ç÷§ÆûÀ¸·Î¼­ ±Û·Î¹ú ½ÃÀåÀ¸·Î ³ª¾Æ°¡°í ÀÖ½À´Ï´Ù. • [µ¥ÀÌÅÍ] ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ´ë±Ô¸ð µ¥ÀÌÅ͸¦ È¿À²ÀûÀ¸·Î °ü¸®Çϰí Ȱ¿ëÇÒ ¼ö ÀÖµµ·Ï, Hugging Face ÀÎÅÍÆäÀ̽º ±â¹ÝÀÇ µ¥ÀÌÅÍ Ç÷§Æû°ú ´ë±Ô¸ð º´·Ä 󸮸¦ Áö¿øÇÏ´Â °ü¸®Çü ETL ½Ã½ºÅÛÀ» °³¹ßÇϰí Á¦°øÇÕ´Ï´Ù. • [ÇнÀ] ±¹³» ÃÖ°í ¼öÁØÀÇ GPU ÀÎÇÁ¶ó¿¡¼­ ´ë±Ô¸ð ML ºÐ»ê ÇнÀ ¿öÅ©·Îµå°¡ ¾ÈÁ¤ÀûÀ¸·Î ¼öÇàµÉ ¼ö ÀÖµµ·Ï, Kubernetes ±â¹ÝÀÇ MLOps Ç÷§Æû ÇÙ½É ±¸¼º ¿ä¼Ò¸¦ °³¹ßÇÏ°í °íµµÈ­ÇÕ´Ï´Ù. • [¼­ºù] AI/ML ¸ðµ¨ÀÇ ¾ÈÁ¤ÀûÀÎ ¼­ºùÀ» Áö¿øÇϰí, ¸ðµ¨ ¼­ºù¿¡ ƯȭµÈ ±â´ÉÀ» Á¦°øÇÏ´Â È®Àå °¡´ÉÇÑ Ç÷§ÆûÀ» °³¹ßÇÏ°í ¿î¿µÇÕ´Ï´Ù. ±Ã±ØÀûÀ¸·Î ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ÀÎÇÁ¶óÀÇ º¹À⼺¿¡¼­ ¹þ¾î³ª ÇÙ½É ¸ðµ¨ÀÇ ½ÇÇè°ú ¹èÆ÷¿¡¸¸ ÁýÁßÇÒ ¼ö Àִ ȯ°æÀ» Á¦°øÇÏ´Â °ÍÀ» ¸ñÇ¥·Î ÇÕ´Ï´Ù. [Âü°íÀÚ·á] • [DAN 24] HyperCLOVA X, MLOps·Î Hyperscale AI °³¹ßÀÇ »õ·Î¿î ÀåÀ» ¿­´Ù • https://dan.naver.com/24/sessions/599 • [DAN 25] MLXP: GPU È¿À²È­¸¦ ¼±µµÇÏ´Â ´ë±Ô¸ð MLOps Ç÷§Æû • https://dan.naver.com/25/sessions/679 ´ã´ç¾÷¹« • Kubernetes ±â¹Ý MLOps Ç÷§Æû(µ¥ÀÌÅÍ, ÇнÀ, ¼­ºù) ¼³°è, °³¹ß ¹× °íµµÈ­ (Operator, Scheduler µî ÇÙ½É ±¸¼º ¿ä¼Ò °³¹ß Æ÷ÇÔ) • ´ë±Ô¸ð µ¥ÀÌÅÍ ÀúÀå, ó¸®, °ü¸®¸¦ À§ÇÑ µ¥ÀÌÅÍ Ç÷§Æû ¹× º´·Ä µ¥ÀÌÅÍ Ã³¸®(Spark, Ray), ETL ÆÄÀÌÇÁ¶óÀÎ(Kubeflow pipeline, Airflow) ±¸Ãà ¹× ÃÖÀûÈ­ • ML ÇнÀ ÇÁ·¹ÀÓ¿öÅ©(PyTorch, DeepSpeed, etc.) ±â¹Ý ´ë±Ô¸ð ºÐ»ê ÇнÀ È¿À² ÃÖÀûÈ­/µð¹ö±ë/ÇÁ·ÎÆÄÀϸµ µµ±¸ °³¹ß, °í¼Ó ³×Æ®¿öÅ© ±â¼ú(InfiniBand, RoCE, etc.) ¿¬±¸ ¹× Ç÷§Æû Àû¿ë • ¾ÈÁ¤ÀûÀ̰í È®Àå °¡´ÉÇÑ ML ¸ðµ¨ ¼­ºù ½Ã½ºÅÛ ¹× Ã߷Рȯ°æ(vLLM, Kserve, llm-d, etc.) °³¹ß, LLM Gateway(K8s Gateway API ±â¹Ý ǰÁú/ºñ¿ë ÃÖÀûÈ­ ¶ó¿ìÆÃ, ÀÚµ¿ ¸ðµ¨ Fallback µî) ±â´É ±¸Çö, ¸ðµ¨ ¹èÆ÷ ÀÚµ¿È­ ÆÄÀÌÇÁ¶óÀÎ ±¸Ãà • SRE °üÁ¡¿¡¼­ MLOps PlatformÀÇ ¾ÈÁ¤Àû ¿î¿µÀ» À§ÇÑ ½Ã½ºÅÛ °íµµÈ­ (MLOps Observability ±¸Ãà, ¸ð´ÏÅ͸µ, CI/CD, Àå¾Ö ŽÁö ¹× º¹±¸, °¡¿ë¼º °³¼± µî) • ML ¿£Áö´Ï¾î¿Í ¿¬±¸ÀÚµéÀÌ ½±°Ô »ç¿ëÇÒ ¼ö ÀÖ´Â SDK ¹× API, Event-driven ÀÚµ¿È­ ½Ã½ºÅÛ °³¹ß • ³×À̹öŬ¶ó¿ìµåÀÇ ´ë±Ô¸ð ÄÄÇ»ÆÃ ȯ°æ ±â¹Ý GPUaaS ¼­ºñ½ºÀÇ ÄÚ¾î Ç÷§Æû °³¹ß ¹× ±Û·Î¹ú ¼­ºñ½ºÈ­