Description

🚀 Company Introduction

AI ¸®¿öµå ±¤°í Ç÷§Æû ±â¾÷ ¹öÁîºôÀº ±¹³» À̵¿Åë½Å 3»ç, SK, CJ, ·Ôµ¥, ¶óÀÎ µî Àü ¼¼°è 150°³ ÀÌ»óÀÇ ÆÛºí¸®¼Å¸¦ º¸À¯ÇÑ ¼¼°è ÃÖ´ëÀÇ ¸®¿öµå ±¤°í ³×Æ®¿öÅ©¸¦ ±¸Ãà, 3,900¸¸ ¸íÀÇ À¯Àú¸¦ È®º¸ ÁßÀÔ´Ï´Ù. ÃÖ±Ù 5³â°£ ¿¬Æò±Õ 33%ÀÇ ³ôÀº ¼ºÀå(CAGR 2016-2021)À» ´Þ¼ºÇϰí ÀÖ´Â ±¹³» ÃÖ°íÀÇ ¾ÖµåÅ×Å© ½ºÅ¸Æ®¾÷ÀÔ´Ï´Ù.

±Û·Î¹ú ¾Öµå Å×Å©(Ad-tech) ±â¾÷À¸·Î¼­ ±Û·Î¹ú ±¤°í »ýŰ迡¼­ ´Ù¾çÇÑ ¸®¿öµå ±¤°í¿Í ±¤°í Àκ¥Å丮¸¦ °³¹ßÇϰí ÀÖ½À´Ï´Ù. ±¤°í ¾÷°è Ư¼º»ó ½Ã½ºÅÛ º¹Àâµµ°¡ ³ô°í ´Ù¾çÇÑ Æ®·£µå°¡ ÀÖ¾î ±â¼úÀûÀÌ Çõ½ÅÀÌ ¿ä±¸µÇ¸ç ¿µÇâ·Â ÀÖ´Â °úÁ¦¸¦ ¼öÇàÇÒ ¼ö ÀÖ½À´Ï´Ù. ¹öÁîºôÀº µðÁöÅÐ ±¤°í »ýŰèÀÇ ´Ù¾çÇÑ ´ÏÁ ÃÖÀûÈ­ÇÒ ¼ö ÀÖ´Â ½Ã½ºÅÛÀ» ±¸Ãà ¿î¿µÇϱâ À§ÇØ ³ë·ÂÇϰíÀÖ½À´Ï´Ù. À̸¦ À§ÇØ °³¹ßÀÚ´Â ºñÁî´Ï½º, Ŭ¶óÀÌ¾ðÆ® µî ¿©·¯ Á÷±º°ú À¯±âÀûÀÎ Ä¿¹Â´ÏÄÉÀ̼ÇÀ» À̲ø ¼ö ÀÖ´Â ½ºÅ³ÀÌ ÇÊ¿äÇÕ´Ï´Ù.

🔎 ¹öÁîºô ±¤°í »óǰ ÀÚ¼¼È÷ ¾Ë¾Æº¸±â


👫 Team Introduction

BuzzvilÀÇ Data EngineeringÆÀÀº µ¥ÀÌÅͰ¡ »ý»êµÇ´Â ·¹À̾îºÎÅÍ µ¥ÀÌÅͰ¡ ¼ÒºñµÇ´Â ·¹À̾î±îÁö¸¦ ¾Æ¿ì¸£´Â µ¥ÀÌÅÍ Ç÷§Æû°ú ¿öÅ©Ç÷οìÀÇ ¼³°è ¹× ¿î¿µÀ» ´ã´çÇÏ´Â Á¶Á÷ÀÔ´Ï´Ù. ÇöÀç ÆÄÆ®¸®µå¸¦ Æ÷ÇÔÇÑ 3¸íÀÇ µ¥ÀÌÅÍ ¿£Áö´Ï¾î°¡ 5M WAU, 50¿©°³ÀÇ Microservice·ÎºÎÅÍ Èê·¯µé¾î¿À´Â TBs/day º¼·ýÀÇ µ¥ÀÌÅͰ¡ scalableÇÏ°Ô ÀûÀçÀû¼Ò¿¡ Ȱ¿ë µÉ ¼ö ÀÖ´Â µ¥ÀÌÅÍ Ç÷§ÆûÀ» ¸¸µé¾î°¡°í ÀÖ½À´Ï´Ù.

µ¥ÀÌÅÍÀÇ ¿øÃµÀ¸·ÎºÎÅÍ Data Lake(S3, Athena), Data Warehouse(Redshift)±îÁö Èê·Áº¸³»´Â ELT workflowµéÀºAirflow¸¦ ÅëÇØ °ü¸®Çϰí ÀÖÀ¸¸ç, AWS EKS cluster À§¿¡¼­ ¾à 500°³ÀÇ DAG¸¦ ¿î¿µÇϰí ÀÖ½À´Ï´Ù. Airflow¸¦ óÀ½ µµÀÔÇÑ 2018³âºÎÅÍ, YAML ¸í¼¼ ±â¹Ý workflow °ü¸®¸¦ Æ÷ÇÔÇÑ ´Ù¾çÇÑ ½Ãµµ¸¦ ÅëÇØ ºÐ¼®°¡³ª ¼­¹ö/ML °³¹ßÀÚ°¡ Á÷Á¢ workflow¸¦ µî·ÏÇÏ´Â self-serving Ç÷§ÆûÀ» ÁöÇâÇϰí ÀÖ½À´Ï´Ù.

S3, Athena, Firehose, RedshiftµîÀ» Æ÷ÇÔÇÑ Àü¹ÝÀûÀÎ µ¥ÀÌÅÍ ÀÎÇÁ¶ó´Â AWS¿Í K8s »ó¿¡¼­ Terraform°ú HelmÀ» ÅëÇØ °ü¸®Çϰí ÀÖÀ¸¸ç, Airflow´Â Spinnaker¸¦ ÅëÇØ Docker ±â¹ÝÀ¸·Î ¹èÆ÷¸¦ Çϰí ÀÖ½À´Ï´Ù.

Ç÷§ÆûÀ» »ç¿ëÇÏ´Â Athena¿Í RedshiftÀÇ µ¥ÀÌÅÍ ¿¡¼Âµé¿¡ ´ëÇÑ ¸ÞŸµ¥ÀÌÅÍ´Â Lyft¿¡¼­ ¿ÀǼҽºÈ­ ÇÑ AmundsenÀ» Ȱ¿ëÇÏ¿© īŻ·Î±ëÀ» Çϰí ÀÖ½À´Ï´Ù. ¶ÇÇÑ °¢ Å×ÀÌºí¿¡¼­ Äõ¸®ÇÒ¶§ Áß¿äÇÑ Á¤º¸(Index, Partition Key µî)¸¦ űëÇϰí, Airflow¿Í ¿¬µ¿ÇÏ¿© µ¥ÀÌÅÍ ¿¡¼Â°£ÀÇ lineage¸¦ º¸¿©ÁÖ°í ÀÖ½À´Ï´Ù.


⛳️ Contribution opportunities

ÆÀ¿¡ Á¶ÀÎÇϼż­, ¾Æ·¡ÀÇ °ú¾÷µéÀ» °°ÀÌ Ç®¾î³ª°¡¸é ÁÁ°Ú½À´Ï´Ù.

#SSOT

°ÅÀÇ ¸ðµç data pipelineÀÌ batch workflowÀ¸·Î ¿î¿µµÇ°í ÀÖ¾î, ½Ç½Ã°£À¸·Î µ¥ÀÌÅ͸¦ º¸°í½ÍÀº ´ÏÁ ÃæÁ·½ÃÄÑÁÖÁö ¸øÇÏ´Â »óȲÀ̰í, unified logging systemÀÌ ¾ø¾î À¯Áöº¸¼öÇϴµ¥ ¸¹Àº ½Ã°£À» ½ñ°í ÀÖ½À´Ï´Ù. ÇöÀç Confluent Kafka·Î ±âÁ¸ÀÇ data streaming ÀÎÇÁ¶ó¸¦ ÀÌÀüÇϰí ÀÖÀ¸¸ç, ÇÔ²² unified logging systemÀ» ¸¸µé¾î °¡°íÀÚ ÇÕ´Ï´Ù.

#DataDiscovery

2021³â 2ºÐ±â¿¡ µµÀÔÇÑ AmundsenÀ̶ó´Â data catalog ÅøÀ» Ȱ¼ºÈ­ ½ÃŰ´Â ´Ü°è¿¡ ÀÖ½À´Ï´Ù. ¿©·¯ Å×À̺íÀÇ Ä«Å»·Î±× »Ó¸¸ ¾Æ´Ï¶ó, °¢ Ä÷³ÀÌ °¡Áö´Â Ư¡À̳ª Åë°è, data quality status µîÀÇ ¿©·¯ Å×ÀÌºí¿¡ ´ëÇÑ metadata¸¦ ºÙÀÌ·Á ÇÕ´Ï´Ù.

#DataQuality

2021³â 2ºÐ±âºÎÅÍ µ¥ÀÌÅÍ qualityÀÇ Ã¼°èÀûÀÎ °ü¸® ¹× º¸ÀåÀ» À§ÇØ ¿©·¯ initiative¸¦ ½ÃµµÇϰí ÀÖ½À´Ï´Ù. µ¥ÀÌÅÍ »ý»êÀÚ¿Í ¼ÒºñÀÚ°¡ SLO¿Í expectationÀ» ¸ÂÃç º¼ ¼ö ÀÖ´Â ±³°¢À» ¸¸µå´Â ÀÏÀ» ÇÔ²² ÇØÁÖ¼ÌÀ¸¸é ÁÁ°Ú½À´Ï´Ù.

#DataLake

Data lake»ó¿¡¼­ data backfillÀ̳ª schema migrationµîÀÇ operationÀÌ data availability¿¡ ¿µÇâÀ» ÁÖÁö ¾Ê°Ô²û data versioning & release process¸¦ ¸¸µé¾î°¡°í ÀÖ½À´Ï´Ù. ÀÌ¿Í °°ÀÌ data platform »ó¿¡¼­ÀÇ ºñÈ¿À²À» Æ÷ÂøÇϰí ÃÖÀûÈ­¿Í ÀÚµ¿È­¸¦ ÁøÇàÇÏ´Â ÀÏÀ» °°ÀÌ ÁøÇàÇØº¸°í ½Í½À´Ï´Ù.

🔎¹öÁîºô¿¡¼­ ÀÏ ÀßÇÏ´Â ¹ý º¸·¯°¡±â

Requirements

👋 Who you are (ÀÌ·± ºÐÀ» ã½À´Ï´Ù!)

  • ¾ÈÁ¤ÀûÀ̰í È®Àå°¡´ÉÇÑ µ¥ÀÌÅÍ Á¦Ç°À» ¼³°èÇϰí À̸¦ ¼­ºùÇϱâ À§ÇØ ÇÊ¿äÇÑ »çÇ×À» Á÷Á¢ ±¸ÇöÇÏ½Ç ¼ö ÀÖ½À´Ï´Ù.
  • ³ôÀº ÄÚµå Ä÷¸®Æ¼¿Í ¾ÆÅ°ÅØÃÄ ¼öÁØÀ» ÁöÇâÇϸç, À̸¦ µ¥ÀÌÅÍ Ç÷§Æû ¹× µ¥ÀÌÅÍ Á¦Ç°¿¡ ³ì¿©³¾ ¼ö ÀÖ½À´Ï´Ù.
  • Airflow¿Í °°Àº workflow scheduler (Prefect, Oozieµî)¿¡ ´ëÇÑ ÀÌÇØ¿Í À̸¦ Ȱ¿ëÇÑ workflow °³¹ß °æÇèÀÌ ÀÖÀ¸½Å ºÐÀ» ã½À´Ï´Ù.
  • CS Àü°øÀÚ ¶Ç´Â ±×¿¡ »óÀÀÇÏ´Â ¾Ë°í¸®Áò, µ¥ÀÌÅͱ¸Á¶, OS, µ¥ÀÌÅͺ£À̽º µî ±âº»ÀûÀÎ Àü»ê Áö½Ä¿¡ ´ëÇÑ ÀÌÇØ¸¦ °®Ã߽ŠºÐÀ» ã½À´Ï´Ù.
  • (⚡️ ¿ì´ë»çÇ×) AWS, KubernetesµîÀÇ cloud native ȯ°æ¿¡¼­ÀÇ µ¥ÀÌÅÍ ÀÎÇÁ¶ó ±¸Ãà¿¡ ´ÉÇÑ ºÐÀ» ã½À´Ï´Ù.
  • (⚡️ ¿ì´ë»çÇ×) ¾ðÁ¦µç Airflow¿Í °°Àº ¿ÀǼҽº Ç÷§Æû Äڵ带 µö´ÙÀ̺ê ÇÏ½Ç ¼ö ÀÖ´Â ÀÇÁö¿Í ´É·ÂÀÌ ÀÖ´Â ºÐÀ» ã½À´Ï´Ù.

📃 Process

  • ¼­·ù ÀüÇü: ÇÕ°Ý/ºÒÇÕ°Ý ¾È³» (1ÁÖÀÏ À̳»)
  • È­»ó ÄÚµùÅ×½ºÆ®(Çà¾Æ¿ô) or »çÀü°úÁ¦
  • 1Â÷ ¸éÁ¢: ½Ç¹«Áø ¸éÁ¢ (On-site ÄÚµù Å×½ºÆ® Æ÷ÇÔ)
  • 2Â÷ ¸éÁ¢: ÀÓ¿ø ¸éÁ¢
  • ·¹ÆÛ·±½º üũ ¹× ¿¬ºÀ Çù»ó
  • ÃÖÁ¾ ÇÕ°Ý Å뺸 ¹× ¿ÀÆÛ·¹ÅÍ Àü´Þ
  • Benefits

    🍭 ±âº»ÀûÀÎ ¹öÁîºô¸®¾ðÀÇ »ýȰÀ» À§ÇÏ¿©,

    • Á¡½É½Ä´ë Áö¿ø ¹× ¹«Á¦ÇÑ °£½Ä/À½·á Á¦°ø
    • ÈÞ°Ô½Ç, ¼ö¸é½Ç, Ä«ÆäÅ׸®¾Æ, °ÔÀÓ·ë ¿Ïºñ
    • ÄèÀûÇϰí Àü¸Á ÁÁÀº »ç¹«½Ç ȯ°æ - ¼®ÃÌÈ£¼ö µµº¸ 1ºÐ

    🗽 ÀÚÀ²ÀûÀ̸ç, »ý»êÀûÀ¸·Î ÀÏÇÏ´Â ¹öÁîºô¸®¾ðÀ» À§ÇÏ¿©,

    • 8½Ã-10½Ã »çÀÌ ÀÚÀ² Ãâ±Ù, ¿¬Â÷ ÀÚÀ² »ç¿ë, ¸ðµç Çà»ç/ȸ½Ä ÀÚÀ² Âü¿©
    • ºÐ±â 1ȸ 2½Ã°£ ¿¬Â÷ ºÎ¿© (¿¬Â÷¿Í º°µµ·Î ºÐ±âº° 2½Ã°£ Á¦°ø)

    👑 ¼öÆòÀûÀ̰í, ÆÀ¿öÅ©¸¦ Áß½ÃÇÏ´Â ¹öÁîºô¸®¾ðÀ» À§ÇÏ¿©,

    • ¿ù 2ȸ ÀüüȸÀǸ¦ ÅëÇØ Åõ¸íÇÏ°Ô Á¤º¸¸¦ °øÀ¯ÇÏ°í °øÁ¤ÇÑ »ç³» ¹®È­ Çü¼º
    • Àü ±¸¼º¿ø ¿µ¾îÀ̸§/´Ð³×ÀÓ »ç¿ë (¸¶ÀÌŬ´Ô X, ¸¶ÀÌŬ O)
    • ±Û·Î¹ú ¸â¹öµé°ú ¸ðµÎ ¾î¿ï¸± ¼ö ÀÖµµ·Ï ¿¬ 1ȸ ±Û·Î¹ú ¿öÅ©¼¥ ÁøÇà

    🌟 ¹öÁîºô¸®¾ð °³°³ÀÎÀÇ ¼ºÀå°ú ¹ßÀüÀ» Áö¿øÇϱâ À§ÇÏ¿©,

    • Àڱⰳ¹ßºñ ¸Å¿ù 10¸¸¿ø Áö±Þ
    • ÀÚ±â°è¹ß ÇÁ·ÎÁ§Æ® ´Â BuzzChallenge ¿î¿µ
    • 3³â ÀÌ»ó Àå±â ±Ù¼ÓÀÚ 2ÁÖ À¯±ÞÈÞ°¡ Áö±Þ (BuzzHoliday)
    • »ç³» ½ºÅ͵ð ¹× µ¿È£È¸ºñ / µµ¼­±¸ÀÔ ¹«Á¦ÇÑ Áö¿ø
    • ¿ÜºÎ ¼¼¹Ì³ª/ÄÁÆÛ·±½º Âü¼® ½Ã ºñ¿ë Áö¿ø

    ➕ What you can expect

    1. ÁÁÀº °³¹ß ¹®È­¿Í ȯ°æ: ¹öÁîºôÀº ȸ»ç¿Í ÆÀ, °³ÀÎ ¸ðµÎÀÇ ¼ºÀåÀ» Àû±ØÀûÀ¸·Î Áö¿øÇÕ´Ï´Ù. ÁÁÀº ¹®È­¿Í ÈǸ¢ÇÑ µ¿·á ´öºÐ¿¡ ºü¸¥ ¼ºÀåÀ» °æÇèÇÒ ¼ö ÀÖ½À´Ï´Ù.

    • ÄÚµå ¸®ºä¸¦ ÅëÇÑ Àû±ØÀûÀÎ °øÀ¯ ¹× ¼ÒÅë
    • Äí¹ö³×Ƽ½º(Kubernetes)¿Í Ŭ¶ó¿ìµå ȯ°æ À§¿¡ ±¸ÃàµÈ ¸¶ÀÌÅ©·Î¼­ºñ½º ¾ÆÅ°ÅØÃ³
    • Á÷±ºÀÇ °æ°è¸¦ Ç㹫´Â ´Éµ¿ÀûÀÎ Âü¿© ¹®È­
    • ÀÚÀ²ÀûÀ̰í È¿À²ÀûÀÎ ¾÷¹« ÇÁ·Î¼¼½º
    • °³¹ß »ý»ê¼º Çâ»óÀ» À§ÇÑ °ú°¨ÇÑ ÅõÀÚ
    • µµ¼­ Áö¿ø, ½ºÅ͵ð Áö¿ø, ÄÁÆÛ·±½º Áö¿ø µî Àû±ØÀûÀÎ ÇнÀ µ¶·Á
    • ÁÁÀº ¼³°è¿Í ÁÁÀº Äڵ带 À§ÇÑ Áö¼ÓÀûÀÎ ³ë·Â
    • ³ôÀº ¾ÖÀÚÀϸ®Æ¼
    • »õ·Î¿î ±â¼ú µµÀÔ¿¡ ´ëÇÑ Àû±ØÀûÀÎ ³íÀÇ¿Í Áö¿ø
    • ÁÖ±âÀûÀÎ ¼¼¹Ì³ª¸¦ ÅëÇÑ Áö¼ÓÀûÀÎ ÇнÀ

    2. ±¤°í µµ¸ÞÀÎ ÇнÀ: ¿À·¡µÈ ±¤°í ¾÷°èÀÇ ¿ª»ç¿¡µµ ºÒ±¸ÇÏ°í ±¤°í¾÷ÀÇ ¼ºÀåÀº ¿©ÀüÈ÷ ºü¸£°Ô ÁøÇàµÇ°í ÀÖ½À´Ï´Ù. µðÁöÅÐ ±¤°í, ƯÈ÷ ¸ð¹ÙÀÏ ±¤°í ½ÃÀåÀÇ ¼ºÀå¼¼´Â ÀÌ¹Ì Á¸ÀçÇÏ´ø ±âÁ¸ ±¤°í ½ÃÀåÀÇ Å©±â¸¦ ³Ñ¾î¼¹°í, ´õ ºü¸£°Ô ¿Ã¶ó°¡°í ÀÖ½À´Ï´Ù. ±¤°í ºÐ¾ßÀÇ µµ¸ÞÀÎ Áö½ÄÀº ¸Å¿ì ±í°í ³ÐÀ¸¸é¼­µµ Ȱ¿ëµµ°¡ ³ô½À´Ï´Ù. ¹öÁîºô¿¡¼­ ±¤°í ¾÷°è Àü¹ÝÀÇ Áö½ÄÀ» ½ÀµæÇÒ ¼ö ÀÖ°í, À̸¦ ¹ÙÅÁÀ¸·Î ´Ù¾çÇÑ ºÐ¾ß¿¡¼­ ¼öÀÍÈ­°¡ ¼ö¹ÝµÈ Çõ½ÅÀ» ¸¸µé ¼ö ÀÖ½À´Ï´Ù.

    🎤 Âü°í»çÇ×

    • Àå¾ÖÀÎ, ±¹°¡À¯°øÀÚ, º¸ÈÆ ´ë»óÀÚ´Â °ü·Ã ¹ý·É¿¡ µû¶ó ¿ì´ëÇÕ´Ï´Ù.
    • À̷¼­ Á¦Ãâ ½Ã, ÇöÀç ¿¬ºÀÀº ±âÀçÇÏÁö ¸»¾Æ ÁÖ¼¼¿ä.
    • °³¹ßÀÚÀÇ °æ¿ì, GitHub °èÁ¤À» ÇÔ²² Á¦ÃâÇØÁÖ½Ã¸é ´õ ¸¹Àº À̾߱⸦ ³ª´­ ¼ö ÀÖ½À´Ï´Ù.
    • Æ÷Æ®Æú¸®¿À°¡ ÀÖÀ¸½Ã´Ù¸é ¸µÅ©·Î À̷¼­¿¡ ÇÔ²² ÀÔ·ÂÇØ ÁÖ¼¼¿ä.