Oh my Stack 프로젝트 설명, 2023년 상반기 회고록
지난 30일 동안 데이터 엔지니어로써 참여했던 프로젝트 ‘Oh my Stack’를 설명하고 회고해보려고 한다. 프로젝트에 관련된 모든 소스는 다음 링크에서 볼 수 있다. https://github.com/jewoodev/Oh_My_Stack 1. Oh my Stack를 기획한 이유 이 프로젝트의 필요성, 기획 이유에 대한 이야기는 ‘취업난’에서부...
지난 30일 동안 데이터 엔지니어로써 참여했던 프로젝트 ‘Oh my Stack’를 설명하고 회고해보려고 한다. 프로젝트에 관련된 모든 소스는 다음 링크에서 볼 수 있다. https://github.com/jewoodev/Oh_My_Stack 1. Oh my Stack를 기획한 이유 이 프로젝트의 필요성, 기획 이유에 대한 이야기는 ‘취업난’에서부...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 1. Backfill이란… 데이터 파이프라인을 운영하다보면 이미 지난 날짜를 기준으로 ETL을 재처리 해야하는 경우가 종종 생깁니다. 그런 재처리 작업을 Backfill(‘메우는 작업’)이라는 이름으...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 1. Apache Airflow란? Airflow는 AriBnB에서 만든 workflow management tool입니다. workflow는 일련의 작업 흐름으로, 예를 들어 ETL처럼 데이터를 Ext...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 비구조화된 데이터 처리 비구조화된 데이터는 AWS에서 제공하는 S3라는 클라우드 스토리지에 저장합니다. S3외에 다른 스토리지를 선택할 수도 있습니다. 다만, S3는 가격이 싸면서도 로그파일같은...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 이번 글에서는 기본적인 SQL 쿼리문들을 정리해보겠습니다. 먼저 DDL입니다. 1. DDL - 테이블 구조 정의 언어 CREATE TABLE Primary key 속성을 ...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. Redshift는 클라우드에서 관리되는 데이터 웨어하우스 서비스입니다. 그 용량은 작게 수백 기가 바이트부터 페타바이트 이상까지 데이터를 확보할 수 있습니다. 그렇다면 데이터 웨어하우스는 무엇일까요?...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 그리고 Airflow을 사용한다는 전제 하에 글을 적어내린다는 점을 참고해주세요. (데이터베이스 : PostgreSQL) 1. Incremental Update는 왜 필요한가요? 데이터 파이프...
이 글은, 프로그래머스에서 진행되는 실리콘밸리에서 날아온 데이터 엔지니어링 키트 with Python에서 배운 내용을 바탕으로 이루어져 있습니다. 데이터 엔지니어에게 SQL이란? 데이터 엔지니어라는 직군을 떠올렸을 때 ‘아무래도 엔지니어니까 SQL보다 다른 언어를 많이 쓰지 않을까?’ 생각하기 쉽지만, 누구보다 SQL을 많이 사용하고 잘 다룰...
1. SQL이란? SQL은 Structured Query Language (구조적 질의 언어)의 줄임말로, 관계형 데이터베이스 관리 시스템(RDBMS)의 데이터를 처리하고 저장하기 위해 설계된 특수 목적의 프로그래밍 언어입니다. 관계형 데이터베이스는 정보를 표 형식으로 저장하며, 행과 열은 데이터 속성과 데이터 값 간의 다양한 관계를 나타냅니다. ...
wsl 을 사용하시다가 systemctl 명령어를 사용할 때 와 연관된 에러가 발생하고, 에러를 해결하고 싶다면 아래 command 를 차례로 실행해주세요. sudo -b unshare --pid --fork --mount-proc /lib/systemd/systemd --system-unit=basic.target sudo -E nsent...