DATA MARKETING

도전기!_!

전체 글 26

#3. SQL_study_with Programmers

STRING,DATE 연습 (2) 취소되지 않은 진료 예약 조회하기문제https://school.programmers.co.kr/learn/courses/30/lessons/132204 프로그래머스SW개발자를 위한 평가, 교육의 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr 환자, 의사, 진료 예약 정보를 담은 테이블에서▶️ 2022년 4월 13일,▶️ 취소되지 않은 흉부외과(CS) 예약 내역을 조회하는 SQL 작성출력 항목:진료예약번호 (APNT_NO)환자이름 (PT_NAME)환자번호 (PT_NO)진료과코드 (MCDP_CD)의사이름 (DR_NAME)진료예약일시 (APNT_YMD)정렬 조건:진료예약일시 (APNT_YMD) 기준 오름차순 정렬 오답 쿼..

SQL 2025.06.15

#2. SQL_study_with Programmers

STRING,DATE 연습 문제 설명ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.NAMETYPENULLABLEANIMAL_IDVARCHAR(N)FALSEANIMAL_TYPEVARCHAR(N)FALSEDATETIMEDATETIMEFALSEINTAKE_CONDITIONVARCHAR(N)FALSENAMEVARCHAR(N)TRUESEX_UPON_INTAKEVARCHAR(N)FALSE보..

SQL 2025.06.08

#1. SQL_study_with HackerRank

SQL 실력 향상을 위해 HackerRank 플랫폼에서 기초 SELECT 문부터 수학 함수까지 실습 진행→ WHERE, AND, 내장 함수 POWER(), SQRT() 등 학습 ✅ 문제 1: 특정 ID의 도시 정보 조회 (Select by ID)문제: CITY 테이블에서 ID가 1661인 도시의 모든 컬럼을 조회하시오.풀이 SQLSELECT * FROM CITYWHERE ID = 1661;배운 점:SELECT *은 전체 컬럼을 조회할 때 사용WHERE 조건문을 통해 특정 행 필터링✅ 문제 2: 북위, 서경 조건을 만족하는 도시 조회 (Weather Observation Station 1)문제: LAT_N > 38 이고 LONG_W 풀이 SQLSELECT CITY, STATEFROM STATIONWHER..

SQL 2025.06.08

CRM 캠페인 분석을 위한 SQL 쿼리(1)

기본적으로 자주 사용하는 쿼리 SELECT자주 사용하는 집계 함수: SUM(금액) AS 매출COUNT(DISTINCT ~) AS 명/수+) DISTINCT는 상황에 따라&구하고자 하는 값에 따라 COUNT 시 추가DENSE_RANK() OVER(PARTITION BY ~ ORDER BY ~ ASC/DESC) AS RNK+) 누적 순위 구하기 위해 실무에서 RANK보다 DENSE_RANK를 주로 사용 CASE WHEN col = 0 THEN 'x'WHEN col = 1 THEN 'y'ELSE 'z'ENDFROMWHEREselect에 대한 조건and 혹은 or로 다중 조건 가능col = 'Y' : col이 Y인 것col 'Y' : col이 Y가 아닌 것WHERE mobilenumber LIKE '01..

CRM 2025.05.09

마케팅과 머신러닝 (basic)

머신러닝이란?데이터에서 패턴을 찾아 학습하고, 새로운 데이터에 대해 예측을 수행하는 시스템 머신러닝의 주요 학습 유형머신러닝은 학습 방식에 따라 다음과 같이 분류할 수 있습니다. 1) 지도 학습(Supervised Learning)정의: 입력 데이터(특징, Feature)와 이에 대응하는 정답(레이블, Label)이 주어진 상태에서 학습하는 방식목표: 주어진 데이터를 기반으로 입력과 출력 간의 관계를 학습하여, 새로운 입력값에 대해 올바른 출력을 예측하는 것예제이메일이 스팸인지 아닌지를 분류하는 모델주어진 집의 특성을 보고 가격을 예측하는 모델대표 알고리즘선형 회귀(Linear Regression)로지스틱 회귀(Logistic Regression)의사결정나무(Decision Tree)랜덤 포레스트(Ran..

k-NN 알고리즘 & 웹 기반 추천/자동화 시스템 구현

k-NN 알고리즘 개요 거리 측정: 새로운 데이터 포인트와 모든 훈련 데이터 포인트 간의 거리를 계산합니다. 일반적으로 유클리드 거리(Euclidean Distance)를 사용하지만, 맨해튼 거리(Manhattan Distance) 등 다른 거리 측정 방법도 사용할 수 있습니다.이웃 선택: 계산된 거리 값을 기준으로 가장 가까운 $k$개의 이웃을 선택합니다.분류/회귀:분류: 선택된 k개의 이웃 중 가장 많은 클래스를 새로운 데이터 포인트의 클래스로 할당합니다. 즉, 다수결 투표(Majority Voting) 방식으로 클래스를 결정합니다.회귀: 선택된 k개의 이웃의 평균 값을 새로운 데이터 포인트의 예측 값으로 사용합니다. k-NN 그래프 설명:빨간색 원: 클래스 A에 속하는 데이터 포인트들입니다.파란색 ..

의사결정 나무 (Decision Tree)

의사결정 나무란?결정 트리(Decision Tree)는 트리(Tree) 구조를 사용하여 데이터를 분류(Classification)하거나 회귀(Regression)하는 지도 학습(Supervised Learning) 알고리즘이다.트리의 각 노드는 특정 특징(feature)을 기준으로 데이터를 나누는 역할을 하며, 최종적으로 예측값(클래스 또는 수치)을 도출한다.  결정 트리의 구조결정 트리는 아래와 같은 트리 구조(Tree Structure) 로 이루어진다.루트 노드(Root Node):데이터가 처음 입력되는 노드가장 중요한 특징(Feature)을 기준으로 데이터를 나누는 역할내부 노드(Internal Nodes):특정 특징을 기준으로 데이터를 분할(Split) 하는 역할각 노드는 질문(조건문)을 포함하며..

로지스틱 회귀 분석 (Logistic Regression) & 모델 평가 지표

[이론 설명] 회귀분석관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정해 내는 분석 방법 선형 회귀주어진 데이터로부터 변수 간의 상관관계를 파악하고, 이를 바탕으로 미래의 값을 예측하거나 변수들이 어떻게 상호작용하는지 이해하는 데 사용됨 (인과관계가 아님!!) 로지스틱 회귀이진 분류 문제를 해결하는 지도 학습 알고리즘(machine learning model)출력값이 확률(0~1 사이의 값)으로 변환된 후 특정 임계값에 따라 분류됨시그모이드 함수를 사용하여 확률을 예측하고, 특정 임계값(기본: 0.5) 기준으로 분류를 수행그로스 마케팅에서는 광고 클릭 예측, 고객 이탈 예측, 스팸 메일 분류 등에 활용모델 평가 지표로 정확도, 정밀도, 재현율, F1-score 등을 사용  시그모..

다중 분류 (Multi-Class Classification)

다중 분류란?세 개 이상의 클래스를 분류하는 문제 => 소프트맥스 함수 사용이진 분류: 두 개의 클래스 분류 => 시그모이드 함수 사용손글씨 숫자 인식 (MNIST 데이터셋) → 0~9까지의 10개 숫자를 분류상품 추천 시스템 → 고객을 여러 구매 성향(High-Spender, Medium-Spender, Low-Spender)으로 분류 소프트맥스 함수 (softmax function)소프트맥스 함수는 각 클래스에 대한 확률 값을 출력하며, 확률 합은 항상 1이 된다.가장 확률이 높은 클래스를 최종 예측값으로 선택.   다중 분류 모델 평가 방법이진 분류와 마찬가지로 다중 분류에서도 정확도, Precision, Recall, F1-score 등을 활용하여 모델 성능을 평가할 수 있다.다만 다중 분류에서는..

데이터 전처리 KPI 분석 종합 실습과제 (장바구니 이탈률, 광고 채널별 평균 구매 금액&횟수, 재구매율···)

📌 실습 개요한 이커머스 쇼핑몰에서 운영팀이 고객 데이터를 기반으로 그로스 마케팅 KPI를 설정하고 분석하는 데이터 보고서를 작성하려고 합니다.EDA(탐색적 데이터 분석) 및 데이터 전처리를 수행하여 고객 행동 패턴을 분석하고, 시각화하여 마케팅 전략을 제안하는 것이 목표입니다.📊 시나리오 및 데이터 설명✔ 배경:이커머스 쇼핑몰의 마케팅팀은 최근 고객 유입이 증가했지만, 구매 전환율과 재구매율이 낮은 현상을 발견했습니다.이에 따라 고객 행동 데이터를 분석하여 마케팅 KPI를 정의하고, 전략을 개선할 방법을 찾고자 합니다.✔ 목표:신규 고객과 기존 고객의 행동 패턴을 비교하고, 차이를 분석합니다.장바구니 이탈률과 구매 전환율을 분석하여 원인을 찾고 개선 방향을 제안합니다.광고 채널별 성과를 분석하여 R..