본문 바로가기
멋쟁이사자처럼 AIS7/오늘코드

[1219] 시계열 데이터와 비즈니스 데이터 분석

by YeonGun M 2022. 12. 19.

시계열 분석

1. tensorflow 링크

https://www.tensorflow.org/tutorials/structured_data/time_series

2. window_size

Untitled

 

비즈니스 데이터 분석과 군집화

1. 오가닉 트래픽(Organic Traffic)

  • 광고나 소셜미디어, 리퍼럴 사이트와 같은 채널을 통해 사이트로 유도되는 트래픽을 제외하고
  • 검색 엔진을 통해 곧바로 유입되거나 동일한 도메인 안에서 유입되는 트래픽
  • '고객에게 자연스럽게 도달한다'는 의미

 

2. Attribute Information

  • InvoiceNo : 송장번호, 6자리 정수
    • 이 코드가 문자 'c'로 시작하면 취소를 의미
  • StockCode : 제품 코드
  • Description : 제품 이름
  • Quantity : 거래당 각 제품의 수량
    • 이 코드가 '-'(마이너스)로 시작하면 취소를 의미
  • InvoiceDate : 송장 날짜, 시간, 숫자, 각 거래가 생성된 날짜 및 시간
  • UnitPrice : 단가, 숫자, 스털링(영국 화폐) 단위의 제품 가격
  • CustomerID : 고객 번호, 5자리 저웃
  • Country : 국가 이름, 고객 거주 국가

 

 

코호트, 잔존률 분석

3. AARRR

회사, 분야마다 AAARR로 적용되기도 함

  • Acquisition : 어떻게 우리 서비스를 접하고 있는가 ex. 첫 방문
  • Activation : 사용자가 처음 서비스를 이용할 때 긍정적인 경험을 제공하는가 ex. 첫 회원가입
  • Retention : 이후의 서비스 재사용률은 어떻게 되는가 ex. 재구매
  • Referral : 사용자가 자발적 바이럴, 공유를 일으키고 있는가 ex. 친구소개
  • Revenue : 최종 목적(매출)으로 연결되고 있는가 ex. 첫 구매

 

4. 코호트 분석(Cohort analysis)

  • 분석 전에 데이터 세트의 데이터를 관련 그룹으로 나누는 일종의 행동 분석
  • 해당 그룹은 일반적으로 정의된 시간 범위 내에서 공통된 특성이나 경험 공유
  • 코호트 분석을 통해 고객의 수명주기 전반에 걸친 패턴을 명확히 볼 수 있음 => 특정 집단에 맞게 서비스 조정 가능

코호트 분석의 유형

  • 시간집단: 특정 기간 동안 제품이나 서비스에 가입한 고객
    • 고객이 회사의 제품이나 서비스를 시작한 시점을 기준으로 행동이 나타남
    • 시간은 월별, 분기별, 매일 등
    • Online Retail에 적용
  • 행동집단: 과거에 제품을 구매했거나 서비스에 가입한 고객
    • 가입한 제품 또는 서비스 유형에 따라 고객 그룹화
    • 기본 서비스 고객의 요구사항 =/= 고급 서비스 고객의 요구사항
    • 다양한 코호트의 요구사항 이해 => 맞춤형 서비스 제품 설계 도움
  • 규모집단: 회사의 제품이나 서비스를 구매하는 다양한 고객
    • 획득 후 특정 기간의 지출 금액 기반 or
    • 고객이 주어진 기간 동안 주문 금액의 대부분을 지출한 유형 기반

cf. 여성 의료가 가장 구매가 많이 일어나는 시간은? 새벽 1시

 

5. 잔존율 분석(Retention rate analysis)

  • 리텐션 분석: 고객이 이탈하는 방법과 이유를 이해하기 위해 사용자 매트릭을 분석하는 과정
  • 유지 분석: 유지 및 신규 사용자 확보율을 개선하여 수익성 있는 고객 기반을 유지 방법 확보
  • 일관된 유지 분석을 통해 알 수 있는 항목
    • 고객이 이탈하는 이유
    • 고객이 떠날 가능성이 더 높을 때
    • 이탈이 수익에 미치는 영향
    • 유지 전략을 개선하는 방법

댓글