본문 바로가기
멋쟁이사자처럼 AIS7/오늘코드

[1013] EDA, Data Sampling, 파생변수를 이용한 Data 가공, 시각화(3-7 미작성)

by YeonGun M 2022. 10. 13.

3-6. 의약품 처방정보 샘플링

전수조사를 하기엔 데이터가 너무 방대하므로 표본조사를 실행함

numpy 를 이용한 샘플링

  • np.random.seed
  • np.random.default_rng
  • 코드
    np.random.seed(42)
    sample_no = np.random.choice(raw['가입자 일련번호'].unique(), 10000)
    rng = np.random.default_rng(42)
    sample_no = rng.choice(raw['가입자 일련번호'].unique(), 10000)

pandas 를 이용한 샘플링

  • df.sample()
  • 코드
    sample_no = raw['가입자 일련번호'].sample(10000, random_state=42)

3-7. 의약품 처방정보 전처리 분석

'멋쟁이사자처럼 AIS7 > 오늘코드' 카테고리의 다른 글

[1025] Machine Learning  (0) 2022.10.25
[1024] ML Tools  (0) 2022.10.24
[1012] EDA, Tidy Data, KOSIS, 정규표현식  (0) 2022.10.12
[1011] EDA  (0) 2022.10.11
[1005] EDA  (0) 2022.10.05

댓글