데이터 분석/ADP 자격증 공부

[ADP 실기] 34회 복기

나르시스트 2026. 4. 6. 22:23

<누적 요약>

1차 - 책 검색하다 시간 다감 → 정리해서 가자

2차 - 전처리에서 시간 오래 걸림 → 전처리 연습 좀 하자. Jupyter 한 줄씩 실행해서 데이터 계속 달라지는 문제 발견

3차 - 시계열 전처리 → 시계열 데이터 처리 부분 출력 안 함. Merge 못해서 -20점.. 합격할 수 있었는데 ^^

4차 - 머신러닝 중간에 데이터 확인 안 해서 마지막에 결과 잘 안 나옴 + 통계분석은 원래 거의 만점인데 나락감.. 

5차 - 기억 안 남.. ㅋㅋㅋ 기타 새로운 문제 또 나오고 시험에 대한 회의감 느끼고 이제 안 하기로 다짐

 

<34회> - 4차

→ 데이터를 함수에 잘 못 넣어서 함수가 안 돌아감
→ 전체 문제 잘 읽기
→ 데이터 확인하기, 빈도수로 ==0, ==1, ==2 잘 되었나
→ #2-2부터는 마지막에 정리?

 

1번 – 머신러닝 #1

→ 전처리는 많이 발전, but 시간이 오래 걸림
→ 전처리 과정 중 일부 데이터가 사라짐 select_dtype() 함수인듯, 열이 몇개 잘렸다고 기억함
→ float 형만 null 처리하는거 mean()으로? 수동으로 할 걸 그랬다고

→ train/test/predict 세가지 나누기?

 

1. 변수들 간 연관성 확인 – 교차표 & 카이제곱

 

2. 조건문이 아닌 데이터 처리

 

3. 데이터 전처리 문제

 

4. EDA 시각화

 

5. 단일 알고리즘 모델, 앙상블 모델

 

o to_numeric, errors=’coerce’ 했는데, – not string to float 오류

2번 (나름 굿)

1. 전처리 – 날짜/시간 melt 등

 

2. 피어슨 상관계수, ANOVA 분석

 

3. 일반 회귀모형, 기계학습 모델

3번 – 이원배치 분산분석 문제 – 2 x 3 형태

데이터를 함수에 잘못 입력해서 날림

4번 – 회귀모델, VIF

  1. 선형회귀 여러 변수 넣는거 실패
  2. cor() 여러 열 x, 단일 y 관계, 여러 변수 처리 실패


EDA 여러 x 열 + y 열 처리하는 방법
add_constant 여러 x 열 처리?