2026/04/04 17

머신러닝 종류(지도, 비지도, 강화 학습)

*출처: https://ww2.mathworks.cn/discovery/reinforcement-learning.html*지도학습(Supervised learning)– 주어진 데이터를 학습하여 새로운 데이터에 적용하는 것– 종류: 로지스틱 회귀분석, 의사결정나무, 나이브 베이즈 분류, KNN, SVM, 앙상블, 인공신경망 분석*비지도학습(Unsupervised learning)– 입력 데이터에서 숨겨진 패턴을 발견– 종류: 군집분석, 주성분 분석, 연관규칙 분석, 사회연결망 분석, 텍스트마이닝*강화학습(Reinforcement learning)– 보상을 최대화하는 방향으로 학습 → 에이전트와 환경의 상호작용으로부터 학습– 게임, 로봇 공학, 최적화 문제 등– 종류: Q-Learning – DQN 등① ..

[ADP 필기] (머신러닝) 분류 모형 성능 평가

*데이터마이닝– 대용량 데이터에서 의미 있는 패턴을 파악하거나 예측 → 의사결정– 모델 + 필요한 데이터 (목적변수 정의 + 가공)※ 트레이닝, 테스트, 평가 데이터 비율 – 5:3:2*데이터분할홀드아웃: 랜덤하게 학습용/시험용으로 분리※ 장점: 구현이 간단하고 계산 비용이 낮음※ 단점: 데이터 세트의 분할 방법에 따라 모델의 성능 평가가 달라질 수 있다. 특히, 데이터가 적을 때 성능 추정이 불안정할 수 있음교차검증(Cross-Validation): 데이터 세트를 여러 부분으로 나누어, 그 중 하나를 테스트 세트로, 나머지를 트레이닝 세트로 사용하는 방식*K-fold Cross-Validation: k개의 하부 집단으로 구분→ k-1개는 학습용으로, 주로 10-fold 교차분석을 많이 사용※ 장점: 모..

[ADP 필기] 다차원 척도법

*다차원척도법– 객체 간 근접성을 시각화하는 통계기법 (2차원 or 3차원 공간 상에 점으로 표현)→ 패턴, 구조를 찾아내기 위해! 데이터 축소의 목적으로! (탐색)*다차원척도법 방법→ 유클리드 거리행렬 활용 (개체들의 거리 계산)→ 정확도를 높이기 위해 적합 정도를 스트레스 값으로 나타냄STRESS 0: 완벽0.05 ~ 0.1: 만족0.15 이상: 나쁨*다차원척도법 종류① 계량적 MDS→ 데이터가 구간척도나 비율척도인 경우 활용(cmdscale 함수)② 비계량적 MDS→ 데이터가 순서척도인 경우 활용(isoMDS, sammon 함수)*주성분 분석– 여러 변수들의 변량을 ‘주성분’이라는 서로 상관성이 높은 변수들의 선형 결합으로 만들어기존의 상관성이 높은 변수들을 요약, 축소하는 기법 (4개 이상 넘지 ..

[ADP 필기] 시계열 분석

*시계열 분석– 시계열 데이터 분석을 통해 미래감을 예측하고 경향(추세), 주기, 계절성 등을 파악– 비정상성/정상성 시계열 자료 *정상 시계열E(y+)=M, var(y+)=σ2① 평균이 일정할 경우 ← 차분을 통해 정상화 (현시점-전시점 자료)② 분산이 일정 ← 변환을 통해 정상화③ 공분산도 단지 시차에만 의존, 실제 특정 시점 t, s에는 의존 XCov(yt, yt + s) = Cov(yt, yt – s) = rs (공분산은 t가 아닌, s에 의존)일변량 시계열분석: 시간(t)을 설명변수로 한 회귀모형주가, 소매물가지수 등 하나의 변수에 관성Box-Jenkins (ARMA), (직관적 방법) 지수평활법, 시계열분해법다중 시계열분석: 여러 개의 시간(t)에 따른 변수들을 활용계량경제모형(회귀분석, 장기..

[ADP 필기] (통계) 회귀분석(일반, 최적, 정규화, 일반화 선형회귀 등)

*회귀분석 (x → y)– 하나 이상의 독립 변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법※ 가정: 선형성, 등분산성, 독립성, 비상관성, 정규성1. 단순 선형회귀분석 – 하나의 독립변수– 결정계수 R2 확인 (0~1)– 잔차 제곱이 가장 작은 선을 구하는 것(최소제곱법, 최소자승법)→ 유의수준 보다 작으면, 독립변수가 종속변수에 영향을 준다고 볼 수 있다→ 다변량 회귀분석에서는 독립변수가 많아지면, R2이 높아지므로 Ra2(수정된 결정계수)를 이용2. 다중 선형회귀분석모형의 통계적 유의성은 F 통계량으로 확인회귀계수의 유의성은 t 통계량으로 확인설명력은 R2 혹은 Ra2을 확인*다중공선성 검사 필요 → 설명변수들 사이에 선형관계가 있는지→ 분산팽창요인(VIF)이 4보다 크면 다중공선성 O..

[ADP 필기] (통계) 기본 개념 및 용어 설명

*탐색적 자료분석 (EDA)– 저항성의 강조, 잔차계산, 자료변수의 재표현, 그래프를 통한 현시성 *표본추출방법1 단순랜덤추출법2 계통추출법 : 무작위로 구간을 나누고, 구간의 매번 k번째 요소를 추출3 집락추출법: 군집을 구분하고, 군집별로 단순 랜덤 추출4 층화추출법: 이질적인 원소들을 각 계층으로 나누고, 각 층별로 랜덤 추출 *질적척도 (범주형자료)– 명목척도, 순서척도(서열관계)*양적척도 (수치형자료)– 구간척도(등간척도)→ 곱하거나나누기X ex) 온도, 지수 → 비율의미X– 비율척도→ 절대적 기준인 0인 존재, 사칙연산O ex) 무게, 나이, 시간, 거리 *표본공간: 모든 결과들의 집합– 이벤트: 표본공간의 부분집합– 엘리멘트: 나타날 수 있는 개별 결과들 *확률변수 X의 기대값E(x) = Σ..

[ADP 필기] (통계) 교차분석, 카이제곱 검정

*카이제곱 검정(교차분석)– 각 범주에 따른 결과 변수의 분포 혹은 범주형 변수(명목/서열) 간에 상관이 있는지 검정: 적합도, 독립성, 동질성– 즉, 한 변수의 분포가 다른 변수의 분포와 관련이 있는지를 판단– 종속변수의 관찰빈도– 각 범주의 기대 빈도는 5 이상 → 기대빈도가 5 미만인 셀 비율이 20% 넘으면 X1. 적합성 검정 – H0: 비율이 50%, 50%이다2. 독립성 검정 – H0: A변수와 B변수는 독립이다3. 동질성 검정 – H0: class의 분포는 survived에 관계없이 동일하다– 실험 데이터 형태→ 각 셀의 관찰빈도와 기대빈도 간의 차이를 검정기대 빈도 계산: 각 셀에 대한 기대 빈도* 계산*기대 빈도는 해당 행의 합계와 해당 열의 합계를 곱한 다음, 전체 합계로 나누어 계산예..

[ADP 필기] (통계) 분산분석, ANOVA

*분산분석 (ANOVA)– 두 개 이상의 다수 집단간 평균을 비교하는 통계 분석1. One-way ANOVA (일원배치 분산분석)– 하나의 범주형 독립변수– 모집단 수에는 제한X, 각 표본 수는 같지 않아도 됨※ 가정: 집단의 측정치는 서로 독립, 정규분포, 등분산 가정① 가설수립 – 귀무가설(Ho): k개 집단 간 모평균에는 차이가 없다② 정규성 검정 (모두 만족해야 함) → 만족 못하면, Kruskal 검정③ 등분산 검정→만족못하면, welch-anova 분석④ f-oneway 검정⑤ 사후검정 (Tukey HSD 등)※ 단일변량 분산분석 Y – 1개, 다변량 분산분석(MANOVA) Y – 2개 이상2. Two-way ANOVA (이원배치 분산분석)– 두 개의 범주형 독립변수※ 가정: 집단의 측정치는 ..

[ADP 필기] (통계) T-검정, T-Test

*가설검정– 새롭게 주장하고자 하는 가설: 대립가설(H1)– 귀무가설(Ho): M=200, 대립가설(H1): M≠200→ p-value 값이 유의수준(0.05)보다 작다면, 귀무가설을 기각!!1. One Sample T-Test (일표본 T-검정)– 특정 기준 값과 차이가 없다– 귀무가설(Ho): 평균이 M0와 같다– 대립가설(H1): 평균이 M0와 다르다※ 가정: 정규분포→ Shapiro-wilk→ 유의수준보다 작으면, 정규분포를 따르지X → wilcoxon 수행해야 함2. Paired Sample T-Test (대응표본 T-검정)– 단일 모집단에 두 번의 처리를 가했을 때, 두 개 처리에 따른 평균 차이를 비교– 귀무가설(Ho): 두 모평균 사이의 차이는 없다※ 가정: 정규성 검증3. Independ..

(부동산) 취득세, 종부세, 양도소득세 등 절세 방법

feat. 부동산 절세 완전정복*부동산 세금*세금 관련 문의: 국번 없이 126, 홈택스 인터넷 상담, 국세법령정보시스템 검색 등*부동산 취득세– 주택 1-3%, 토지/건물 4%, 원시취득/상속 2.8%, 무상취득(증여) 3.5%, 농지 매매/상속 2.3-3%– 지방교육세, 농어촌특별세를 포함→ 실거래가와 공시가격 중 더 비싼 것을 기준으로→ 경매는 낙찰가 기준으로 취득세, 일반 매매시에는 위에 기준에 따라 취득세 매겨서 폭탄 가능*기준시가 – 국세(양도소득세, 상속세, 증여세, 종합부동산세) 계산할 때 활용*시가표준액 – 취득세, 재산세 등의 지방세를 과세하기 위해 지자체가 산정하는 가격→ 기준시가와 시가표준액은 부동산 종류에 따라 다르게 적용되는데,상가/오피스텔은 시가표준액으로 재산세 얼만지 꼭 확인..

투자/부동산 2026.04.04