2025/11 9

[AI/ML]카이제곱 검정

카이제곱 검정(Chi-Square Test, χ² test)은 범주형 데이터 간의 관계(적합도·독립성·동질성)를 검정하는 통계적 방법임. 실제 관찰값과 기대값의 차이가 통계적으로 유의한지를 확인1. 정의검정통계량O: 관찰빈도 (Observed frequency)E: 기대빈도 (Expected frequency)👉 관찰값이 기대값과 얼마나 다른지 비교 → 차이가 크면 귀무가설 기각2. 카이제곱 검정의 종류종류목적예시대응하는 가설적합도 검정(Goodness of Fit)한 범주형 변수의 분포가 기대분포와 일치하는지주사위가 공정한가?H₀: 관찰분포 = 기대분포독립성 검정(Test of Independence)두 범주형 변수 간에 관련성이 있는지성별과 흡연 여부 관계H₀: 두 변수는 독립동질성 검정(Test ..

[AI/ML]로짓(logit) 모형

로짓 모형(LogitModel)은 종속변수가 범주형(특히 이항형, 0/1)일 때, 사건이 발생할 확률을 추정하는 회귀모형임. 쉽게 말해 로지스틱 회귀의 기본 형태1. 정의선형회귀처럼 Y=β0+β1X1로 예측하면 확률값이 0~1 범위를 벗어날 수 있음이를 해결하기 위해 로짓 함수(logit function) 사용:여기서 p는 사건이 발생할 확률즉, 확률 p를 로짓 변환(log-odds)해서 선형모형으로 설명하는 것2. 원리사건이 발생할 확률 ppp는 0~1 사이확률을 승산(odds = p/(1-p))으로 변환 → 0~∞odds에 로그 취하면 (-∞, ∞)로 변환 → 선형 회귀모형 적용 가능다시 역변환(sigmoid 함수)으로 0~1 확률값 얻음👉 이렇게 해서 “확률을 회귀로 설명하는” 게 로짓 모형임3...

[개인정보보호법]개인정보 파기

1. 개인정보 파기 원칙 및 절차 (개인정보 보호법 중심)가장 기본이 되는 파기 프로세스입니다. '지체 없이'의 구체적 날짜와 '분리 보관' 조건이 시험 문제의 단골 함정입니다. 구분 핵심 내용 비고 (시험 포인트) 파기 사유 보유기간 경과, 목적 달성, 사업 종료 등 불필요하게 되었을 때 파기 시기 사유가 발생한 날로부터 지체 없이 (5일 이내) '즉시' 아님, '5일' 기억 필수 파기 방법 (전자적) 복원이 불가능한 방법으로 영구 삭제 단순 삭제(Delete) 아님. 완전파괴/소각/디가우징/덮어쓰기(Overwriting) 파기 방법 ..

[AI/ML]크루스칼-왈리스 검정

크루스칼-왈리스 검정(Kruskal-Wallis test)은 3개 이상의 독립집단 간 차이를 비교하는 비모수적 검정 방법임. 쉽게 말해, 일원 분산분석(One-way ANOVA)의 비모수적 대안1. 정의데이터가 정규성을 따르지 않거나, 분산이 같다는 가정을 만족하지 않을 때 사용집단 간 평균 비교 대신, 순위(rank)를 이용해서 집단 간 분포 차이를 검정귀무가설(H₀): 모든 집단의 분포가 동일하다대립가설(H₁): 적어도 한 집단의 분포가 다르다2. 원리모든 집단 데이터를 합쳐서 오름차순 정렬각 데이터에 순위(rank) 부여집단별 순위 합 계산집단 간 순위 평균 차이가 큰지 통계량 계산 N: 전체 표본 크기nj: j번째 집단 표본 크기Rj: j번째 집단 순위 합👉 이 H는 근사적으로 카이제곱 분포(χ..

[AI/ML]윌콕슨 순위합 검정

윌콕슨 순위합 검정(Wilcoxon Rank-Sum Test)은 두 독립된 집단의 차이를 비교하는 비모수적 검정 방법임. 정규성을 가정하지 않고, 데이터를 순위(rank)로 변환해 두 집단의 분포가 같은지 확인하는 방법임.1. 정의두 집단이 같은 분포를 가지는지 검정 (평균 차이가 아니라 “분포 차이”)정규성 가정이 어려운 상황에서 독립표본 t-검정의 대안으로 사용표본이 작거나 이상치(outlier)가 있는 경우에도 강건(robust)2. 원리두 집단 데이터를 합쳐서 크기순으로 정렬각 데이터에 순위(rank)를 부여집단별 순위 합을 계산두 집단 간 순위합 차이가 우연히 발생할 수 있는 범위인지 검정👉 결국, 값 자체보다는 순위 차이로 두 집단을 비교하는 것3. 비유비유로 생각하면:A반, B반 시험 점수..

[AI/ML]만-휘트니 검정

만-휘트니 U 검정(Mann–Whitney U test)은 두 독립집단의 분포 차이를 비교하는 비모수 검정 방법임. 사실상 윌콕슨 순위합 검정(Wilcoxon Rank-Sum Test)과 동일한 개념으로 취급됨.1. 정의두 집단이 동일한 분포를 따르는지 검정정규성 가정 불필요 → 독립표본 t-검정의 비모수 대안표본 수가 작거나 이상치가 있을 때 강건(robust)👉 귀무가설(H₀): 두 집단의 분포가 동일하다👉 대립가설(H₁): 두 집단의 분포는 다르다 2. 원리두 집단 데이터를 합쳐서 오름차순 정렬각 데이터에 순위(rank) 부여집단별 순위 합을 바탕으로 U 통계량 계산U 값이 작을수록 두 집단 분포 차이가 큼3. 비유비유로 생각하면:남학생 5명, 여학생 5명의 키를 비교키 순위만 가지고 “남학생이..

[AI/ML]샤피로-윌크

샤피로-윌크 검정(Shapiro-Wilk test)은 표본 데이터가 정규분포를 따르는지(정규성 검정)를 확인하는 통계적 방법임. 정규성 검정 중 가장 널리 쓰이고 신뢰도가 높은 방법 중 하나임.1. 정의귀무가설(H₀): 표본은 정규분포를 따른다대립가설(H₁): 표본은 정규분포를 따르지 않는다p-value 2. 검정통계량샤피로-윌크 통계량x(i): 표본을 오름차순 정렬한 값ai: 정규분포에서 기대되는 계수분모: 표본의 분산분자: 정규분포일 때 기대되는 선형 결합👉 직관적으로 “표본이 정규분포 직선에 얼마나 잘 맞는가”를 수치화3. 특징표본 크기 작아도 사용 가능 (n=3~50 사이에서 특히 강력)표본 크기가 커지면 작은 정규성 위반도 쉽게 잡아냄 → p-value가 쉽게 작아질 수 있음Kolmogorov..

[개인정보보호법]개인정보 보호책임자 vs 정보보호 최고책임자

개인정보 보호책임자(CPO) vs 정보보호 최고책임자(CISO) 정리개인정보 보호와 정보보호는 비슷해 보이나, 실제로는 법적 기반과 책임 초점이 명확히 다릅니다.ISMS-P나 CPPG 시험에서도 두 직책의 법적 근거 / 역할 / 겸직 규정을 비교하는 문제가 자주 출제됩니다.이 글에서는 두 직책의 비교를 법령 기반으로 명확하게 정리합니다.1. 개인정보보호책임자(CPO): 정보주체의 권리를 지키는 역할CPO는 「개인정보 보호법」을 근거로 합니다.가장 핵심적인 업무 목표는 개인정보가 적법하고 안전하게 처리되도록 관리하는 것입니다.1.1 법적 근거「개인정보 보호법」 제31조:모든 개인정보처리자는 개인정보 보호책임자(CPO)를 지정해야 함.1.2 지정과 지위민간기업: 대표자 또는 임원을 CPO로 지정함.공공기관:..

[개인정보보호법]개인정보 보호책임자

개인정보 보호책임자란?"개인정보 보호책임자"란 개인정보처리자의 개인정보 처리에 관한 업무를 총괄해서 책임지는 자로서 영 제 32조제1항 또는 제3항에 해당하는 자를 말한다.(개인정보보호위원회고시 , 2025. 4. 11. ) 1. 개요 및 지정 의무 (법 제31조)개인정보 보호책임자(CPO)란 개인정보처리자의 개인정보 처리에 관한 업무를 총괄해서 책임지는 자를 말합니다.1-1. 지정 원칙원칙: 모든 개인정보처리자는 CPO를 지정해야 함.예외 (지정 간주): 「소상공인기본법」에 따른 소상공인 등 소규모 사업자는 별도 지정하지 않을 수 있으며, 이 경우 사업주 또는 대표자가 CPO가 됨. 2. 지정 요건 (직위/직급 기준) (시행령 제32조)공공기관과 민간기업(공공기관 외)의 지정 기준이 다릅니다. ..