2026/01 39

[AI/ML]K-means Clustering

K-means Clustering은 대표적인 비지도 학습(unsupervised learning) 군집화 알고리즘으로, 데이터를 K개의 군집(cluster)으로 나누는 방법1. 정의데이터를 미리 정한 군집 수(K)만큼 분할각 군집의 중심(centroid)을 기준으로 데이터들을 가장 가까운 군집에 할당“군집 내 응집도를 최소화, 군집 간 분리를 최대화” 하는 게 목표2. 동작 원리 (반복 알고리즘)군집 수 K를 지정임의로 K개의 중심점(centroid)을 선택각 데이터 → 가장 가까운 중심점에 할당각 군집의 평균 위치로 중심점 갱신중심점이 더 이상 크게 변하지 않을 때까지 3~4 반복☞ 결국, 군집의 중심이 안정될 때까지 반복 수렴하는 방식3. 비유“친구들이 여러 무리에 나뉘어 앉을 때, 각 무리의 ‘중심..

AI·ML/머신러닝 2026.01.31

[AI/ML]DBSCAN

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 밀도 기반 군집화 알고리즘으로, 데이터의 밀집도를 기준으로 군집(cluster)을 찾고, 밀도가 낮은 점들은 노이즈(이상치)로 분류하는 방법1. 정의군집 = 데이터가 조밀하게 모여 있는 영역노이즈 = 주변에 데이터가 거의 없는 점밀도(density)라는 개념을 도입해 군집화 → 비선형적이고 다양한 모양의 군집도 잘 찾아냄2. 핵심 개념 (매개변수 2개)Eps(ε): 반경(주변 영역의 크기)MinPts: 반경 안에 있어야 할 최소 점 개수Eps(ε): 반경(주변 영역의 크기)MinPts: 반경 안에 있어야 할 최소 점 개수이 두 조건으로 점을 구분함:Core Point(핵심점): Ep..

AI·ML/머신러닝 2026.01.30

[개인정보보호법]개인정보 목적외 이용·제공 제한

1. 기본 원칙 및 예외적 허용 사유개인정보처리자는 수집 목적 범위를 초과하여 이용하거나 제3자에게 제공할 수 없는 것이 원칙입니다. 단, 아래의 경우 예외적으로 허용됩니다. 구분 허용 요건 (법 제18조 제2항) 비고 공통(민간/공공) 1. 정보주체로부터 별도의 동의를 받은 경우 가장 우선시됨 2. 다른 법률에 특별한 규정이 있는 경우 3. 정보주체/제3자의 급박한 생명, 신체, 재산 이익을 위해 필요한 경우 명백히 인정될 때 10. 공중위생 등 공공의 안전과 안녕을 위해 긴급히 필요한 경우 공공기관전용(제5호~제9호) ..

[AI/ML]LightGBM

LightGBM(Light Gradient Boosting Machine)은 마이크로소프트에서 개발한 Gradient Boosting의 고속·고효율 버전임.이름 그대로 Light → 가볍고 빠르게 만든 게 핵심1. 정의XGBoost 이후 나온 차세대 부스팅 알고리즘대용량 데이터와 고차원 데이터에서도 빠르게 학습 가능메모리 사용량 절감 + 속도 개선에 최적화됨2. Gradient Boosting / XGBoost와의 차이구분XGBoostLightGBM트리 생성 방식Level-wise(같은 깊이 레벨 전체를 확장)Leaf-wise (정보 이득 최대인 리프부터 확장)속도빠름더 빠름 (특히 큰 데이터셋에서)메모리 사용상대적으로 많음적음정확도높음더 높을 수 있음 (과적합 위험 ↑)범주형 변수원핫인코딩 필요내장 처..

AI·ML/머신러닝 2026.01.29

[사고대응•CERT]침해사고 발생 시 확인해야 하는 서버 로그

1. 리눅스 (Linux) 서버 로그리눅스 시스템은 /var/log 디렉터리에 대부분의 로그가 위치합니다. 텍스트 로그와 바이너리 로그(별도 명령어로 확인)로 구분됩니다. 로그 분류 파일 위치 (일반적 경로) 주요 확인 사항 (Check Point) 비고 인증/보안 /var/log/secure (RHEL 계열)/var/log/auth.log (Debian 계열) - 실패한 로그인 시도 (Brute Force)- sudo 명령어 실행 이력- 새로운 사용자 계정 생성 이력 1순위 확인 명령어 이력 ~/.bash_history/root/.bash_history - 공격자가 실행한 악성 명..

[AI/ML]XGBoost

XGBoost(eXtreme Gradient Boosting)는 Gradient Boosting을 더 빠르고, 더 정확하게, 과적합에 덜 취약하게 만든 개선된 알고리즘1. 정의Gradient Boosting의 단점을 보완한 확장 버전“eXtreme” → 속도·성능 극대화캐글(Kaggle) 대회에서 수년간 1등을 휩쓸 정도로 성능이 입증된 알고리즘2. Gradient Boosting과 차이점 구분Gradient Boosting XGBoost학습 방식순차적으로 잔차 줄이기동일최적화단순 경사하강법2차 미분(Taylor expansion)까지 반영규제(Regularization)없음 → 과적합 위험L1, L2 규제 적용속도상대적으로 느림병렬 처리 지원, 훨씬 빠름결측치 처리별도 전처리 필요자동 처리 가능활용성기..

AI·ML/머신러닝 2026.01.28

[AI/ML]Gradient Boosting

Gradient Boosting은 Boosting 계열 앙상블 기법 중 하나로, 앞선 모델의 오차(residual)를 경사하강법(Gradient Descent) 방식으로 보완하면서 학습하는 방법임.1. 정의Boosting: 이전 모델이 틀린 부분을 점점 보완해가는 앙상블 기법Gradient Boosting: 이 보완 과정을 경사하강법(gradient descent) 아이디어로 수치화해서, 잔차(residual, 남은 오차)를 줄이는 방향으로 새로운 약한 학습기를 추가하는 방식즉, “앞 모델의 에러를 줄이는 방향으로 계속 보완하는 단계적 학습”임.2. 동작 원리 (단계별)첫 번째 약한 학습기(보통 얕은 결정트리)를 학습시킴예측값과 실제값 차이(잔차, residual)를 계산잔차를 줄이도록 새로운 트리를 학..

AI·ML/머신러닝 2026.01.27

[개인정보보호법]개인정보의 수집·이용

1. 개인정보 '수집'의 정의 (표준지침 제6조 제1항)단순히 직접 받는 것뿐만 아니라, 정보주체에 관한 모든 형태의 개인정보를 취득하는 행위 전체를 포함합니다. 2. 개인정보 수집·이용의 적법 요건 (법 제15조 제1항, 표준지침 제6조 제2항)개인정보처리자는 다음 중 하나라도 해당하면 개인정보를 수집·이용할 수 있습니다. 구분 핵심 요건 (법령/지침) 비고 및 상세 내용 1. 동의 정보주체의 동의를 받은 경우 가장 기본적인 수집 근거 2. 법률/의무 법률에 특별한 규정이 있거나 법령상 의무 준수를 위해 불가피한 경우 지침 구체화: 수집 없이는 의무 이행이 불가능하거나 현저히 곤란할 때 ..

[AI/ML]Adaboost

AdaBoost(Adaptive Boosting)는 Boosting 계열 앙상블 기법의 대표 알고리즘임. 이름처럼 Adaptive(적응적) 하게 가중치를 조정하면서 약한 학습기(Weak Learner, 보통 얕은 결정트리)를 모아 강한 학습기를 만드는 방식1. 정의여러 개의 약한 분류기(weak classifier)를 순차적으로 학습시키고,이전 단계에서 틀린 샘플에 더 큰 가중치를 줘서 다음 분류기가 그 샘플을 더 잘 맞추도록 학습하는 방식.즉, “앞에서 놓친 문제를 뒤에서 보완해가면서 점점 강해지는 학습기”라고 할 수 있음.2. 동작 원리 (단계별)처음 학습: 모든 데이터에 동일 가중치 부여약한 학습기 학습: 결정트리(Depth=1, stump)를 주로 사용오류 계산: 틀린 샘플의 가중치를 증가가중치 ..

AI·ML/머신러닝 2026.01.26

[애플리케이션 보안]OAuth가 SSO 구현을 위한 프로토콜인가

많은 경우 혼용되어 사용되지만, 기술적으로 OAuth는 '인가(Authorization)'를 위한 프레임워크이며, SSO는 '인증(Authentication)'을 통합하는 개념입니다.OAuth 자체만으로는 인증(로그인) 프로토콜이 아니지만, 이를 확장한 OpenID Connect(OIDC)와 결합하여 SSO를 구현하는 데 가장 널리 사용됩니다. 1. 핵심 개념 비교: 인증(Authentication) vs 인가(Authorization)가장 혼동하기 쉬운 두 개념의 차이를 명확히 구분해야 합니다. 구분 인증 (Authentication) 인가 (Authorization) 정의 "당신은 누구입니까?" (신원 확인) "당신은 무엇을 할..