어간추출(Stemming)은 단어에서 활용(변화된 형태)을 제거하고 ‘어간(Stem, 단어의 뿌리 형태)’만 남기는 과정. 자연어 처리(NLP)에서 텍스트 전처리 단계로 자주 사용됨.1. 정의단어의 접사(접두사, 접미사)를 단순 규칙에 따라 잘라내서 기본형을 찾는 방법문법적으로 완벽하지 않을 수 있지만, 빠르고 단순하게 단어를 정규화예:“playing”, “played”, “plays” → “play”“studies”, “studying” → “studi” (완벽히 어근과 다를 수 있음)즉, 정확한 언어학적 원형은 아니더라도 단어 변형을 줄여서 차원을 축소하는 게 목적2. 원리대표적인 알고리즘: Porter Stemmer, Lancaster Stemmer접미사 규칙 적용 (e.g., -ing, -ed, ..