프로그래밍/PYTHON

[python] 문자열 중 stopwords 불용어를 처리한 단어를 사용 빈도 별로 딕셔너리형태로 저장하는 방법

테리베리 2022. 10. 5. 16:21
728x90
반응형

문자열 중 불용어를 처리한 단어를 사용 빈도 별로 딕셔너리형태로 저장하는 방법

stopword(불용어): 데이터 처리에 있어 쓸모없는 단어

# stopword(불용어): 데이터 처리에 있어 쓸모없는 단어
s = "Life is short, Art is long!"
stopwords = ['is', 'so']
d = {}
for w in s.split(' '):
    if w in stopwords:
        continue
    d[w] = d.get(w,0) + 1
print(d)
728x90
반응형