프로그래밍/PYTHON
[python] 문자열 중 stopwords 불용어를 처리한 단어를 사용 빈도 별로 딕셔너리형태로 저장하는 방법
테리베리
2022. 10. 5. 16:21
728x90
반응형
문자열 중 불용어를 처리한 단어를 사용 빈도 별로 딕셔너리형태로 저장하는 방법
stopword(불용어): 데이터 처리에 있어 쓸모없는 단어
# stopword(불용어): 데이터 처리에 있어 쓸모없는 단어
s = "Life is short, Art is long!"
stopwords = ['is', 'so']
d = {}
for w in s.split(' '):
if w in stopwords:
continue
d[w] = d.get(w,0) + 1
print(d)
728x90
반응형