csv에서 불용어 어떻게 뽑아낼까요?

조회수 58회
val['Riviews'] = val['Riviews'].str.replace("[^ㄱ-ㅎㅏ-ㅣ가-힣 ]","")
val['Riviews'].replace('', np.nan, inplace=True)
val.head()

from konlpy.tag import Okt
okt = Okt()

불용어를 여기서 뽑아내야하는데, df안 리뷰는 Riviews인데 이 안에서 불용어를 찾아 제거 하고 싶어요

train['tokenized'] = train['Riviews'].apply(okt.morphs)
train['tokenized'] = train['tokenized'].apply(lambda x: [item for item in x if item not in stopwords])

1 답변

답변을 하려면 로그인이 필요합니다.

Hashcode는 개발자들을 위한 무료 QnA 사이트입니다. 계정을 생성하셔야만 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 계정을 생성하셔야만 글을 작성하실 수 있습니다.