편집 기록

프로필 nowp님의 편집

날짜2022.01.10

csv에서 불용어 어떻게 뽑아낼까요?

python

nlp

val['Riviews'] = val['Riviews'].str.replace("[^ㄱ-ㅎㅏ-ㅣ가-힣 ]","")
val['Riviews'].replace('', np.nan, inplace=True)
val.head()

from konlpy.tag import Okt
okt = Okt()

불용어를 여기서 뽑아내야하는데, df안 리뷰는 Riviews인데 이 안에서 불용어를 찾아 제거 하고 싶어요

train['tokenized'] = train['Riviews'].apply(okt.morphs)
train['tokenized'] = train['tokenized'].apply(lambda x: [item for item in x if item not in stopwords])

프로필 Jinoo0807님의 편집

날짜2022.01.10

csv에서 불용어 어떻게 뽑아낼까요?

python

val['Riviews'] = val['Riviews'].str.replace("[^{ㄱ-ㅎㅏ-ㅣ가-힣} ]","") val['Riviews'].replace('', np.nan, inplace=True) val.head()
from konlpy.tag import Okt okt = Okt()
불용어를 여기서 뽑아내야하는데... df안 리뷰는 Riviews인데 이 안에서 불용어를 찾아 제거 하고 싶어요
train['tokenized'] = train['Riviews'].apply(okt.morphs) train['tokenized'] = train['tokenized'].apply(lambda x: [item for item in x if item not in stopwords])

편집 기록

편집 기록

프로필 nowp님의 편집

날짜2022.01.10

csv에서 불용어 어떻게 뽑아낼까요?

python

nlp

프로필 Jinoo0807님의 편집

날짜2022.01.10

csv에서 불용어 어떻게 뽑아낼까요?

python