편집 기록

편집 기록
  • 프로필daewon님의 편집
    날짜2022.01.10

    csv에서 불용어 어떻게 뽑아낼까요?


    val['Riviews'] = val['Riviews'].str.replace("[^ㄱ-ㅎㅏ-ㅣ가-힣 ]","")
    val['Riviews'].replace('', np.nan, inplace=True)
    val.head()
    
    from konlpy.tag import Okt
    okt = Okt()
    

    불용어를 여기서 뽑아내야하는데, df안 리뷰는 Riviews인데 이 안에서 불용어를 찾아 제거 하고 싶어요

    train['tokenized'] = train['Riviews'].apply(okt.morphs)
    train['tokenized'] = train['tokenized'].apply(lambda x: [item for item in x if item not in stopwords])
    
  • 프로필Jinoo0807님의 편집
    날짜2022.01.10

    csv에서 불용어 어떻게 뽑아낼까요?


    val['Riviews'] = val['Riviews'].str.replace("[ㄱ-ㅎㅏ-ㅣ가-힣 ]","") val['Riviews'].replace('', np.nan, inplace=True) val.head()

    from konlpy.tag import Okt okt = Okt()

    불용어를 여기서 뽑아내야하는데... df안 리뷰는 Riviews인데 이 안에서 불용어를 찾아 제거 하고 싶어요

    train['tokenized'] = train['Riviews'].apply(okt.morphs) train['tokenized'] = train['tokenized'].apply(lambda x: [item for item in x if item not in stopwords])

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 계정을 생성하셔야만 글을 작성하실 수 있습니다.