python replace를 파일을 불러와 하는 방법 질문드립니다.

Question

python replace를 파일을 불러와 하는 방법 질문드립니다.

조회수 525회

python

replace

0

싫어요

기초적인 질문 죄송합니다.

파이썬 텍스트 클리닝 과정에서 아래와 같이 하나하나 내용을 바꾸는 작업을

df['sentence'] = df["sentence"].str.replace("볼펜", "펜")
df['sentence'] = df["sentence"].str.replace("싸인펜", "펜")
df['sentence'] = df["sentence"].str.replace("매직", "펜")

아래와 같이 불용어 처리하는 것처럼 파일을 불러와서 하고 싶습니다.

stopwords = []
f = open('/content/khaiii/rsc/src/불용어.txt')
lines = f.readlines()
for line in lines:
    line = line.strip()
    stopwords.append(line)
f.close()

df['sentence'] = df['sentence'].apply(lambda x : [item for item in x if item not in stopwords])

방법이 있을까요?

1. sentence 에는 단어의 리스트가 들어 있나요? 아니면 그냥 str 타입의 텍스트가 들어있나요? 2. 불러올 파일에는 볼펜 싸인펜 매직... 이런 게 어떤 형태로 들어있나요? nowp 2021.2.2 02:20
1. sentence에는 str 타입의 문장이 들어있습니다. 2. 불러올 파일은 아직 만들지 않았고, 변경전 tab 변경후 이렇게 만들고자 합니다. orange 2021.2.2 15:46
@오리 : 아래 불용어 처리 예에서는 df['sententce'] 가 word들의 리스트로 들어있는 것처럼 보이는데요. nowp 2021.2.2 15:59
아 네. 죄송합니다. 불용어 파일은 word 리스트로 되어 있는데, 이것은 파일을 불러와 적용시키는 방법에 대한 예시로 말씀드린 것입니다. 불용어 예시는 무시하셔도 될것같습니다. orange 2021.2.2 16:07
이전 글에도 전부 코드 없이 이미지로 올리는 것으로 보이는데, 도와주시는 분들은 시간이 남아돌아서 누군가 캡쳐해서 업로드한 이미지를 보고 질문자에 의도에 맞는 코드를 예측해서 만들어주는 사람들이 아닙니다. 초보자 2021.2.2 17:45

댓글 입력

score 0 · Accepted Answer

바꾸기리스트 = []

# 파일을 읽어서, 바꾸기리스트를 만든다.
with open(바꿀단어리스트파일패쓰, "r") as f:
  for line in f:
    바꾸기전, 바꾼후 = line.split('\t')
    바꾸기리스트.append((바꾸기전, 바꾼후))

# 리스트의 단어쌍을 불러서, 바꾸기를 실행한다.
for 성형전, 성형후 in 바꾸기리스트:
  df["내용"] = df["내용"].str.replace(성형전, 성형후)

이렇게 하면 됩니다. 파일 읽을 때, 파일의 인코딩 잘 확인하고요. 파일 마지막에 쓸데없는 줄바꿈있으면, 그거 잘 처리해야 할 거구요.

python replace를 파일을 불러와 하는 방법 질문드립니다.

조회수 525회

python

replace

0

nowp 9,214 points

2021-02-02 02:17:48에 수정됨

orange 15 points

2021-02-01 18:48:17에 작성됨

댓글 입력

2 답변

0

nowp 9,214 points

2021-02-02 23:12:41에 작성됨

댓글 달기

0

초보자 1,785 points

2021-02-01 21:06:35에 작성됨

댓글 달기

python replace를 파일을 불러와 하는 방법 질문드립니다.

조회수 525회

python

replace

0

nowp 9,214 points

2021-02-02 02:17:48에 수정됨

orange 15 points

2021-02-01 18:48:17에 작성됨

댓글 입력

2 답변

0

nowp 9,214 points

2021-02-02 23:12:41에 작성됨

댓글 달기

0

초보자 1,785 points

2021-02-01 21:06:35에 작성됨

댓글 달기

답변을 하려면 로그인이 필요합니다.