IndexError: list index out of range 관련 초보같은 질문입니다
조회수 1687회
너무 초보스러운 질문같아 죄송합니다. 네이버에서 크롤링한 txt파일을 word2vec으로 분석하기 위해서 tokenize하려는 과정에서 list index오류가 나는데 해결방법을 모르겠어서 질문 올립니다.
인터넷에서 찾은 코드를 바탕으로 제 자료를 분석하려는데,
def tokenize(doc):
return ['/'.join(t) for t in pos_tagger.pos(doc, norm=True, stem=True)]
하고나서,
train_docs = [(tokenize(row[1]), row[2]) for row in train_data]
Traceback (most recent call last):
File "", line 1, in
train_docs = [(tokenize(row[1]), row[2]) for row in train_data]
File "", line 1, in
train_docs = [(tokenize(row[1]), row[2]) for row in train_data]
IndexError: list index out of range
이런 메시지가 나옵니다. 아마 제가 참고한 코드에서 사용한 자료는 column이 각 줄마다 3개씩인데, 제가 적용하려는 자료는 한 줄에 column이 한개밖에 없어서 (한 줄에 댓글 1개씩) 그런 것 같습니다. 죄송합니다만 어떻게 고치면 토크나이징이 가능할지 알고싶습니다. 감사합니다.
-
(•́ ✖ •̀)
알 수 없는 사용자
댓글 입력