네이버 블로그 크롤링 후 인코딩 문제?

조회수 55회

네이버 블로그를 크롤링 했는데, 결과물이 알 수 없는 글로만 나와서... 한글로 보이게 하려면 어떻게 해야할까요??

명령어는 아래와 같고 이미지

from gn_libs3.naver_api_caller2 import get1000Result
import json

keywords=["소확행"]
list=[]
for keyword in keywords:
    result = get1000Result(keyword)
    list=list+result
    print(len(list))

file=open("./search_sohachang.json", "w+")
file.write(json.dumps(list))

결과물은 아래와 같습니다 이미지

어떻게하면 내용이 한글로 보이게 될까요? ㅠㅠ

1 답변

  • 질문자가 원하는 한글이라는 것은 python 의 str 타입입니다.

    파이썬의 json 모듈은 라틴 문자 외의 유니코드에 대해서 ascii 인코딩(\ud55c\uae00 식으로 표현)을 적용합니다.

    즉 json 문자열을 python 타입으로 디코딩 해야 합니다.

    import json
    json_encoded_str = json.dumps("한글") # json.dumps("한글", ensure_ascii=False) 와 같이해서 단순히 읽을 수 있는 형태로도 할 수 있습니다.
    print(json_encoded_str)
    python_str = json.loads(json_encoded_str)
    print(python_str)
    
    "\ud55c\uae00"
    한글
    

답변을 하려면 로그인이 필요합니다.

Hashcode는 개발자들을 위한 무료 QnA 사이트입니다. 계정을 생성하셔야만 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 계정을 생성하셔야만 글을 작성하실 수 있습니다.