네이버 블로그 크롤링 후 인코딩 문제?
조회수 837회
네이버 블로그를 크롤링 했는데, 결과물이 알 수 없는 글로만 나와서... 한글로 보이게 하려면 어떻게 해야할까요??
명령어는 아래와 같고
from gn_libs3.naver_api_caller2 import get1000Result
import json
keywords=["소확행"]
list=[]
for keyword in keywords:
result = get1000Result(keyword)
list=list+result
print(len(list))
file=open("./search_sohachang.json", "w+")
file.write(json.dumps(list))
결과물은 아래와 같습니다
어떻게하면 내용이 한글로 보이게 될까요? ㅠㅠ
1 답변
-
질문자가 원하는 한글이라는 것은 python 의 str 타입입니다.
파이썬의 json 모듈은 라틴 문자 외의 유니코드에 대해서 ascii 인코딩(\ud55c\uae00 식으로 표현)을 적용합니다.
즉 json 문자열을 python 타입으로 디코딩 해야 합니다.
import json json_encoded_str = json.dumps("한글") # json.dumps("한글", ensure_ascii=False) 와 같이해서 단순히 읽을 수 있는 형태로도 할 수 있습니다. print(json_encoded_str) python_str = json.loads(json_encoded_str) print(python_str) "\ud55c\uae00" 한글
댓글 입력