python 또는 pyspark에서 대용량 requests 하는 방법이 있나요?

Question

python 또는 pyspark에서 대용량 requests 하는 방법이 있나요?

조회수 496회

python

requests

api

0

싫어요

pyspark으로 데이터 분석을 하고 있습니다.
데이터를 불러오는 구간은
python으로 http:xx/api 에 requests로 해당 content를 읽고 file로 저장 시킵니다..
그런데 api에서 넘어오는 데이터가 500mb이상일 때 매우 속도가 느립니다.
읽은 후 json 파일로 저장시키기까지 속도를 최대한 낼 수 있는 방법이 있을까요?

김재민 216 points

2020-09-17 14:43:43에 작성됨

일단 스트림으로서 받으셔야겠네요. https://stackoverflow.com/a/16696317 엽토군 2020.9.17 15:56
스트림으로서 받는 게 어떤건가요?? 제가 용어 개념이 없어서 ... 김재민 2020.9.17 17:46
저두 잘 모릅니다만 파이썬 Requests 모듈 문서에 간단한 강좌가 있네요. https://requests.readthedocs.io/en/master/user/advanced/#body-content-workflow 엽토군 2020.9.17 21:57

python 또는 pyspark에서 대용량 requests 하는 방법이 있나요?

조회수 496회

python

requests

api

0

김재민 216 points

2020-09-17 14:43:43에 작성됨

댓글 입력

답변을 하려면 로그인이 필요합니다.