python에서 여러줄의 json을 dataframe형태로 출력할 수 있는 방법이 어떻게 되나요?
조회수 675회
json 파일에 저장 되어 있는 형태
# test.json
{key_a1:value_a1, key_a2:value_a2, key_a2:value_a3}\n
{key_a1:value_b1, key_a2:value_b2, key_a2:value_b3}\n
{key_a1:value_c1, key_a2:value_c2, key_a2:value_c3}\n
{key_a1:value_d1, key_a2:value_d2, key_a2:value_d3}\n
.
.
.
위처럼 test.json파일에는 여러줄의 딕셔너리 형태로 key값의 구조는 같게 저장 되어 있습니다. 이걸 scala로 호출해서 read했을 때는 아래처럼 보여집니다.
val df = spark.read.json("/home/test/data/test.json")
df.show()
.
Python에서도 저련 형태의 json파일을 한 번에 dataframe형태로 읽을 수 있나요? 또한 여러줄이지만 같은 구조의 딕셔너리 구조에서 key값을 한 번에 select 해서 원하는 형태로 정렬시킬 수 있나요? 예를 들면, key_a2안 의 또다른 딕셔너리들의 key값을 컬럼으로 데이터프레임 구성하는 식으로요
1 답변
-
https://stackoverflow.com/questions/20037430/reading-multiple-json-records-into-a-pandas-dataframe
pd.read_json(... , lines=True)
댓글 입력