편집 기록

편집 기록
  • 프로필 nowp님의 편집
    날짜2020.08.14

    파이썬 로우데이터 다루는데 질문있습니다!!


    일단 자료형식츤 txt구요 자료내용은 raw데이터로 엑셀 1행9열로 전부 하나의 행에 전부 들어있습니다.

    촬영자료
    촬영소 = xx
    설치위치 = xxxxxxxxxxxxxx
    관측항목 = xxxxxxxxxxxxxxxxxxxxxxxxxxx
    관측시간,수온(℃),염분(PSU),전기전도도(ms/m)
    2015-04-01 00:00:00,20.6,RB,K,17.31,RB,K,25.7,RB,K
    2015-04-01 00:15:00,20.6,RB,K,17.31,RB,K,25.7,RB,K
    2015-04-01 00:30:00,20.6,RB,K,17.31,RB,K,25.7,RB,K
    2015-04-01 01:00:00,20.6,RB,K,17.31,RB,K,25.7,RB,K
    

    (위)데이터내용입니다.

    jupyter에서 진행했습니다

    코드는 아래와 같습니다.

    import pandas as pd
    f= pd.read_csv('test.txt',sep='delimiter',header=None, encoding='cp949', engine='python')
    f2= f.drop([0,1,2,3,4],axis=0)
    

    판다스부르고 자료f 받아왔고 서두부분drop으로 내용만 가지고 f2를 생성했습니다. 그런 후 행 제목으로 '관측시간' 값은2015-04-01 00:15:00, 2015-04-01 00:30:00, 2015-04-01 00:45:00, 2015-04-01 01:00:00 수온(℃) 20.6, 20.6, 20.6, 20.6 이 되도록, 이런식으로 행별로 자르기 위해

    f3= f2.split(' , ')
    or
    f3= f2['촬영자료']=f2['관측시간','수온','염분','전기전도도'].str.split(' ',3)
    

    첫번째 스플릿에선 AttributeError: 'DataFrame' object has no attribute 'split' 오류가 있어서 항목을 행에 정해주려고 만드는데 KeyError:('관측시간','수온','염분','전기전도도') 라는 오류가 납니다..

    진행하고싶은건 쉼표를 기준으로 잘라서 행으로 묶고 RB와 K를 뺀 나머지를 선택하여 행별로 값이있는 하나의 자료로 묶고싶습니다.

  • 프로필 yjk님의 편집
    날짜2020.08.14

    파이썬 로우데이터 다루는데 질문있습니다!!


    일단 자료형식츤 txt구요 자료내용은 raw데이터로 엑셀 1행9열로 전부 하나의 행에 전부 들어있습니다.

    촬영자료

    촬영소 = xx

    설치위치 = xxxxxxxxxxxxxx

    관측항목 = xxxxxxxxxxxxxxxxxxxxxxxxxxxx

    관측시간,수온(℃),염분(PSU),전기전도도(ms/m) 2015-04-01 00:00:00,20.6,RB,K,17.31,RB,K,25.7,RB,K

    2015-04-01 00:15:00,20.6,RB,K,17.31,RB,K,25.7,RB,K

    2015-04-01 00:30:00,20.6,RB,K,17.31,RB,K,25.7,RB,K

    2015-04-01 01:00:00,20.6,RB,K,17.31,RB,K,25.7,RB,K

    (위)데이터내용입니다.

    jupyter에서 진행했습니다 코드내용으론

    import pandas as pd
    f= pd.read_csv('test.txt',sep='delimiter',header=None, encoding='cp949', engine='python')
    f2= f.drop([0,1,2,3,4],axis=0)
    

    판다스부르고 자료f 받아왔고 서두부분drop으로 내용만 가지고 f2를 생성했습니다. 그런 후 행 제목으로 '관측시간' 아래로 값은 2015-04-01 00:15:00, 2015-04-01 00:30:00, 2015-04-01 00:45:00, 2015-04-01 01:00:00 수온(℃) 역시 20.6, 20.6, 20.6, 20.6 이런식으로 행별로 자르기 위해

    f3= f2.split(' , ')
    or
    f3= f2['촬영자료']=f2['관측시간','수온','염분','전기전도도'].str.split(' ',3)
    

    첫번째 스플릿에선 AttributeError: 'DataFrame' object has no attribute 'split' 요류가 있어서 항목을 행에 정해주려고 만드는데 KeyError:('관측시간','수온','염분','전기전도도') 라는 오류가 납니다..

    진행하고싶은건 쉼표를 기준으로 잘라서 행으로 묶고 RB와 K를 뺀 나머지를 선택하여 행별로 값이있는 하나의 자료로 묶고싶습니다.