Python 판다스로 수집한 개별데이터와 합계의 오류???

판다스로 수집한 데이터 1열에서 200열까지 합한 값을 201열에 넣고 csv 파일로 저장하는 코드를 짰습니다.

(1열 값을 201열에 넣고, 2열 값을 기존에 201열에 누적하여 더하는 방법)

일자별 데이터가 불안정한 결과를 보여서 상세 데이터를 봤더니 아래와 같이 나옵니다.

각 행과 열의 값은 반복된 같은 값이 나오지만 아래쪽 sum을 보면 다른 합계가 나옵니다.

201열의 값을 구하고자 한 것이며, 201열의 값이 되려면 각 행의 값이 달라야 하는데, 각 행의 값이 열 전체에 같은 값으로 채워져 있음에도 불구하고 결과값인 201열의 각 행은 다른 값이 나오는 게 이상합니다.

이미지

분 단위로 데이터를 수집하고 합계를 구하는 것이기 때문에 각 행에 동일한 값이 들어 갈 수도 있지만 전체 열이 동일한 데이터는 잘 못된 것으로 보입니다.

저의 질문은..

1 ) 201열을 제외한 각 열의 각 행의 동일한 값이 보이는 값과 안 보이는 값이 존재하는 것인지?

2 ) 그리고 이런 현상은 왜 발생하는 것인지?

혹시 이 문제를 경험하신 분 계십니까?

  • pastebin.com 같은 곳에 csv 전체를, 여기에 해당 판다스 코드를 올려주시면 능력 좋으신 분이 봐주실 수 있을 것입니다. 당장 의심되기로는 뭐 실제로 어딘가에 다른 값이 들어갔으니까 다른 합이 나오는 것 아닌가 싶은데 소스 봐야할것 같네요. 엽토군 2018.12.4 10:10
  • 여기오시는 분이 탐정은 아닌데...범인을 찾아달라는 것과 다를바가 없네요...엑셀행 데이터를 복사해서 직접 더해보세요. 문제가 없다면 그걸 복사해서 엑셀에 다시 붙여넣기 해보세요. 정영훈 2018.12.4 10:17

1답변

  • 좋아요

    0

    싫어요
    채택취소하기

    이게 맞는지 모르겠지만

    위 캡처본을 근거로 추리를해보자면..

    • 질문상 그림에는 200열까지 "선택"을 했는데 아래 상태행에서는 "201"로 나옵니다.
    • 상태행의 "Sum" 에 있는 "1,193,011,806,481,580" 은 "GT" 열의 값과 같습니다.

    제가 엑셀로 확인해보니 A열 부터 시작하면 아래와 같이 "GS"열에서 201 값이 나오고 이미지

    B열부터 1열이 시작하면 질문자 분의 경우와 같이 "GS"열에서 200이 나오네요. 이미지

    그런데 상태행의 갯수가 질문자분과 다르게 "200"이 나옵니다. 즉, 질문자의 경우는 1열인 "B열" 이전에 "A열"에 있는 데이타도 포함되었다는 말입니다. 그런데 상태행의 Sum값은 GT열과 같은것이 이상합니다.

    결론적으로 , 상태행의 Sum값이 GT열과 같다는 것은 GT열값이 계산이 1열~200열까지만 계산된것이 아니라 테이블과 관계없는 A열의 값이 계산에 포함되었다는 걸로보입니다.

    • 답변 감사합니다. 질문을 작성하고 읽어보니 제가 작성하였지만 굉장히 이해하기 어렵게 작성한 것 같습니다. 그런데 더 상세히 뭘 모르는지 작성하는게 어렵네요. Junyeob YI 2018.12.7 20:14
    • GT열(201)은 A열(0)에서 GS열(200)까지의 합 입니다. A+B+C+...GS = GT라는 말이죠. 제가 궁금했었던 것은 200개를 더하였나, 201개를 더하였나가 아니고, 보시는 바와 같이 모든 열의 2행부터 끝행까지 숫자가 동일합니다. GS행을 예로 들면 528,343,197,200이 2행부터 26행까지 똑같은 숫자입니다. 그런데 GT열은 2행부터 26행부터 다릅니다. 같은행도 있지만 다른행이 있습니다. 상기 말씀드린바와 같이 GT열은 A열에서 GS열까지 합이기 때문에 각 행의 숫자가 같으면 GT열도 같아야 합니다만, 다른 현상을 보이고 있습니다. 결론적으로 GT열처럼 행마다 값이 다 달라야 맞는 것입니다. 말로 설명하면 쉬울 것 같은데 쓰니까 또 이해하기 어렵게 쓴 것 같네요 ㅠ Junyeob YI 2018.12.7 20:20
    • 그래서 각 행을 셀로 더해서 확인 해 보니, GT열의 값과 동일하게 나와서, 혹시 보여지는 숫자와 다른 데이터가 숨겨져 있는 것인가 라는 생각이 들었습니다. 중간에 값이 다를 거 라고 생각해서 각 열 별로 점검을 해 봤지만 다른 숫자는 없었습니다. 이상하지요...ㅠ? Junyeob YI 2018.12.7 20:24
    • 확인하신 바가 전부 사실이라면 엑셀에 버그가 있다는 말외에는 설명할수가 없는데요. 엑셀에 그런 버그가 있다면 아마 이슈가 크게 되었을텐데 그런게 지금까지 없는걸로 봐선 확인하시는 과정중에 뭔가 헛점이 있지 않을까 생각되는데요. 공개하는데 문제가 없다면 엑셀파일이나 csv 파일 첨부해보셔도 좋을것 같습니다. 과연 그런 신기한일이 발생하는 엑셀파일이 정말 있는지 보고싶네요. 홍가뤼 2018.12.8 22:32

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

작성한 답변에 다른 개발자들이 댓글을 작성하거나 댓글에 좋아요/싫어요를 할 수 있기 때문에 계정을 필요로 합니다.