파이썬 그룹핑 (groupby)
조회수 1200회
groupping 함수를 이용하여 dataframe 의 최대/최소값을 불러오려고 합니다. 코드가 틀린건 아닌거 같은데 어떤 이유로 오류가 발생하는지 궁금합니다.
class_group=df.groupby('Pclass') # 1,2,3등석 변수 그룹화
class_group.max()
class_group.min() 결과 역시 마찬가지로 같은 오류가 뜹니다.
-
(•́ ✖ •̀)
알 수 없는 사용자 - 〉
1 답변
-
df.groupby("Pclass")
를 하면,Pclass
를 기준으로 그룹화한 그룹들이 만들어지게 됩니다.여기에 보통은 컬럼명을 지정하고 그 컬럼에 대해 집합적 함수를 적용합니다.
df.groupby("Pclass")["Age"].max()
이렇게 하면, 각 그룹에서 가장 큰 나이가 나오게 됩니다.질문자의 코드에는 max 나 min 을 수행할 컬럼명을 명시해 주지 않았기 때문에, 모든 컬럼에 대해서 max, min 을 수행하게 됩니다. 하지만, 컬럼의 타입에 따라서, max, min 을 구할 수 없는 (일반 문자열에 대해서는 대소를 구분할 수가 없겠죠.) 컬럼들도 있기 때문에, 그런 컬럼에 대해서 에러가 발생했을 거라고 생각됩니다.
댓글 입력