사용자정의 함수 사용 중 append error

Question

사용자정의 함수 사용 중 append error

조회수 581회

python

user-defined-function

0

싫어요

def show_df(column,new_colnames = ['구분'],dataframe = one):
    df = dataframe[column].value_counts().reset_index()
    new_names = new_colnames
    new_names.append('카운트수')
    df.columns = new_names
    df['비중'] = df['카운트수'].apply(lambda x : round(x/df['카운트수'].sum(),2)*100)
    return df

EDA를 진행하면서 카운트수와 비중을 계속해서 DataFrame에 넣어가면서 확인하고 싶어서 함수를 작성했습니다. 각 변수마다 구분자는 고정될 것으로 추정해서 기본값을 지정해주었는데요.
그런데 함수 내에서 append를 진행하는 과정에서
colnames 에 계속 '카운트수'가 계속 추가되어
colnames =['구분','카운트수','카운트수' ...] 형태가 되어 에러가 발생합니다.

다른 방법으로 함수를 작성하여 해결했으나
에러가 발생한 원인 및 해결책이 궁금해서 질문을 올리게되었습니다.

제가 추정하는 원인은 함수 내에서 값이 초기화 되지 않았기 때문이라고 생각했는데요.
그래서 del new_colnames, new_colnames = [] 방식으로 초기화를 해보려 했으나 먹히지 않았습니다.

혹시 어떤 이유에서 이런 상황이 발생하는 건지 알려주시면 감사하겠습니다.

nowp 9,214 points

2020-06-04 11:44:42에 수정됨
(•́ ✖ •̀)
알 수 없는 사용자
〉

댓글 입력

score 0 · Accepted Answer

new_colnames 디폴트인자가 리스트형이라서, 이게 c의 static 변수처럼 이전호출 때의 결과를 계속 기억하고 있는 것 같네요.

그리고, value_counts 에 normalize 라는 인자가 있어서, 그걸로 비중은 간단하게 구할 수 있습니다.

>>> counts = pd.concat([df.num.value_counts(), df.num.value_counts(normalize=True)], axis=1)
>>> counts.columns = [ 'counts', 'counts_norm' ]
>>> counts
   counts  counts_norm
9      10         0.20
4       7         0.14
1       7         0.14
7       6         0.12
5       5         0.10
3       5         0.10
8       4         0.08
6       4         0.08
2       2         0.04