파이썬 dataframe에서 문자열 분리 질문 드립니다.

조회수 7081회

파이썬 dataframe에서 문자열을 분리하는 방법이 궁금합니다.

list에서는 split 메서드를 사용하면 되는데, dataframe에서는 모르겠습니다.

구체적으로는 dataframe에 저장된 문자열을 아래와 같이 일부분만 남기고 싶습니다.

'Hi Seoul' -> 'Hi'

1 답변

  • name 컬럼을 보세요.

    data = {'name': ['aaaa 1111', 'bbbb 2222', 'cccc 3333', 'dddd 4444', 'eeee 55555'],
            'year': [2012, 2012, 2013, 2014, 2014],
            'reports': [4, 24, 31, 2, 3],
            'coverage': [25, 94, 57, 62, 70]}
    
    
    
    df = pd.DataFrame(data, index = ['Cochice', 'Pima', 'Santa Cruz', 'Maricopa', 'Yuma'])
    
    df
    Out[66]: 
                coverage        name  reports  year
    Cochice           25   aaaa 1111        4  2012
    Pima              94   bbbb 2222       24  2012
    Santa Cruz        57   cccc 3333       31  2013
    Maricopa          62   dddd 4444        2  2014
    Yuma              70  eeee 55555        3  2014
    
    df['name'] = df['name'].apply(lambda e: e.split()[0])
    
    df
    Out[68]: 
                coverage  name  reports  year
    Cochice           25  aaaa        4  2012
    Pima              94  bbbb       24  2012
    Santa Cruz        57  cccc       31  2013
    Maricopa          62  dddd        2  2014
    Yuma              70  eeee        3  2014
    

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)