데이터전처리 때 라벨링질문

조회수 77회

넘파이 어래이 타입이 여러개 있고 어래이의 시퀀스들을

다른 list에 append 하는 방식으로

하나의 넘파이 어래이를 읽어서 시퀀스 저장하고

다시 다음 넘파이 어래이를 읽어서 시퀀스 저장하는 것을 반복하여

몇천개의 element로 구성된 list를 라벨링 하고자 할 때

여기서 하나의 넘파이 어래이 시퀀스들은 같은 라벨 값을 가집니다.

좋은 방법이 있는지 궁금합니다.

1 답변

  • 좋아요

    0

    싫어요
    채택 취소하기

    대략 아래와 같은 상황인가요? 참고하세요.

    
    import numpy as np
    import pandas as pd
    
    np.random.seed(1)
    
    
    def read_dogs():
        return np.random.rand(100, 4)
    
    
    def read_cats():
        return np.random.rand(50, 4)
    
    
    개데이터 = read_dogs()
    고양이데이터 = read_cats()
    
    
    개데이터프레임 = pd.DataFrame(개데이터, columns="키,무게,앞발길이,꼬리길이".split(","))
    개데이터프레임["종류"] = "개"
    
    고양이데이터프레임 = pd.DataFrame(고양이데이터, columns="키,무게,앞발길이,꼬리길이".split(","))
    고양이데이터프레임["종류"] = "고양이"
    
    개고양이데이터프레임 = pd.concat([개데이터프레임, 고양이데이터프레임], axis=0, ignore_index=True)
    
    print(개고양이데이터프레임.sample(5).to_markdown())
    
    - 무게 앞발길이 꼬리길이 종류
    55 0.176196 0.332064 0.130997 0.809491
    14 0.574118 0.146729 0.589306 0.699758
    16 0.0499535 0.535896 0.663795 0.514889
    138 0.754891 0.463858 0.124823 0.312501 고양이
    20 0.883306 0.623672 0.750942 0.348898
    • 감사합니다. 참고할만한거 같은데 제 상황은 랜덤이 아닌 순서가 있고 그 순서대로 라벨링해야합니다. energi-py-thon 2021.12.30 11:04
    • @fhdltnd : 코드를 잘 읽어보고 댓글좀 답시다. 랜덤은 그냥 테스트용 데이터를 생성하려고 쓴거고요. daewon 2021.12.30 11:06
    • 아 저는 섞는줄알고 100까지 개고 101부터는 고양이 이군요. 감사합니다 ㅎㅎ energi-py-thon 2021.12.30 11:12

답변을 하려면 로그인이 필요합니다.

Hashcode는 개발자들을 위한 무료 QnA 사이트입니다. 계정을 생성하셔야만 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)

ᕕ( ᐛ )ᕗ
로그인이 필요합니다

Hashcode는 개발자들을 위한 무료 QnA사이트 입니다. 계정을 생성하셔야만 글을 작성하실 수 있습니다.