사이킷런 데이터 로드에 대해서 질문있어요

조회수 690회

사이킷런에서 사이킷런 폴더에 \Anaconda3\Lib\site-packages\sklearn\datasets\data에 예시용 데이터셋으로 boston_house_prices, breast_cancer, iris 등의 데이터가 있는데 예시용 데이터셋은 항상 오류없이 불러오지만 제가 쓰려는 데이터를 폴더에 옮겨서 사용하면 여러가지 데이터로 해봐도 계속 오류가 납니다.

from sklearn.datasets import load_test 라고 치면 ImportError: cannot import name 'load_test' 이렇게요

사용 할 수 있는 방식이 있을까요?

  • 파이썬에서 csv나 json 파일을 읽는 방법을 학습하세요. 사이킷런은 보통 pandas 와 함께 작업할 경우가 많으니 pandas 로 csv나 json 파일 읽는 방법을 검색해보세요. 정영훈 2020.4.13 03:39
  • https://scikit-learn.org/stable/datasets/index.html#toy-datasets 여기 보면 load_test가 없는데 어디서 찾으신거죠?? 알 수 없는 사용자 2020.4.13 17:46
  • 네 저 데이터셋 제외하고 다른 제가 사용 할 데이터 이름이 test입니다 예제용 데이터셋으론 전부 생성되는데 다른 데이터를 사용하면 오류가 납니다 yjk 2020.4.13 21:03

1 답변

  • 좋아요

    0

    싫어요
    채택 취소하기

    data 폴더에 데이터만 집어 넣는다고 load_ 함수가 저절로 생기는 게 아닙니다. .../sklearn/dataset/_base.py 파일을 보면, load_iris를 비롯한 여러 load_* 함수들이 정의되어 있는 것을 볼 수 있을 겁니다.

    그것 보고 비슷하게 만드시거나, 아니면, 댓글에서 다른 분들이 말씀하신 것처럼, pandas 등으로 읽는 함수를 간단하게 구현하시면 될 겁니다.

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)