편집 기록

편집 기록
  • 프로필 nowp님의 편집
    날짜2022.06.11

    문제만 나열한 질문 삭제 : 회사 통신연수 문제인데 답변해 주시면 매우 감사드리겠습니다. 감사합니다.


    문제만 나열한 질문 삭제

  • 프로필 Changmin Oh님의 편집
    날짜2022.06.11

    회사 통신연수 문제인데 답변해 주시면 매우 감사드리겠습니다. 감사합니다.


    [조건1]

    1. nonghyup이라는 이름으로 n, g, y, p라는 column 값을 가지는 데이터 프레임을 생성하는 코드를 작성하십시오.
    2. append() 함수를 사용하여 n, g, y, p라는 column에 각각 1, 3, 5, 7이라는 값을 딕셔너리 형태로 추가하는 코드를 작성하십시오.
    3. 데이터 프레임에 추가한 딕셔너리 값을 출력하는 함수를 제시하십시오. (배점 18)

    2)1. 제시된 결과와 같이 2차원 리스트 안에 (값1, 값2)로 구성되어 있는 튜플을 작성하십시오.

    1. from_records() 함수를 활용하여 columns 정보를 추가하여 데이터프레임 코드를 작성하십시오. (열 항목명: col_1, col_2)

    col_1 col_2 0 5 a 1 4 b 2 3 c 3 2 d 4 1 e


    1)[조건1]

    1. ‘형태소/품사’의 형태로 데이터를 추출하는 객체를 선언할 수 있는 클래스를 제시하십시오.
    2. [조건1]의 1에서 제시한 클래스를 import 하는 코드를 작성하십시오.
    3. nouns() 함수를 활용하여, content(문자열이 들어가 있는 데이터프레임)에서 명사(Nouns)를 추출하여 nonghyup이라는 변수에 할당하는 코드를 작성하십시오. (배점 15)

    2)[조건2] Counter 클래스와 most_common 함수를 활용하여, content(문자열이 들어가 있는 데이터프레임)에서 빈도가 높은 10개의 명사 형태소를 출력하는 코드를 작성하십시오. 단, collections 라이브러리의 Counter 클래스를 사용하시오. (배점 15)


    1)[조건1] 말뭉치에서 키워드 빈도수 리스트를 추출하는 코드를 완성하시기 바랍니다. [한 글자 명사 키워드]만을 대상으로 추출한 available_counter와 ‘제주도 호텔’ 검색이라는 도메인에 필요한 불용어를 담고 있는 jeju_hotel_stopwords 두 개의 객체를 이용하여, 말뭉치 내에 등장하는 빈도수를 점수로 워드 클라우드에 필요한 tags를 만드십시오.

    tags = (배점 5)

    2)[조건2] 키워드 빈도수 높은 순으로 튜플을 정렬하는 코드를 완성하시기 바랍니다. 이때 튜플의 두 번째 값을 기준으로 정렬하여 상위 30개를 추출하여 정렬하는 코드를 완성하기 바랍니다.

    sorted_by_value = (배점 5)

    3)[조건3] 빈도수 기반 워드 클라우드로 시각화하려고 합니다. 다음 제시된 주석의 조건에 따라 빈 칸의 코드를 완성하시기 바랍니다.

    pytagcloud로 출력할 단어를 입력한다. 단어 출력의 최대 크기는 30으로 제한합니다.

    taglist =

    pytagcloud 이미지를 생성하고, 사이즈는 800*600, 폰트는 나눔 고딕을 사용합니다.

    pytagcloud.create_tag_image(taglist, 'wordcloud.jpg', )

    생성한 이미지를 주피터 노트북 상에서 출력하는 코드를 작성합니다.

    from IPython.display import Image (배점 30)