문제만 나열한 질문 삭제
[조건1]
2)1. 제시된 결과와 같이 2차원 리스트 안에 (값1, 값2)로 구성되어 있는 튜플을 작성하십시오.
col_1 col_2 0 5 a 1 4 b 2 3 c 3 2 d 4 1 e
1)[조건1]
2)[조건2] Counter 클래스와 most_common 함수를 활용하여, content(문자열이 들어가 있는 데이터프레임)에서 빈도가 높은 10개의 명사 형태소를 출력하는 코드를 작성하십시오. 단, collections 라이브러리의 Counter 클래스를 사용하시오. (배점 15)
1)[조건1] 말뭉치에서 키워드 빈도수 리스트를 추출하는 코드를 완성하시기 바랍니다. [한 글자 명사 키워드]만을 대상으로 추출한 available_counter와 ‘제주도 호텔’ 검색이라는 도메인에 필요한 불용어를 담고 있는 jeju_hotel_stopwords 두 개의 객체를 이용하여, 말뭉치 내에 등장하는 빈도수를 점수로 워드 클라우드에 필요한 tags를 만드십시오.
tags = (배점 5)
2)[조건2] 키워드 빈도수 높은 순으로 튜플을 정렬하는 코드를 완성하시기 바랍니다. 이때 튜플의 두 번째 값을 기준으로 정렬하여 상위 30개를 추출하여 정렬하는 코드를 완성하기 바랍니다.
sorted_by_value = (배점 5)
3)[조건3] 빈도수 기반 워드 클라우드로 시각화하려고 합니다. 다음 제시된 주석의 조건에 따라 빈 칸의 코드를 완성하시기 바랍니다.
taglist =
pytagcloud.create_tag_image(taglist, 'wordcloud.jpg', )
from IPython.display import Image (배점 30)