python 문장에 가중치 매기기 질문입니다. (word2vec, doc2vec 비슷)

조회수 660회

word2vec, doc2vec은 단어,문장에 100차원 정도의 크기의 가중치를 매겨 입력 단어와 비슷한 단어를 알려주는 알고리즘이라고 배웠습니다.

여기서 생각한 것이 제가 문장 하나하나에 가중치를 매길 수 있을까? 입니다.

예를 들어 '나는 오늘 학교에가서 실험을 했고, 친구들과 많이 놀았다.'

라는 문장이 있다고하면

개방성 성실성 외향성 친화성 감정의 기복 호기심 도전 보수성 이기적 포용적
1 0.5 1 1 0.5 1 1 0.5 0.5 0.5

이렇게 제가 가중치를 매기는 것입니다.

이렇게 1000개 정도의 문장에 가중치를 매기고 이를 바탕으로

  1. 다른 문장에 대해서 가중치를 자동적으로 매기기
  2. 전체적인 결과 시각화하기

이 2개가 가능할까요??

2번의 경우는 할 수 있을 거 같은데, 1번이 가능한지 궁금합니다.

그리고 위에처럼 다른 문장에 대해서 가중치를 매기는 것이 가능하다면 그 방법이 무엇인지 궁금합니다. (word2vec 알고리즘과 비슷할 거 같은데 잘 안됩니다.)

  • 머신러닝을 하겠다는 것인데 모델을 만들 수 있으면 가능하겠죠. 그러나 대상이 자연어이므로 형태소분석을 통해 의미있는 토큰으로 나눠야하고 그 의미있는 토큰마다 가중치를 부여해야겠죠. 그 다음 신경망을 이용해서 머신러닝을 이용해야 합니다. 간단한 일이 아닙니다. 정영훈 2019.5.17 18:47
  • 쉽지않군요.. 감사합니다 알 수 없는 사용자 2019.5.19 10:19
  • 쉽지않군요.. 감사합니다 알 수 없는 사용자 2019.5.19 10:19

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)