word2vec, doc2vec은 단어,문장에 100차원 정도의 크기의 가중치를 매겨 입력 단어와 비슷한 단어를 알려주는 알고리즘이라고 배웠습니다.
여기서 생각한 것이 제가 문장 하나하나에 가중치를 매길 수 있을까? 입니다.
예를 들어 '나는 오늘 학교에가서 실험을 했고, 친구들과 많이 놀았다.'
라는 문장이 있다고하면
개방성 | 성실성 | 외향성 | 친화성 | 감정의 기복 | 호기심 | 도전 | 보수성 | 이기적 | 포용적 |
---|---|---|---|---|---|---|---|---|---|
1 | 0.5 | 1 | 1 | 0.5 | 1 | 1 | 0.5 | 0.5 | 0.5 |
이렇게 제가 가중치를 매기는 것입니다.
이렇게 1000개 정도의 문장에 가중치를 매기고 이를 바탕으로
- 다른 문장에 대해서 가중치를 자동적으로 매기기
- 전체적인 결과 시각화하기
이 2개가 가능할까요??
2번의 경우는 할 수 있을 거 같은데, 1번이 가능한지 궁금합니다.
그리고 위에처럼 다른 문장에 대해서 가중치를 매기는 것이 가능하다면 그 방법이 무엇인지 궁금합니다. (word2vec 알고리즘과 비슷할 거 같은데 잘 안됩니다.)