한글 자모 분리 카운팅, len("발") -> 3 ?, "발"[0] -> 'ᄇ'?

조회수 783회

안녕하세요. 최근에 모 사이트에서 한글 입력하는 방식이 바뀌면서 신기한 현상이 발생되어서 문의드립니다.

아래 보시면, 똑같은 "발"이라는 글자인데

모 사이트에서 카피한 "발" 은 python에서 len("발")을 해 보면 3으로 나오고, "발"[0] = 'ᄇ' 으로 리턴을 줍니다. 반면 제가 직접 입력한 "발" 은 1로 나옵니다.

그리고 신기한건 모 사이트에서 데이터를 긁어다가 DB에 넣고 검색을 하고 있는데, DB에 들어간 데이터도 위와 같은 문제가 있어 검색이 되지 않는 문제가 있습니다.

혹시 같은 문제를 겪고 계시거나, 해결 방법은 아시는 분들의 많은 조언 부탁드립니다. 참고로 개발 환경의 인코딩은 UTF-8이고, 개발 언어는 python이며, DB charset은 utf-8mb4로 셋팅되어 있습니다.

1 답변

답변을 하려면 로그인이 필요합니다.

프로그래머스 커뮤니티는 개발자들을 위한 Q&A 서비스입니다. 로그인해야 답변을 작성하실 수 있습니다.

(ಠ_ಠ)
(ಠ‿ಠ)