그동안 궁금했던 R에 대해서 책을 보면서 따라해보고 있는 중입니다만 초반부터 한글 인코딩 문제가 발목을 잡더군요.

R Studio logo

R studio 설정창설정에서 UTF-8로 설정 해둔 상태.

기본적으로는 설정에서 인코딩을 UTF-8로 바꾸면 가능한것 같았지만, 지금 환경에서는 무언가 궁합이 맞질 않는지 계속해서 깨져서 나오는 것을 확인 할 수 있었습니다. 코딩을 작성할때는 한글의 입력에는 전혀 문제가 없는데 말이죠.

AREA <- c("서울", "경기", "제주", "서울", "서울")

출력을 하면 깨지는 문제가 생겼던 겁니다.

   ID SEX AGE                     AREA
1   1   F  50 \354\204\234\354\232\270
2   2   M  40 \352\262\275\352\270\260
3   3   F  28 \354\240\234\354\243\274
4   4   M  50 \354\204\234\354\232\270
5   5   M  27 \354\204\234\354\232\270

이런저런 방법을 찾다보니 Sys.setlocale()를 사용한 방법으로 해결한다는 것을 알았습니다.

Sys.setlocale("LC_CTYPE", "ko_KR.UTF-8");

위와 같은 명령어를 실행한후 다시 실행을 하니 한글이 제대로 나오는것을 확인할 수 있었습니다. 단지, 이 설정은 프로그램 종료후 다시 시작한다면 설정값이 초기화가 됨으로 다시 명령어를 실행해 주어야 한다는 단점이 있긴 합니다.

   ID SEX AGE AREA
1   1   F  50 서울
2   2   M  40 경기
3   3   F  28 제주
4   4   M  50 서울
5   5   M  27 서울

문제가 해결 되었으니 다시 달려야 겠습니다.

2018-10-06 추가

이후에도 재정의를 해주어야 했지만, 상기 방식으로 해도 한글이 계속 깨지는 경우가 있었습니다. 그러던중에 알게된 방법이 파일을 불러 들이면서 인코딩을 지정해주는 방식이었습니다. 이렇게 하니까 인코딩에러가 한방에 해결되었습니다.

txt <- readLines(file("file.txt", encoding = "EUC-KR"))

역시, 인터넷의 바다는 넓다는 것을 다시 체감했습니다.