GMail의 메일 제목이 깨지는 현상, 혹시 버그?

6

GMail은 메일 표준을 거의 완벽하게 지키고 있습니다. 원래 메일을 보내고 받는 역할을 하는 메일서버는 다국어를 염두에 두지 않았기 때문에 한글을 이용할 경우 깨지는 것이 정상입니다. 하지만, 현재 많은 꽁수(?)가 들어갔기 때문에 한국대 한국은 서로가 서로를 대충 지원해 주기 때문에 깨지는 경우는 좀처럼 발생하지 않습니다만, 외국의 웹메일등은 한글을 사용할 때 국내 메일서버와 호환이 되지 않는 현상이 발생할 수 있습니다. 왜 이런 일이 발생할까요?

한글이 깨지는 현상을 이해하기 위해선 인코딩이라는 용어를 이해할 필요가 있습니다. 같은 음악이라도 MP3, OGG, WMA 등의 다양한 확장자가 존재하듯이 언어도 어떻게 인코딩을 하느냐에 따라서 같은 한글이지만 틀린 데이터가 될 수도 있습니다.

무슨 말이냐 하면, “안녕”이라는 단어를 컴퓨터로 표현할 경우 완성형, 조합형 또는 확장완성형 등의 여러가지 표현 방법이 있습니다. 물론 정확한 인코딩 용어는 따로 있습니다. 현재 유니코드의 발전으로 인해 대게의 컴퓨터에서 유니코드를 지원하기 때문에 메일 서버도 유니코드 인코딩이 대세로 굳어지고 있습니다.

웹에서의 인코딩

웹사이트를 만들어 본 분이라면 euc-kr이라는 말을 들어보았을 것입니다. 들어보지 못한 분은 브라우져에서 “보기” -> “문자인코딩”을 선택하면 서유럽어, 유니코드, 한글 등의 메뉴가 보이는 것을 확인할 수 있습니다. 즉, 웹사이트를 만든 제작자가 euc-kr이라는 방식으로 인코딩을 할 경우 보는 사람도 euc-kr로 봐야 제대로 보입니다. 유니코드 기반인 UTF-8이라는 방식으로 제작할 경우 UTF-8로 봐야 제대로 보입니다.

대부분 브라우져에서 자동으로 세팅이 맞춰주기 때문에 이 부분은 신경을 쓰지 않아도 되지만, 가끔 한글이 와장창 깨져서 나올 때가 있습니다. 이 것이 인코딩이 맞지 않아서 입니다.

정리하면, 모든 한글은 보낸 이의 인코딩 방식을 알아야 제대로 볼 수 있다는 의미입니다.

euc-kr은 한국 내에서만 쓸 수 있는 방식

euc-kr은 한글의 고유 인코딩 방식입니다. 전통적으로 유니코드가 일반화 되지 않았을 때에 가장 많이 사용되던 인코딩 방식이고, 지금도 대부분의 포탈사이트들이 웹사이트를 제작할 때 euc-kr로 제작합니다. 하지만, 최근 테터툴즈는 euc-kr을 버리고 UTF-8을 기본으로 채택하기도 했습니다.

메일은 대부분 한국 내에서 보내지고 받습니다. 웹메일 업체들은 인코딩이 따로 설정되어 있지 않으면 euc-kr로 해석을 하기 때문에 따로 인코딩하지 않고 보내도 잘 보입니다. 하지만, 이 이유 때문에 외국의 웹메일에서 한글이 가끔 깨지는 현상이 발생하게 됩니다.

한글이 안깨지게 할 수는 없나?

GMail은 많은 경우 인코딩을 하지 않아도 언어를 판독해서 인코딩을 찾아주는 기능이 있습니다. 물론, 메일 본문의 인코딩 방식을 참조하게 됩니다. 하지만, 보내는 메일 서버가 인코딩 방식을 전혀 알려주지 않을 경우 GMail은 한글을 제대로 인식하지 못하게 됩니다.

이 현상은 보내는 사람이 메일 표준을 지키지 않아서 입니다. 영어가 아닌 문자는 인코딩을 해서 전송을 해야 합니다. 한국의 웹메일에서 깨지지 않고 보이는 것은 당연히 euc-kr 방식의 인코딩인 것으로 해석을 했기 때문이지 더 뛰어나서는 아닙니다.

따라서, 받는 쪽에서 기본 인코딩을 euc-kr로 하는 방법도 있기는 하지만, 그 기능을 GMail에서는 지원하지 않습니다. 사실 그런 기능을 웹메일에서 지원하는 경우는 보질 못했습니다. 하지만, 아웃룩 익스프레스 같은 경우 기본 인코딩을 지정해 줄 수 있기 때문에 euc-kr로 세팅하면 한글 메일은 깨지지 않고 잘 보입니다. 하지만, 이것도 중국어나 일본어 등의 메일이 인코딩을 하지 않고 올 경우 깨지는 현상을 피할 수는 없습니다.

최선의 선택

보내는 회사의 메일서버 관리자에게 인코딩을 해 달라고 말하는 방법이 가장 좋습니다. 이 문제는 보내는 쪽의 문제이지 받는 쪽의 문제가 아니기 때문입니다. GMail의 출현으로 네이버나 다음도 보내는 옵션에서 유니코드로 발송하기가 추가되었다는 사실이 이를 반증합니다.

다만, Google 데스크톱에 들어있는 이메일 플러그인에는 자동으로 인코딩 방식을 디텍팅해 주는 기능이 더 강력하기 때문에 GMail에서 제대로 보이지 않는 것도 데스크톱 이메일 플러그인에서는 제대로 보이는 경우가 많습니다.

기술적인 부분은 어바웃 웹에 “메일발송과 문자셋 문제“라는 글을 포스팅 했으니 참고하세요.

About Author

구글 전문 블로그 “팔글-인사이드 구글”을 2003년 부터 운영했으며, 애드센스와 유사한 애드얼라이언스의 기획&개발에 참여한 바 있다.
IT 기업들의 생태계에 대해 관심이 많으며, 광고, 디지털 콘텐츠 판매 등 여러가지 실험을 진행하고 있다.

6 Comments

  1. Gmail 처음 시작 당시에는 인코딩 셋을 자동으로 식별하여 처리해줬다가, 2004년말 즈음에 해당 처리과정 자체를 내렸었습니다. 그리고 2005년 봄부터 다시 처리가 되기 시작했었는데, 6월 15일 이후 다시 처리과정을 내린 것으로 보입니다(지금 제 gmail의 메일로 판단해볼 때). 결국 Google 쪽에서도 아직 인코딩 여부 판단에 대한 최종 결정을 내리지 못한 것으로 보입니다. 2년새 인코딩 정책이 3번이나 바뀐 셈이니까요.

    뭐 내부적인 문제가 있을 수 있겠습니다만, 아직 한국내 대다수 웹페이지나 메일 서비스 등에서 UTF-8로 전환하기에는 다소 시기상조라고 보이는 이상(유니코드를 제대로 지원하지 못하는 Windows 98 서비스 중단한다니까 국정원까지 나서지 않습니까), 만약 구글이 한국내 지사를 가지고 한국내 메일팀을 가지고 있었을 때, 과연 자동 인코딩 처리 미지원을 밀어붙일 수 있었을까 하는 의구심이 들기도 합니다.

    구글은 공식적인 한국지사가 없는 미국 회사고, 공식적으로는 아직 베타 서비스이며, Gmail의 사용자들이 보통의 엔드 유저보다는 다소 앞서있는 프론트 엔드 유저에서 미들 유저 혹은 하이 유저임과 동시에 구글의 정책에 우호적이라는 것을 감안해본다면, 지금처럼 정책을 수정하는 것에 대해 뭐라 할 수는 없겠습니다만, 메일이라는 것이 기본적으로 커뮤니케이션을 목적으로 한다고 볼 때 Gmail 정도 되고, 더욱이 그것이 구글의 서비스다라고 한다면 보다 포용성 있게 처리하는 것도 나쁘지 않은 방법이라고 생각합니다. 아직까지 개인의 툴 중에서 가장 이용빈도가 높은 것이 메일이니까요.

    뭐 그래도, 역시 한국 웹들이 하루빨리 유니코드 기반으로 바뀌어야할텐데요…

  2. Pingback: 오선지위의 딱정벌레

  3. 너른 호수님, 정확한 지적입니다. 정석이니 표준이니 하는 것도 중요하지만, 보내는 이가 한글로 인코딩 없이 보낼 때 깨져 나오는 것은 문제네요.
    전, Google 데스트톱을 이용해서 메일 알림을 보기 때문에 딱정벌레님과 같은 상황은 피부로 느낄 수는 없지만, 보는 것만으로도 굉장히 불편하군요.

  4. 신기한건 wp 의 덧글 알림도 보낸 이가 깨진다는거죠;;
    계정의 메일 서버 탓일가요?-_-;;

    인코딩이 지정되어있는지는 살펴보지 않았지만
    조금 당황스러운 경우a

  5. wp은 기본으로 인코딩이 지정되지 않더군요. 인코딩을 지원하려면 경우에 따라서 iconv나 mb계열의 함수가 지원되야 하는데, PHP과거 버젼은 기본으로 설정된 것이 아니라서…
    그나저나 최근에 자동 설정부분이 완전히 적용되지 않는것 같습니다. 이건, 많이 불편하군요.

  6. Pingback: 박차장의 스마트폰 100배 활용 팁 – #2. 10년 넘게 사용하던 MS아웃룩을 버린 사연 | GetAbout

하나의 댓글은 블로그를 풍성하게 만들 수 있습니다 :)