구글 왈, 다음블로그야 협조좀 해줘

4

구글 웹서치를 즐겨 쓰는 인터넷 사용자는 유독 다음블로그가 검색이 잘 된다는 것을 알게 됩니다. 아무런 내용도 없는 블로그도 역시 매우 높은 랭킹으로 검색이 됩니다. 왜 이런일이 발생하는 것일까요?

다음 블로그는 robots.txt를 만들어 놓지 않았기 때문에 외부에서 검색엔진이 검색을 할 수 있게 되어 있습니다. 검색엔진 중에 업데이트가 가장 빠른 검색엔진이 바로 구글입니다. 구글은 구글댄스라고 해서 30일정도에 80억개가 넘는 모든 웹페이지들을 업데이트 시켜버리는 괴물같은 검색엔진입니다.

구글웹서치의 복잡한 알고리즘으로 사용자는 검색어와 가장 연관성이 높은 웹페이지를 찾을 수 있는데, 유독 다음 블로그는 중요하지도 않는 문서들이 검색결과의 상위에 랭크됩니다. 이런 현상의 열쇠는 바로 다음 블로그의 URL 구조 때문입니다.

다음 블로그는 프레임이란 것을 사용해서 문서의 정확한 URL을 숨김니다. 아래는 제가 만들어 본 다음 블로그의 URL입니다.

다음 블로그의 URL

이 화면과는 다르게 페이지의 원래 URL은 http://blog.daum.net/_blog/blog.do?blogid=08zOJ 입니다. 원 URL을 보면 알겠지만 블로그의 글 끼리 구분하는 구분자는 blogid값밖에는 없습니다. 즉, URL만 보고는 이 사람 블로그인지 아닌지를 구분할 수가 없다는 말이죠.

이 것은 검색엔진도 마찬가지로 적용됩니다. 구글은 이 URL을 보고 누구의 블로그인지 모릅니다. 아마도 다음의 모든 블로그가 한 사람이 만든 것으로 오해하고 있을 가능성이 매우 높습니다.

첩첩산중으로 다음 블로그는 서로 이리저리 자동으로 링크가 걸리는 것도 많습니다. 소위 랜덤링크라고 하는 것도 있어서 검색엔진은 더욱 혼란스러울 수 밖에 없겠지요.

이런 이유로 구글웹서치는 현재까지는 다음 블로그에 매우 높은 랭킹을 부여하고 있습니다만, 이 것이 얼마나 오래 갈지는 알 수 없습니다. 구글웹서치가 이런 사실을 알게 된다면 올바른 검색결과를 내기 위해서 다음 블로그에 어떤 패널티를 가할 것이 분명하기 때문이죠. 그렇게 된다면 알찬 내용으로 만든 블로그도 피해 아닌 피해를 입을 수 있습니다.

이런 일이 생기기 전에 다음 개발진들이 블로그의 URL에 아이디를 넣는 것이 필요합니다. 다시 말해서 위의 주소는 다음과 같이 바꾸는 것이 필요할 것입니다.

http://blog.daum.net/_blog/blog.do?username=cable8mm&blogid=08zOJ
또는
http://blog.daum.net/_blog/cable8mm/blog.do?blogid=08zOJ

About Author

구글 전문 블로그 “팔글-인사이드 구글”을 2003년 부터 운영했으며, 애드센스와 유사한 애드얼라이언스의 기획&개발에 참여한 바 있다.
IT 기업들의 생태계에 대해 관심이 많으며, 광고, 디지털 콘텐츠 판매 등 여러가지 실험을 진행하고 있다.

4 Comments

  1. 룰루루. 구글 댄스는 검색을 하는게 아니라 검색 알고리즘을 바꾸는 걸 말하지 않던가요 :)

  2. 구글 댄스는 구글의 인덱스가 모조리 업데이트되는 것을 말하는 것입니다. 영어로는 The Google Dance is the time between the start and the end of an update 또는 간단히 Google’s monthly update 라고도 하지요.
    제가 전에 쓴 글인 구글과 관계된 재미있는 말들에 구글에 관련된 재미있는 용어가 나와있습니다. :-)

  3. 지나가다가 눈에 살짝 걸리는 표현들입니다.
    발빠른 정보에 블로그를 항상 즐겨 읽고 있습니다.

    이 화면과는 틀리게 페이지의 원래 URL은 -> 이 화면과는 다르게…
    다시 발해서 위의 주소는 -> 다시 말해서…

하나의 댓글은 블로그를 풍성하게 만들 수 있습니다 :)