구글 도서 검색, 다운로드 허용

8

미국 도서관과의 제휴로 책을 스캔해서 검색을 가능하게 하는 구글 도서 검색(Google Book Search) 서비스에서 PDF파일로의 다운로드가 가능해졌다는 소식이 BBC에 의해 알려졌습니다. 어떤 내용인지 알아봅니다.

구글 도서 검색(Google Book Search)은 초창기 구글 프린트(Google Print)로 개발되었으나, 사용자의 요청에 의해 구글 도서 검색이라는 이름으로 바뀌었습니다. 현재 구글 도서 검색은 세가지 URL로 사용할 수 있는데, print.google.com, book.google.com 그리고 공식 URL인 books.google.com입니다. 물론 앞의 두개는 모두 북스로 리다이렉트가 됩니다.

구글이 책을 검색해 준다고 해서 설마 모든 책을 워드프로세서로 옮기진 않겠지 라는 생각을 할 수도 있지만, 구글이 하는 방법은 책의 모든 페이지를 스캔해서 광학 리더기를 이용해서 영문으로 변환하는 기술을 사용하고 있습니다. 따라서, 구글 도서 검색에선 검색은 되지만, 텍스트로 보여지는 것이 아닌 원자료의 그림 파일을 볼 수 있습니다. 신기한 것은 검색어 부분이 노란색으로 반전된다는 점입니다.

그림으로 서비스하는 구글 도서 검색에서 PDF 파일을 지원한다고 하니 좋다라고 생각할 수도 있겠지만, 아쉽게도 PDF 파일 역시 그림 파일로 저장되어 있기 때문에 긁어서 퍼갈 수는 없게 되어 있습니다.

아래의 그림은 구글 책 검색에서 PDF파일이 있을 경우 나오는 PDF 다운로드 링크입니다.

구글 도서 검색의 다운로드 링크

이 링크를 클릭하면 PDF파일이 전송되는데, PDF파일을 열면 그림으로 된 책을 볼 수 있습니다. 그런데, 일부러 그런것인지 책이 똑바로 되어 있질 않고 약간씩 비틀려 있는 것을 볼 수 있습니다.

실제 다운로드한 PDF 파일

이런 PDF 파일은 저작권이 소멸됐거나, 퍼블릭 라이센스가 적용된 서적에만 적용됩니다. PDF 파일의 첫페이지는 구글에서 작성한 부탁의 글이 써 있는데, 그 내용이 매우 정중합니다. 이런 PDF 파일은 구글이 저작권을 주장할 수 없기 때문에 법에 의한 강요를 할 수 없습니다.

구글의 부탁(ask)의 말 네가지는 이렇습니다.

PDF 파일의 첫장 인용:

1. 상업적으로 쓰지 말아 주세요(Make non-commercial use of the files)
2. 자동화된 쿼리를 삼가해주세요(Refrain from automated querying)
3. 속성을 유지해 주세요(Maintain attribution) – 구글 워터마크를 지우지 말라는 말
4. 법을 지키세요(Keep it legal)

미국의 책이야 구글이 자체적으로 스캔한다고 해도 한국 책들은 그럴 수 없습니다. 구글이 가지고 있는 광학 리더기가 한글을 읽을 수 없는 것도 이유가 되겠네요. 만약 구글 도서 검색에 내가 권리를 가지고 있는 책을 넣고 싶다면 구글 도서 검색의 파트너 페이지에서 신청할 수 있습니다.

구글 도서 검색의 파트너 프로그램

구글 도서 검색의 파트너 프로그램은 전의 포스팅에서도 언급했듯이 도서 권리자에게 수익을 주는 시스템이 마련되어 있습니다.

보통 이런 서비스는 저작권료로의 지출이 많기 때문에 수익이 크게 나기가 힘듭니다. 그리고, 온라인 서적 시장은 이미 아마존이 석권하고 있는 상태이기도 합니다. 하지만, 이런 사업은 구글이 얼마만큼 정보에 욕심이 많은지를 단적으로 보여주고 있습니다.

추가.

Google Book Search의 한글 공식 명칭은 구글 도서 검색입니다. 도서라는 말이 조금 딱딱한 면이 있는데 쉽게 책 검색이라고 하는 것도 좋을 것 같네요.

About Author

구글 전문 블로그 “팔글-인사이드 구글”을 2003년 부터 운영했으며, 애드센스와 유사한 애드얼라이언스의 기획&개발에 참여한 바 있다.
IT 기업들의 생태계에 대해 관심이 많으며, 광고, 디지털 콘텐츠 판매 등 여러가지 실험을 진행하고 있다.

8 Comments

  1. 정말 구글의 기업이미지는…
    정보에 대한 무한한 가능성 인듯 합니다.
    물론 주관적인 제 의견이긴 하지만요 ^^
    늘 소중한 정보 잘 보고 있습니다 (_ _)

  2. 구글스러운 서비스 중 하나..^^:
    요즘 나오는 서비스들을 보면 전반적으로 책 뿐만 아니라.. 점차 모든 것이 웹과 융화되는 느낌이 나네요..
    잘 읽고 갑니다..^^*

  3. 제 글에 남긴 덧글 보고 궁금해서 여쭙는 것인데요, 제 블로그의 ‘일관성’이라는 것이 무엇이죠? 아무리 생각해도 욕하지 않는 것 빼놓고는 제 블로그의 일관성이라 할만한 것이 떠오르지 않아서요. 그 글에서도 욕은 안 했으니 그건 아닌 것 같고. ^^;
    저는 모르지만 방문객이 보는 제 블로그의 일관성이 뭔지 궁금하네요.

  4. 김중태님 일관성이라고 하는 것은 IT에 관계된 글만 있다가 개인적인 이야기가 나온 것을 말하는 것인데… 전 김중태님이 그 부분에 신경을 쓴다고 생각했거든요. 개인적인 이야기는 쓰지 않는다는… 김중태 블로그의 리스트를 보면 대화체 제목은 이번 글 하나 뿐이잖아요. 그게 마음이 아프다는 것이었습니다. ^^;

  5. 아, 그렇게 보셨군요. 사실 개인적인 이야기도 많이 합니다. 1기 블로그 보면 개인사나 가정사도 많이 올렸고요, 저를 비판한 글에 대해 답글 형태로 쓴 글도 많습니다. 작년 12월에 네이버 간담회 사건 전후로 쓴 글을 보면 여기저기와 많은 충돌도 있었고요. 최근, 특히 올해 초부터 글 쓸 시간이 없어서 다른 곳에 쓴 IT관련 글 위주로 올리다보니 IT 관련 글만 올리는 것처럼 보인 것이죠. ^^;
    최근 글 보면 알겠습니다만 휴가 끝난 후 조금 여유가 생겨 가족 사진도 올리는 등 개인사를 늘리고 있습니다. 블로그에 개인사를 많이 올려야 부지런히 사진도 찍고, 기록도 꼼꼼하게 되더라고요. 앞으로는 제 독자들이 요즘 뜸하다고 아쉬워하는 성인취향 글도 자주 올릴 생각이랍니다. 기대해주시기를.. ^_^

  6. 사악해지지 말자는 구글의 의지를 잘 알고 있습니다만,,
    사악해지는 순간 구글이 빅브라더가 될 수 있다는게 좀 걸리네요. 누가 어떤 정보를 검색했는지, 어떤 책을 읽었는지, 어디서 무얼 하고 있는지도 구글은 알고 있으니까요.

하나의 댓글은 블로그를 풍성하게 만들 수 있습니다 :)