콘텐츠로 건너뛰기
Home » 20100130 :: RSS없는 웹페이지 추적하기 – Google Reader

20100130 :: RSS없는 웹페이지 추적하기 – Google Reader

RSS란?


흔히 feed라고도 이야기하는 RSS는 자주 변경이 일어나는 웹페이지나 웹사이트의 내용을 전체 혹은 일부와 해당 페이지의 메타 데이터를 합쳐서 변경 사항을 발행하도록 하는 기술입니다. 특히 블로그나 뉴스 사이트 같은 곳에서 많이 사용합니다. 위에서 보이는 저 이미지가 RSS를 나타내는 아이콘입니다. RSS는 사이트의 내용이 업데이트될 때마다, 이를 능동적으로 알려주는 역할을 하게 됩니다. 따라서 RSS를 구독하면 즐겨찾기 대순방과 같은 수고를 덜지 않고도 관심있는 사이트의 새로운 소식을 받아 볼 수 있게 됩니다. 물론 이러한 기술은 웹사이트나 특히 블로그를 운영하는 사람들에게는 자신의 콘텐트를 널리 퍼트리는 좋은 수단이 되기도 하지요.
RSS는 어느 덧 아주 많이 일반화가 되었습니다. 우선 양적으로 지난 몇 년간 급속히 성장을 한 블로고스피어를 이루고 있는 많은 블로그들이 RSS를 통해 게시물을 발행하고 있으며, 시시각각 새로운 기사 및 수정된 기사가 올라오는 신문사 홈페이지들도 분야별로 RSS를 제공합니다. 이러한 RSS는 RSS 구독기를 통해 매번 해당 블로그나 신문사 홈페이지를 방문하지 않고 새 게시물을 한 곳에서 받아볼 수 있습니다. 국내에는 HanRSS가 꽤 유명한 편이고, 구글에서도 구글Reader라는 RSS 구독 서비스를 제공하고 있습니다.

RSS가 없는 페이지를 구독하기

하지만 RSS는 DB에 업데이트가 발생하는 시점에 서버 스크립트 등을 통해 새 버전의 XML파일을 생성해주는 기능을 웹 사이트가 지원해야 사용이 가능합니다. 하지만 모든 웹사이트 혹은 웹 페이지가 이러한 기능을 지원하는 것은 아닙니다. 관심있는 정보가 새로 올라오기를 기다리는 사이트가 있는데, 이 곳에서 RSS 피드를 제공하지 않는다면 매일매일 부지런히, 생각날 때 마다 해당 페이지에 들어와서 변경된 내용을 찾아보는 수 밖에 없겠지요.
저는 RSS 구독기로 구글 리더를 사용합니다. 구글 리더에는 커스텀피드(custum feed)라는 재밌는 기능이 있는데요, 검색엔진이 특정 페이지를 주기적으로 방문하게 되는 것에 착안하여 이를 통해 RSS 피드를 제공하지 않는 페이지의 변경 사항을 감지하고 변경된 내용이 발생하면 구글 서버에서 가상의 피드를 만들어 이를 알려주는 기능입니다.
사용법은 간단합니다. Add Description 버튼을 클릭하여 피드의 주소 (대게는 블로그주소/rss 혹은 /feed 등)가 아니라 그냥 단일 웹페이지의 주소를 입력하면 됩니다. 그럼 해당 주소가 피드가 아니라면서 커스텀 피드를 생성해 준다고 합니다. 이후에는 구글 검색엔진이 해당 페이지의 내용을 갱신하여 변경 사항이 있으면 피드를 발행하는 것과 유사하게 변경 사항을 배달해 줍니다.
RSS를 지원하지 않는 쇼핑몰 등의 사이트를 이용할 때 잘 활용하면 아주 유용할 듯 싶습니다.