티스토리 툴바


구글의 유니버셜 서치에 대해 블록거들이 글들이 많이 나오고 있습니다.
제가 관심잇는 것은 유니버설 서치를 구현하고 있는 구글의 방법이 무엇일까 하는 것입니다.

즉 일반적인 웹문서의 중요도 판단은 페이지 랭크라고 알려져 있습니다.
검색 결과를 섹션별로 나누어서 보여주는 경우 ( 통합검색 )에는 각 섹션별로 Ranking 판단의 기준을 따로 따로 가져 갈수 잇기에 그리 어려운 기술은 아닙니다. 즉 이미지는 이미지 끼리 비교하고  , 블로그는 블록끼리 비교하고 동영상은 동영상끼리 비교하여 각 섹션안에서의 랭킹을 계산하면 되는 것이지만

유니버셜 서치는 그렇지 않습니다. 예를 들면 한 키워드에 따라 검색되어진 웹문서 10개 , 뉴스 10개 , 이미지 10개 동영상 10개가 잇다면 이들 40개중 10개를 뽑아 첫페이지에 보여주어야 하는데 이때 한가지 기준을 정해야 한다는 것입니다. 이건 매우 어려운 고민이고 구글이 이를 해결햇다는 것이 중요한 점입니다. 어떻게 했는지는 모르지만 일단 그걸 구현햇다고 인정한다면 상당한 노력이 들어간 작업입니다.

네이버도 Collection 이라고 부르고 있는 각각의 섹션별로 키워드마다 Collection 을 뿌려주는 방식이 다릅니다.
어떤 키워드는 지식이 Collection 이 먼저 나오고 어떤 키워드는 웹문서가 먼저 나오는 등 키워드에 따라 Collection Ranking을 적용 하여 뿌려주는 순서를 바꾸고 있습니다. 네이버가 이를 어떻게 구현했는지는 역시 알수가 없으나 아마도 구글 , 네이버 모두 사용자의 검색 행동 분석을 햇으리라 짐작이 됩니다.
오랜 기간 서비스를 운영하면서  얻은 사용자의 검색후 행동기록 ( QCTR )를 통해 각각의 키워드에 따라 어떻게 Collection 별로 순서를 잡아야 하는지에 대한 인사이트를 얻엇다고 생각합니다.


네이버에서 바이러스를 검색하면
사전==> 지식인==> 비즈사이트==>사이트==> 지역정보==>영화==>블로그==> 카페 순입니다.
그러나 구글을 검색하면
바로가기 ==사이트==>지식인==> 사전 -=> 블로그 ==> 카페 순입니다.
이것이 Collection Ranking 입니다.
개별 Collection 내부의 켄텐츠들은 아래 그림방식으로 뽑아집니다. ( 네이버 블로그 출처 )
사용자 삽입 이미지


구글의 Universal Search는 아래 그림 입니다. 차이가 보이나요 ? 바로 랭킹의 적용 시점입니다. 모아서 적용하느냐 ,따로 적용해서 모으느냐 이 차이죠. 이것이 구글이 말하는Comparative Ranking 과 Blending 기술입니다.
사용자 삽입 이미지




통합검색과 유니버셜 서치는 그 구현 방안부터가 다른 기술을 요구하고 있다는 점이 이번 구글 서비스를 통해 보아야 할 점으로 생각합니다.

예를 들면 최근 "영어교육" 문제로 세상이 시그럽습니다. 이때 영어교육이란 질의를 햇을때 뉴스 , 이미지 , 동영상 , 웹문서 , 블로그 중 어느 컨텐츠가 중요한 것이냐의 판단을 구글은 실시간으로 해내고 잇다는 것이고 네이버는 과거에 미리 정해진 원칙에 따라 움직이고 있다는 ( 이 원칙이 어느정도 빠르게 변화하는지는 저는 알수 없습니다 )커다란 기술의 차이를 보여주는 서비스로 이해해야 합니다.

동영상 파문이 일고있는 경우는 동영상이 우선 검색이 되어야 하고 사회적 이슈로 논쟁이 일고 있는 경우는 블로그나 뉴스가  , 연예인 노출건 이 터지면  이미지가 우선 검색되는 시스템 바로이게 유니버셜 서치의 무서운 점이지요.
크리에이티브 커먼즈 라이선스
Creative Commons License

'검색세상이야기' 카테고리의 다른 글

야후의 Open Search Platform 참 좋아 보입니다.  (0) 2008/02/26
포털에서 검색의 역할  (0) 2008/02/19
유니버셜 과 통합 검색  (0) 2008/01/31
네이버 랩  (0) 2008/01/30
새로운 Meta Search lxquick  (0) 2008/01/23
구글 PageRank 의 한계와 진화  (5) 2008/01/17
Posted by 제다이기사