본문 바로가기 주요메뉴 바로가기

본문

광고

광고

기사본문

등록 : 2009.12.14 20:29 수정 : 2009.12.14 21:37

구글사이트 검색창에 타이거 우즈를 써넣자 트위터 등에서 관련 정보를 실시간으로 가져오고 있다.

아밋 싱할 구글 연구책임자
초단위로 콘텐츠 띄우되 신뢰도 감별해 제공
비주얼 검색, 사생활 보호책 마련 뒤 서비스
비주얼 검색, 사생활 보호 방책 마련 뒤 제공

세계 검색시장을 지배하고 있는 구글이 지난 7일 실시간 검색, 이미지 인식을 통한 비주얼 검색, 음성인식 검색 등 대대적인 검색기능 업그레이드를 발표했다.

구글은 단문블로그인 트위터, 사회관계망 서비스인 마이스페이스·페이스북과의 제휴를 통해 이들 사이트의 콘텐츠가 실시간으로 구글검색에서 나타날 수 있도록 했다. 구글닷컴(google.com) 검색 결과의 ‘최신’(latest) 항목에선, 해당 검색어에 대한 실시간 검색 결과가 자동으로 업데이트되는 것을 볼 수 있다. 구글 검색의 연구개발을 지휘하고 있는 아밋 싱할(사진) 박사를 인터뷰해, 실시간 검색에 대해 물었다. 싱할은 2000년 이후 구글에서 검색기술 개발과 품질을 지휘하는 부사장급 연구책임자(펠로)다. 인터뷰는 지난 8일 구글코리아의 서울 역삼동 사무실에서 화상회의 장치로 미국 캘리포니아 마운틴뷰의 구글 본사와 연결해 화상으로 이뤄졌다.

-구글은 초기부터 실시간 검색이 중요해질 것이라 예견했는가?

“전혀 아니다. 구글 초기 실시간 검색은 상상도 못 했다. 30일에 한 번씩 전체 웹의 콘텐츠를 가져와 분류(인덱싱)하느라 정신이 없었다. 내가 일해온 지난 9년간 구글은 인덱싱 주기를 한달, 하루, 1시간, 1분 단위로 단축시켜왔고 이번에 몇초 단위로 가능해졌다. 트위터 같은 제휴사들이 제공하는 ‘실시간 웹’을 구글의 기술과 통합한 덕분이다.”

-마이크로소프트의 빙(bing.com)도 실시간 검색을 반영하는데 구글만의 장점은?

“실시간 검색을 검색결과 페이지에 통합시킨 것은 구글이 처음이다. 별도의 사이트로 갈 필요 없이 한곳에서 다양한 실시간 웹을 반영할 수 있는, 통합검색 기술이다. 구글이 실시간 검색을 위해 개발한 ‘언어 모델’은 트위터 콘텐츠의 진실한 정도를 식별할 수 있다. 사람이 작성한 메시지인지, 기계가 자동으로 만들어낸 콘텐츠인지 등을 구별해 낼 수 있다. 검색량의 변동도 인지해 사람들의 요청이 많은 내용을 주요하게 보여주는 등 적합성을 판별할 수 있다.”

-사회관계망 서비스엔 정보가치가 없는 개인적 내용도 많은데?

“트위터의 경우 사용자의 권위와 진실성을 판별하기 위해 여러 가지를 살펴본다. 동의와 반복(리트위트)이 많은지, 신뢰도 높은 친구가 많은지, 유용한 정보를 올리는 사람인지 등의 복합적 요건을 분석해 식별해낸다.”


-실시간 정보를 제공하다 보면 헛소문이 구글을 통해 확산될 수 있는데?

“실시간 검색은 품질 높은 정보체계다. 활동하는 이들을 봐도 그렇다. 여기서 얻는 정보는 헛소문이 아닌 매우 유용한 정보일 가능성이 높다. 글쓴이 평판에 따라 구글 검색결과에 보이게 된다. 신문에도 오보나 헛소문이 보도된다. 모든 게 흑백으로 나뉠 수 없고, 루머는 사실이 드러나면서 사라진다. 구글의 언어인식 기술도 기자들과 같은 실수를 할 수 있다. 구글 검색결과에 나타나는 소문들은 실제 기자들도 관심을 가지는 정도에 따라 반영되도록 돼 있다.”

-트위터나 페이스북의 모든 콘텐츠에 대해 구글이 검색을 하는가?

“이들 사이트의 모든 콘텐츠를 검색으로 가져오는 게 아니고, 사용자가 ‘전체 공개’로 설정한 것만 가져온다. 페이스북이나 트위터에서 사용자가 친구와 일대일로 주고받은 메시지는 검색결과에 가져오지 않고, 전체에 공개한 콘텐츠만 반영한다.”

-트위터의 경우 공개된 콘텐츠에도 개인적 정보가 많다. 이를 웹의 다른 정보랑 엮어서 검색하면 특정인을 식별해낼 수 있는 프로파일링이 가능할 텐데, 대책은?

“우린 프라이버시를 매우 중요하게 생각한다. 개인정보 식별은 염려하지 않아도 된다. 구글은 정보를 장기간 보관하지 않으며, 엄격한 정책을 갖고 있다. 트위터 글을 보관하느냐 하는 것은 트위터의 정책과 사용자의 의견에 따라 결정될 것이다.”

-이미지를 사진 찍어서 올리면 검색할 수 있는 구글 고글스라는 비주얼 검색은 사용자들이 개인적 공간이나 특정인을 찍어서 검색할 경우 사생활을 침해할 수 있는데?

“구글 고글스를 구축하면서 프라이버시 문제에 대해 매우 조심스러웠다. 구글은 이미 얼굴인식 기술을 보유하고 있지만 사생활 보호를 더 잘 이해하고 사용자들에게 전권을 줄 수 있을 때까지는 제공하지 않을 계획이다.”

구본권 기자 starry9@hani.co.kr, 사진 구글 제공


광고

브랜드 링크

멀티미디어


광고



광고

광고

광고

광고

광고

광고

광고


한겨레 소개 및 약관