루씬보다 향상된 기능에 유니코드가 지원되었으면하는 바램이.....^^ http://www.zdnet.co.kr/news/internet/search/0,39031339,39156009,00.htm ----------------------------------------- 「구글의 시장 독점을 반대 한다」 위키피디아의 창설자가 오픈소스로 도전 Nakai michiko ( CNET Japan ) 2007/03/12 |
|
전 세계의 사람들의 지식을 모아 만들어내는 백과사전 「위키피디아」(Wikipedia)는 세계적으로 성공한 사용자 참가형 콘텐츠 중 하나라고 해도 좋을 것이다. 위키피디아의 창설자인 지미 웨일즈(Jimmy Wales)는 현재, 새로운 프로젝트로 검색엔진의 개발에 나섰다. 오픈소스로 이루어져, 전 세계의 개발자들의 협력을 얻어 만들어질 예정인 이 검색엔진 「서치 위키아」(Search Wikia)는 구글에 대항할 수 있을 것인지, 앞으로의 계획과 서비스가 시작 될 시기, 일본에서의 운영 방식 등에 대해 웨일즈와 이야기를 나눴다. 서치 위키아의 특징은? 소프트웨어의 복제나 수정, 재배포가 가능한 프리 라이선스로 제공한다. 또한 검색의 알고리즘이나 랭킹의 논리에 대해서도 공개해 나갈 예정이다. 검색은 이미 인터넷의 인프라가 되어있기 때문에 다른 인터넷의 기능과 같이 오픈소스로 투명성을 지닌 무상 라이선스에 의해 제공되어야 한다고 생각한다. 왜 지금 시기에 검색엔진의 개발에 착수했는가? 「넛치」(Nutch)나 「루신」(Lucene)의 개발에 최근 2년을 투자했고 이제야 겨우 모양새를 잡아간다고 느꼈기 때문이다. 이러한 기술을 더욱 발전시키려면 서버와 같은 하드웨어나 자금적인 측면에서 투자를 필요로 하고 있기 때문에 지금이 위키아로서 검색엔진의 개발에 착수하는 최적시기라고 판단했기 때문이다. 구글이나 야후는 방대한 양의 데이터를 처리할 수 있는 서버 센터를 소유하고 있어 뛰어난 서비스를 제공할 수 있다. 이것은 지금 위키아가 사업으로서 다루고 있는 데이터 호스팅과는 규모가 다르다고 생각되는데 이러한 검색엔진을 위한 시스템을 구축하고 운영하는 자금은 어떻게 확보할 예정인가? 다행스럽게도, 위키피디아의 성공으로 인해 많은 투자자들이 우리의 프로젝트에 관심을 가지고 있다. 이 때문에 충분한 자금이 조달된 상태이며 필요할 경우, 더 많은 자금을 모을 수 있다. 초기 단계에서 성과를 얻을 경우 더욱 많은 새로운 자금을 조달할 수 있을 것이다. 서버 자원에 관한 염려는 없는가? 해결해야 할 여러 가지 과제들이 있다고 생각한다. 서버의 수만으로 말하자면, 우리가 경쟁에서 유리한 위치에 있다고 장담할 수 없다. 단지, 어떤 과제에 직면할지 모르겠지만, 해결할 수 있다고 믿고 있다. 검색의 알고리즘을 공개해 버리면, 검색 엔진 스패머로 불리는 사람들이 자신의 사이트를 의도적으로 검색결과의 상위에 표시하려고 하는 일이 벌어지지 않을까? 컴퓨터 보안 전문가와 이야기를 하면 접근방식을 애매하게 만들어 보안을 확보한다는 것은 결코 좋은 방식이라 할 수 없다고 말한다. 지금의 검색엔진은 알고리즘이 약하기 때문에 공개되지 않고 있을 수도 있다. 공공의 감시를 통해 보안이 이루어지는 것이 개선에 도움이 된다고 생각한다. 스패머가 나타나도 커뮤니티가 바로 블랙리스트의 작성을 하는 등의 조치가 이루어질 것이다. 문제가 나타나겠지만, 빠른 대응이 가능하다고 생각된다. 고액의 자금을 모으고 있는 중인데, 투자자들에게 최종적으로 어떠한 메리트를 제공하는가? 주식 공개도 예정에 포함된 상태인가? 아직 주식공개의 계획은 없다. 프로젝트가 성공하면 큰 비즈니스가 될 가능성이 있다. 잘 되지 않을 경우, 투자자는 손해를 보게 되지만 투자를 하는 사람이라면 그 정도는 알고 있다. 위키피디아의 운영비용을 마련하는데 고생하고 있다는 이야기를 들었다. 이번 서치 위키아의 개발을 통해 위키피디아의 운영비용을 조달하려는 목적이 있나? 앞으로 있을 오해에 대해 미리 설명하지만, 위키피디아를 운영하는 「위키미디어 재단」(Wikimedia Foundation)은 비영리 단체이다. 이것에 대해 위키아는 위키의 호스팅 등을 다루는 영리 조직으로 위키미디어 재단과는 관계가 없는 다른 조직이다. 위키아는 위키미디어에 대해 기부를 하는 방식으로 활동 지원을 하고 있다. 위키미디어는 전 세계로부터 기부를 통해 활동자금을 조달하고 있기 때문에 자금적인 측면에서 어려운 것은 사실이다. 하지만 그렇다고 해서 위키피디아의 운영을 할 수 없을 정도의 문제에 직면한 것은 아니다. 서치 위키아의 개발은 위키피디아의 운영 문제와 전혀 관계가 없다. 다만, 검색엔진이 성공하면 위키미디어에 있어 큰 도움이 될 것이다. 검색엔진을 개발하려면 고액의 선행 투자를 필요로 한다. 대규모 서버 네트워크를 이용해 많은 우수한 기술자들을 고용할 필요가 있기 때문이다. 위키피디아와 같이 자선사업으로 운영하는 것은 어려울 것이다. 서비스의 시작 시기는? 구체적인 목표는 정하지 않았지만 2007년 중에 기본 버전을 릴리스 하고 싶다. 이것은 위키피디아가 최초 1개의 페이지로 시작한 것과 같은 것으로 그리 놀라울만한 일이 아닐 것이다. 다른 업체들의 대규모 검색엔진에 필적하는 크기가 되려면 최소 1, 2년은 걸릴 것이다. 장래에 구글이나 야후를 능가하는 검색엔진이 된다고 생각하고 있나? 현재의 검색 비즈니스의 수익은 매우 높다. 우리로서는 시장의 5%만이라도 확보할 수 있으면 기쁠 것이다. 이 경쟁 속에서 오픈소스로 5%의 시장점유율을 달성하면 훌륭하다고 생각한다. 일본시장에서의 운영계획은? 일본은 매우 독특한 시장이다. 인터넷 접속률이 높으며 경제적으로 볼 때 역시 중요한 시장이다. 다만 유럽과는 다른 언어를 사용하는 것으로 인해 영어를 불어나 독일어로 번역할 때와는 다른 문제가 발생하게 된다. 동의어, 복수형 등에서 풀어야 할 과제가 있다. 경쟁사들과 비교했을 때 서치 위키아의 강점은 무엇인가? 질 높은 검색 결과는 이미 흔하다. 그래서 우리의 강점은 「투명성」에 있다고 생각한다. 이러한 브랜드 이미지를 통해 보다 많은 트래픽을 모을 것이다. 수익은 어떤 방식으로 거둘 것인지 예상하고 있나? 광고 모델을 생각하고 있다. 이 점에서 구글은 좋은 활동을 하고 있고 광고의 투명성 역시 잘 나타났다고 할 수 있다. 개발 체제는? 리눅스나 아파치의 모델을 채용할 것이다. 아파치의 경우는 많은 기업이 엔지니어링 자원을 제공하고 있다. 아파치를 지원하는 것이 비즈니스에 있어 메리트가 있다. 즉 MS가 웹 서버 업계를 지배하는 상황보다 바람직한 상황을 이끌어 내고 싶은 동기에 근거한 생각이다. 검색엔진에 대해서도 같은 것을 말할 수 있다. 많은 기업이 구글이나 야후가 큰 힘을 가지는 것에 대해 우려를 표하는 동시에 우리의 활동에 지원을 하고 있다. 또한, 위키아에는 현재 약 20명의 개발자가 있어 미국과 폴란드에 개발 거점을 두고 있다. 오픈소스의 프로젝트에 관한 경험이나 자원봉사의 커뮤니티 경험이 있는 엔지니어를 채용하고 있다. 오픈소스에 공헌하는 동기나 문화를 이해하고 있는 사람들 쪽이 보가 좋은 소프트웨어를 많은 사람들의 도움을 빌려 만들 수 있다. 쉽게 말하자면, 커뮤니티 관리의 능력을 가진 개발자라고 생각한다. 어떤 기업이 서치 위키아를 지원할 예정인가? 검색 관련 기업은 많이 존재한다. 이러한 회사는 될 수 있으면 독자 기술로 승부하려고 하지만 대기업에는 승부가 되지 않는다고 인식되고 있다. 지금의 경쟁 환경을 바꿔 오픈소스 검색엔진이라는 선택사항을 제공해 함께 대기업과 경쟁하려고 생각하고 있다. 검색엔진에 의존하는 부분이 큰가? 이 부분에서 오픈소스의 장점이 드러난다. 위키피디아는 250개의 언어로 제공되고 있다. 오픈소스의 세계에서는 도움이 되는 모듈의 개발로서 다언어에의 대응이 열심히 이루어지고 있다. 리눅스 역시 타 OS보다 많은 언어를 지원한다. 유럽이나 일본에서도 정부가 검색엔진을 개발하는 움직임이 있다. 특정 정부와 협력할 의향이 있나? 정부의 소프트웨어 개발 속도는 너무 느리다. 우리는 조금 더 신속히 움직이는 것을 목표로 하고 있다. 멀티미디어 검색 등 새로운 검색 기술로의 접근을 어떻게 생각하나? 과거 2, 3년간 검색의 질이라고 하는 분야에서 전성기를 맞았다고 느끼고 있다. 구글의 등정 이전에는 검색결과의 질이 그리 좋지 않았지만, 구글이 등장하고 난 후에 모든 게 바뀌었다. 그러나 최근 2, 3년 동안 이 분야에서 큰 변화는 일어나지 않았다. 오픈소스로부터 어떠한 변화가 일어날지에 대해서는 아직 아무도 모른다. 하지만 우리가 서버나 머신을 제공하는 것으로 시작해 무엇인가 새로운 변화가 일어나는 것을 기대하고 있다. @ |
'스크랩 > 전산/전자' 카테고리의 다른 글
컴퓨터 하드웨어 체크 프로그램 (0) | 2007.03.25 |
---|---|
싸이월드 게시판 글 긁어오기.... (4) | 2007.03.21 |
구글의 경쟁력은 '통근버스'? (0) | 2007.03.11 |
well-known port list (0) | 2007.03.04 |