본문 바로가기

검색엔진

블로그를 통해 세상의 움직임을 읽는 검색엔진 kizasi 블로그를 통해 세상의 움직임을 읽는 검색엔진 kizasi - 재미있는 발상이다. 노이즈를 걸러내고 시그널을 정제할 수 있으면 20-30대 네티즌들의 생각을 그대로 읽을 수 있을 것이다. http://www.hatena.co.kr/169 더보기
풀 텍스트 검색엔진 Lucene 2부 풀 텍스트 검색엔진 Lucene 2부 [ 조회수: 2223 ] ( 월간 마이크로 소프트웨어 9월 연재 ) 서문 지난 호에서는 lucene의 소개와 함께 기본적인 내용에 대해서 다루어 보았다. 이번 호에서는 Apache Lucene 의 코어 클래스 위주로 깊이 있게 다루고자 한다. Lucene의 핵심 요소인 Analyzer와 인덱스 튜닝 그리고 고급 검색기법 등에 대해 다루어 보고자 한다. 또한 이슈가 되고 있는 여러 문제점과 해결방안에 대해서도 같이 알아보자. 1. Analyzer 지난 회에선 Apache Lucene이 기본적으로 제공하는 4가지 built-in Analyzer에 대해 살펴 보았다. 이번 회 에서는 Analyzer에 대해 좀 더 상세히 살펴보고 Analyzer를 커스터마이징 하고 직접 작.. 더보기
풀 텍스트 검색엔진 Lucene 풀 텍스트 검색엔진 Lucene 1부 [ 조회수: 6030 ] ( 월간 마이크로 소프트웨어 8월 연재 ) Apache Lucene은 Doug Cutting에 의해 순수 JAVA로 개발된 full-text 검색 엔진이다. 아파치 자카르타의 서브 프로젝트로 개발되어 오다 현재는 아파치 최상위 프로젝트로 승격되었으며, 너치(nutch)라는 자식 프로젝트 까지 갖춘 소위 대박난 오픈 소스 프로젝트 이다. 동급(아파치 프로젝트 레벨)의 다른 프로젝트에 비해 국내 개발자들 에겐 인지도가 무척 저조한 편이라 Lucene이 적용된 레퍼런스 조차 제대로 찾아보기 힘들 지만 Apache Lucene 프로젝트는 나날이 발전 되어서 현재는 C++, C#, Python, Perl 과 같은 여러 다른 언어로도 포팅 되어 널리 이.. 더보기