제로보드나 태터툴즈 같은 훌륭한 국내 오픈소스 S/W가 있는 것처럼, 일본에도 수준높은 오픈소스 S/W들이 제법 존재한다.
실제로 영어권 오픈소스 커뮤니티에서 주요 역할을 담당하는 일본인들도 꽤 눈에 띄며, 일본내 커뮤니티 또한 질이나 양적인 측면 모두 한국보다 훨씬 나은 실정이 아닌가 싶다.

일본 오픈소스 커뮤니티에 대해선 다음 기회에 좀더 자세히 살펴보도록 하고,
여기에선 검색에 사용할 형태소 분석기로 괜찮은 오픈소스 S/W가 없는지만 알아보자.

일본어에는 띄어쓰기가 없다는 점이나 N-gram 방식을 이용했을 때의 단점 등을 고려할 때,
공개된 형태소 분석기가 있다는 것은, 경우에 따라 큰 도움이 될 수도 있을 것이다.

대충 찾아본 바로는 아래 정도가 눈에 띈다.

ChaSen : C/C++
http://chasen.naist.jp/hiki/ChaSen/

MeCab : C/C++
http://mecab.sourceforge.net/

Sen : MeCab을 Java로 포팅
http://ultimania.org/sen/

ChaSen은 오랜기간 업데이트가 이루어지지 않은 듯 보이며, MeCab이 ChaSen보다 성능이 뛰어나다는 얘기가 있다.

top