반응형

한글 형태소를 분석하는 분석기는 여러가지가 있는데 이번엔 카카오에서 만든 KHAIII를 써보겠다. 그런데 이놈도 6년전엔가 발표하고 그 이후로 업데이터를 안해서 설치부터 문제가 아주 많다.

 

우선 설치를 해보자. 설치 공식문서는 아래와 같다.

 

https://github.com/kakao/khaiii/wiki/%EB%B9%8C%EB%93%9C-%EB%B0%8F-%EC%84%A4%EC%B9%98

 

빌드 및 설치

Kakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub.

github.com

 

나는 우분투에 설치할건데 우분투 버전이 20.4이다. 그런데 KHAIII는 18버전에 맞춰져 있다. 아주 곤란하다. 심지어 위 링크에 있는 방식대로 하면 설치가 안된다. 머냐 대체

 

일단 python3, pip3는 설치돼 있다고 본다. cmake부터 설치해보자.

 

$sudo pip3 install cmake

 

안된다. 안될 수도 있다. 이럴댄 apt로 설치한다.pip3로 설치됐으면 아래 설치는 안해도 된다.

 

$sudo apt-get update

$sudo apt-get install cmake

 

이렇게도 설치가 안된다면 그냥 포기하자.

 

이번엔 khaiii를 다운 받는다.

 

$git clone https://github.com/kakao/khaiii.git

 

GitHub - kakao/khaiii: Kakao Hangul Analyzer III

Kakao Hangul Analyzer III. Contribute to kakao/khaiii development by creating an account on GitHub.

github.com

 

설마 git이 설치돼 있지 않은건 아니겠지?

 

이제 다운받은 khaiii 디렉토리로 이동한다.

 

$cd khaiii

$mkdir build

$cd build

 

build라는 폴더를 만들어서 거기로 이동한다. 그리고 cmake를 실행한다.

 

$sudo cmake ..

 

근데 이걸로는 설치가 안된다. 나는 우분투 20버전이기때문이다. 18버전은 된다고 하는데 18을 찾을 수가 없었다. 22, 24에다가 다 해봤는데 안됐다. 그래서 다른 명령어로 설치해 주어야 한다.(아래 명령어는 무려 khaiii의 공식문서에 나온다. 수정해 주겠다고 돼 있는데 몇년째 수정이 안되고 있다.)

 

$cmake -E env CXXFLAGS="-w" cmake ..

 

이렇게 하면 설치가 된다. 오래 걸린다. 다 끝나면

 

$sudo make all

 

이것도 엄청 오래 걸린다. 또 끝나면

 

$sudo make resource

 

이거를 해주거나

 

$sudo make resource_large

 

이거를 해준다. large가 조금 더 정확하게 분석한다고 한다.

 

마지막으로 

 

$sudo make install

 

이렇게 해준다.

 

이러면 khaiii설치는 끝났다 그리고 이제 파이썬에서 사용할 수 있게 해주어야한다.

 

$sudo make package_python

$cd package_python

$sudo pip3 install .

 

이렇게 해준다. 마지막에 . 이 있다는걸 빼먹지 말자.

엄청 오래 걸린다 좀 기다려 보자.

 

Successfully installed khaiii-0.4

이렇게 나오면 설치가 성공한 것이다.

 

이제 다시 아까 build 디렉토리로 이동한다. 그리고 아래 명령어를 입력한다.

 

$./bin/khaiii --rsc-dir=./share/khaiii

 

그리고

 

$ctest

 

라고 쳤을때 오류가 없으면 성공한 것이다.

 

$python3

 

라고 친 후에 

 

from khaiii import KhaiiiApi

 

이걸 입력 후 엔터를 쳤을때 아무 반응이 없다면 파이썬에서 사용할 준비가 된 것이다.

 

khaiii도 다른 파이썬 라이브러리처럼 설치가 어렵다. 하다가 실패하면 포기하자.

 

반응형

+ Recent posts