한글 형태소를 분석하는 분석기는 여러가지가 있는데 이번엔 카카오에서 만든 KHAIII를 써보겠다. 그런데 이놈도 6년전엔가 발표하고 그 이후로 업데이터를 안해서 설치부터 문제가 아주 많다.
우선 설치를 해보자. 설치 공식문서는 아래와 같다.
https://github.com/kakao/khaiii/wiki/%EB%B9%8C%EB%93%9C-%EB%B0%8F-%EC%84%A4%EC%B9%98
나는 우분투에 설치할건데 우분투 버전이 20.4이다. 그런데 KHAIII는 18버전에 맞춰져 있다. 아주 곤란하다. 심지어 위 링크에 있는 방식대로 하면 설치가 안된다. 머냐 대체
일단 python3, pip3는 설치돼 있다고 본다. cmake부터 설치해보자.
$sudo pip3 install cmake
안된다. 안될 수도 있다. 이럴댄 apt로 설치한다.pip3로 설치됐으면 아래 설치는 안해도 된다.
$sudo apt-get update
$sudo apt-get install cmake
이렇게도 설치가 안된다면 그냥 포기하자.
이번엔 khaiii를 다운 받는다.
$git clone https://github.com/kakao/khaiii.git
설마 git이 설치돼 있지 않은건 아니겠지?
이제 다운받은 khaiii 디렉토리로 이동한다.
$cd khaiii
$mkdir build
$cd build
build라는 폴더를 만들어서 거기로 이동한다. 그리고 cmake를 실행한다.
$sudo cmake ..
근데 이걸로는 설치가 안된다. 나는 우분투 20버전이기때문이다. 18버전은 된다고 하는데 18을 찾을 수가 없었다. 22, 24에다가 다 해봤는데 안됐다. 그래서 다른 명령어로 설치해 주어야 한다.(아래 명령어는 무려 khaiii의 공식문서에 나온다. 수정해 주겠다고 돼 있는데 몇년째 수정이 안되고 있다.)
$cmake -E env CXXFLAGS="-w" cmake ..
이렇게 하면 설치가 된다. 오래 걸린다. 다 끝나면
$sudo make all
이것도 엄청 오래 걸린다. 또 끝나면
$sudo make resource
이거를 해주거나
$sudo make resource_large
이거를 해준다. large가 조금 더 정확하게 분석한다고 한다.
마지막으로
$sudo make install
이렇게 해준다.
이러면 khaiii설치는 끝났다 그리고 이제 파이썬에서 사용할 수 있게 해주어야한다.
$sudo make package_python
$cd package_python
$sudo pip3 install .
이렇게 해준다. 마지막에 . 이 있다는걸 빼먹지 말자.
엄청 오래 걸린다 좀 기다려 보자.
Successfully installed khaiii-0.4
이렇게 나오면 설치가 성공한 것이다.
이제 다시 아까 build 디렉토리로 이동한다. 그리고 아래 명령어를 입력한다.
$./bin/khaiii --rsc-dir=./share/khaiii
그리고
$ctest
라고 쳤을때 오류가 없으면 성공한 것이다.
$python3
라고 친 후에
from khaiii import KhaiiiApi
이걸 입력 후 엔터를 쳤을때 아무 반응이 없다면 파이썬에서 사용할 준비가 된 것이다.
khaiii도 다른 파이썬 라이브러리처럼 설치가 어렵다. 하다가 실패하면 포기하자.
'파이썬' 카테고리의 다른 글
파이썬에서 엘라스틱서치 연결하여 데이터 불러오기(계정도 사용) (0) | 2024.05.02 |
---|---|
[파이썬]한글 형태소 분석기 KHAIII를 이용한 트렌드 분석 - 필수 함수 (0) | 2024.05.02 |
Selenium으로 동적 페이지 크롤링시 요소값 로딩될때까지 기다리기 - implicitly_wait와 WebDriverWait (0) | 2024.03.06 |
파이썬 로그를 남겨보자 (0) | 2024.02.13 |
[파이썬]크롤링할때 프록시를 이용해 ip 차단 우회하기 2 - Selenium Chrome (0) | 2024.02.08 |