Khaiii를 파이썬에서 사용하기 위해서는 필수적인 함수가 3가지가 있다.
먼저 형태소별로 분류해주는 함수다.
def khaiii_morphs(string):
api = KhaiiiApi()
result = []
analyzed = api.analyze(string)
for word in analyzed:
for morph in word.morphs:
result.append(morph.lex)
return result
품사를 포함시켜 보여주는 함수다
def khaiii_pos(string):
api = KhaiiiApi()
result = []
analyzed = api.analyze(string)
for word in analyzed:
for morph in word.morphs:
result.append((morph.tag, morph.lex))
return result
명사만 모아서 보여주는 함수다.
def khaiii_nouns(string):
api = KhaiiiApi()
result = []
for word in api.analyze(string):
for i in word.morphs:
if i.tag in ['NNG','NNP','NNB','NR','NP']:
result.append(i.lex)
return result
이 세가지는 꼭 필요하다.
'파이썬' 카테고리의 다른 글
[파이썬]한글 형태소 분석기 KHAIII를 이용한 트렌드 분석 - 새로운 단어 등록 (0) | 2024.05.07 |
---|---|
파이썬에서 엘라스틱서치 연결하여 데이터 불러오기(계정도 사용) (0) | 2024.05.02 |
[파이썬]한글 형태소 분석기 KHAIII를 이용한 트렌드 분석 - 우분투에 KHAIII 설치 (0) | 2024.04.30 |
Selenium으로 동적 페이지 크롤링시 요소값 로딩될때까지 기다리기 - implicitly_wait와 WebDriverWait (0) | 2024.03.06 |
파이썬 로그를 남겨보자 (0) | 2024.02.13 |