반응형

Khaiii를 파이썬에서 사용하기 위해서는 필수적인 함수가 3가지가 있다.

 

먼저 형태소별로 분류해주는 함수다.

def khaiii_morphs(string):
    api = KhaiiiApi()
    result = []
    analyzed = api.analyze(string)
    for word in analyzed:
        for morph in word.morphs:
            result.append(morph.lex)
    return result

 

품사를 포함시켜 보여주는 함수다
def khaiii_pos(string):
    api = KhaiiiApi()
    result = []
    analyzed = api.analyze(string)
    for word in analyzed:
        for morph in word.morphs:
            result.append((morph.tag, morph.lex))
    return result

 

명사만 모아서 보여주는 함수다.
def khaiii_nouns(string):
    api = KhaiiiApi()
    result = []
    for word in api.analyze(string):
        for i in word.morphs:
            if i.tag in ['NNG','NNP','NNB','NR','NP']:
                result.append(i.lex)
    return result

 

이 세가지는 꼭 필요하다. 

반응형

+ Recent posts