Module kiwipiepy.const

const 모듈은 kiwipiepy에서 사용되는 주요 상수값들을 모아놓은 모듈입니다.

Expand source code
'''
const 모듈은 kiwipiepy에서 사용되는 주요 상수값들을 모아놓은 모듈입니다.
'''
from enum import IntFlag

class Match(IntFlag):
    """
    .. versionadded:: 0.8.0

    분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다.
    bitwise OR 연산으로 여러 개 선택하여 사용가능합니다.
    """
    
    URL = 1 << 0
    """ 인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다. """
    
    EMAIL = 1 << 1
    """ 이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다. """
    
    HASHTAG = 1 << 2
    """ 해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다. """
    
    MENTION = 1 << 3
    """
    멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다.
    
    .. versionadded:: 0.8.2
    """
    
    SERIAL = 1 << 4
    """
    일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다.
    
    .. versionadded:: 0.14.0
    """
    
    EMOJI = 1 << 5
    """
    이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다.

    .. versionadded:: 0.18.0
    """
    
    ALL = URL | EMAIL | HASHTAG | MENTION | SERIAL | EMOJI
    """ URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다. """
    
    NORMALIZING_CODA = 1 << 16
    """ '먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다. """
    
    JOIN_NOUN_PREFIX = 1 << 17
    """
    명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG 

    .. versionadded:: 0.11.0
    """
    
    JOIN_NOUN_SUFFIX = 1 << 18
    """
    명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG
    
    .. versionadded:: 0.11.0
    """
    
    JOIN_VERB_SUFFIX = 1 << 19
    """
    동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF

    .. versionadded:: 0.11.0
    """
    
    JOIN_ADJ_SUFFIX = 1 << 20
    """
    형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF

    .. versionadded:: 0.11.0
    """
    
    JOIN_ADV_SUFFIX = 1 << 21
    """
    부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG

    .. versionadded:: 0.15.0
    """
    
    SPLIT_COMPLEX = 1 << 22
    """
    더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN

    .. versionadded:: 0.15.0
    """
    
    Z_CODA = 1 << 23
    """
    조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA

    .. versionadded:: 0.15.0
    """
    
    COMPATIBLE_JAMO = 1 << 24
    """
    형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다.

    .. versionadded:: 0.18.1
    """
    
    SPLIT_SAISIOT = 1 << 25
    """
    사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG
    
    .. versionadded:: 0.20.0
    """
    
    MERGE_SAISIOT = 1 << 26
    """
    사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG

    .. versionadded:: 0.20.0
    """
    
    JOIN_V_SUFFIX = JOIN_VERB_SUFFIX | JOIN_ADJ_SUFFIX
    """
    동사/형용사형 파생접미사를 분리하지 않고 결합합니다.

    .. versionadded:: 0.11.0
    """
    
    JOIN_AFFIX = JOIN_NOUN_PREFIX | JOIN_NOUN_SUFFIX | JOIN_V_SUFFIX | JOIN_ADV_SUFFIX
    """
    모든 접두사/접미사를 분리하지 않고 결합합니다.

    .. versionadded:: 0.11.0
    """

class Dialect(IntFlag):
    """
    .. versionadded:: 0.22.0

    방언 정보를 나타내는 열거형입니다.
    """
    
    STANDARD = 0
    """ 표준어 """
    표준 = STANDARD
    
    GYEONGGI = 1 << 0
    """ 경기 방언 """
    경기 = GYEONGGI

    CHUNGCHEONG = 1 << 1
    """ 충청 방언 """
    충청 = CHUNGCHEONG

    GANGWON = 1 << 2
    """ 강원 방언 """
    강원 = GANGWON

    GYEONGSANG = 1 << 3
    """ 경상 방언 """
    경상 = GYEONGSANG

    JEOLLA = 1 << 4
    """ 전라 방언 """
    전라 = JEOLLA

    JEJU = 1 << 5
    """ 제주 방언 """
    제주 = JEJU

    HWANGHAE = 1 << 6
    """ 황해 방언 """
    황해 = HWANGHAE

    HAMGYEONG = 1 << 7
    """ 함경 방언 """
    함경 = HAMGYEONG

    PYEONGAN = 1 << 8
    """ 평안 방언 """
    평안 = PYEONGAN

    ARCHAIC = 1 << 9
    """ 옛말 """
    옛말 = ARCHAIC

    ALL = (GYEONGGI | CHUNGCHEONG | GANGWON | GYEONGSANG | JEOLLA | JEJU | HWANGHAE | HAMGYEONG | PYEONGAN | ARCHAIC)
    """ 모든 방언 """

Classes

class Dialect (*args, **kwds)

Added in version: 0.22.0

방언 정보를 나타내는 열거형입니다.

Expand source code
class Dialect(IntFlag):
    """
    .. versionadded:: 0.22.0

    방언 정보를 나타내는 열거형입니다.
    """
    
    STANDARD = 0
    """ 표준어 """
    표준 = STANDARD
    
    GYEONGGI = 1 << 0
    """ 경기 방언 """
    경기 = GYEONGGI

    CHUNGCHEONG = 1 << 1
    """ 충청 방언 """
    충청 = CHUNGCHEONG

    GANGWON = 1 << 2
    """ 강원 방언 """
    강원 = GANGWON

    GYEONGSANG = 1 << 3
    """ 경상 방언 """
    경상 = GYEONGSANG

    JEOLLA = 1 << 4
    """ 전라 방언 """
    전라 = JEOLLA

    JEJU = 1 << 5
    """ 제주 방언 """
    제주 = JEJU

    HWANGHAE = 1 << 6
    """ 황해 방언 """
    황해 = HWANGHAE

    HAMGYEONG = 1 << 7
    """ 함경 방언 """
    함경 = HAMGYEONG

    PYEONGAN = 1 << 8
    """ 평안 방언 """
    평안 = PYEONGAN

    ARCHAIC = 1 << 9
    """ 옛말 """
    옛말 = ARCHAIC

    ALL = (GYEONGGI | CHUNGCHEONG | GANGWON | GYEONGSANG | JEOLLA | JEJU | HWANGHAE | HAMGYEONG | PYEONGAN | ARCHAIC)
    """ 모든 방언 """

Ancestors

  • enum.IntFlag
  • builtins.int
  • enum.ReprEnum
  • enum.Flag
  • enum.Enum

Class variables

var ALL

모든 방언

var ARCHAIC

옛말

var CHUNGCHEONG

충청 방언

var GANGWON

강원 방언

var GYEONGGI

경기 방언

var GYEONGSANG

경상 방언

var HAMGYEONG

함경 방언

var HWANGHAE

황해 방언

var JEJU

제주 방언

var JEOLLA

전라 방언

var PYEONGAN

평안 방언

var STANDARD

표준어

var 강원
var 경기
var 경상
var 옛말
var 전라
var 제주
var 충청
var 평안
var 표준
var 함경
var 황해
class Match (*args, **kwds)

Added in version: 0.8.0

분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다. bitwise OR 연산으로 여러 개 선택하여 사용가능합니다.

Expand source code
class Match(IntFlag):
    """
    .. versionadded:: 0.8.0

    분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다.
    bitwise OR 연산으로 여러 개 선택하여 사용가능합니다.
    """
    
    URL = 1 << 0
    """ 인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다. """
    
    EMAIL = 1 << 1
    """ 이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다. """
    
    HASHTAG = 1 << 2
    """ 해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다. """
    
    MENTION = 1 << 3
    """
    멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다.
    
    .. versionadded:: 0.8.2
    """
    
    SERIAL = 1 << 4
    """
    일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다.
    
    .. versionadded:: 0.14.0
    """
    
    EMOJI = 1 << 5
    """
    이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다.

    .. versionadded:: 0.18.0
    """
    
    ALL = URL | EMAIL | HASHTAG | MENTION | SERIAL | EMOJI
    """ URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다. """
    
    NORMALIZING_CODA = 1 << 16
    """ '먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다. """
    
    JOIN_NOUN_PREFIX = 1 << 17
    """
    명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG 

    .. versionadded:: 0.11.0
    """
    
    JOIN_NOUN_SUFFIX = 1 << 18
    """
    명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG
    
    .. versionadded:: 0.11.0
    """
    
    JOIN_VERB_SUFFIX = 1 << 19
    """
    동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF

    .. versionadded:: 0.11.0
    """
    
    JOIN_ADJ_SUFFIX = 1 << 20
    """
    형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF

    .. versionadded:: 0.11.0
    """
    
    JOIN_ADV_SUFFIX = 1 << 21
    """
    부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG

    .. versionadded:: 0.15.0
    """
    
    SPLIT_COMPLEX = 1 << 22
    """
    더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN

    .. versionadded:: 0.15.0
    """
    
    Z_CODA = 1 << 23
    """
    조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA

    .. versionadded:: 0.15.0
    """
    
    COMPATIBLE_JAMO = 1 << 24
    """
    형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다.

    .. versionadded:: 0.18.1
    """
    
    SPLIT_SAISIOT = 1 << 25
    """
    사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG
    
    .. versionadded:: 0.20.0
    """
    
    MERGE_SAISIOT = 1 << 26
    """
    사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG

    .. versionadded:: 0.20.0
    """
    
    JOIN_V_SUFFIX = JOIN_VERB_SUFFIX | JOIN_ADJ_SUFFIX
    """
    동사/형용사형 파생접미사를 분리하지 않고 결합합니다.

    .. versionadded:: 0.11.0
    """
    
    JOIN_AFFIX = JOIN_NOUN_PREFIX | JOIN_NOUN_SUFFIX | JOIN_V_SUFFIX | JOIN_ADV_SUFFIX
    """
    모든 접두사/접미사를 분리하지 않고 결합합니다.

    .. versionadded:: 0.11.0
    """

Ancestors

  • enum.IntFlag
  • builtins.int
  • enum.ReprEnum
  • enum.Flag
  • enum.Enum

Class variables

var ALL

URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다.

var COMPATIBLE_JAMO

형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다.

Added in version: 0.18.1

var EMAIL

이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다.

var EMOJI

이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다.

Added in version: 0.18.0

var HASHTAG

해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다.

var JOIN_ADJ_SUFFIX

형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF

Added in version: 0.11.0

var JOIN_ADV_SUFFIX

부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG

Added in version: 0.15.0

var JOIN_AFFIX

모든 접두사/접미사를 분리하지 않고 결합합니다.

Added in version: 0.11.0

var JOIN_NOUN_PREFIX

명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG

Added in version: 0.11.0

var JOIN_NOUN_SUFFIX

명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG

Added in version: 0.11.0

var JOIN_VERB_SUFFIX

동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF

Added in version: 0.11.0

var JOIN_V_SUFFIX

동사/형용사형 파생접미사를 분리하지 않고 결합합니다.

Added in version: 0.11.0

var MENTION

멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다.

Added in version: 0.8.2

var MERGE_SAISIOT

사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG

Added in version: 0.20.0

var NORMALIZING_CODA

'먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다.

var SERIAL

일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다.

Added in version: 0.14.0

var SPLIT_COMPLEX

더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN

Added in version: 0.15.0

var SPLIT_SAISIOT

사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG

Added in version: 0.20.0

var URL

인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다.

var Z_CODA

조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA

Added in version: 0.15.0