Module kiwipiepy.const
const 모듈은 kiwipiepy에서 사용되는 주요 상수값들을 모아놓은 모듈입니다.
Expand source code
'''
const 모듈은 kiwipiepy에서 사용되는 주요 상수값들을 모아놓은 모듈입니다.
'''
from enum import IntFlag
class Match(IntFlag):
"""
.. versionadded:: 0.8.0
분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다.
bitwise OR 연산으로 여러 개 선택하여 사용가능합니다.
"""
URL = 1 << 0
""" 인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다. """
EMAIL = 1 << 1
""" 이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다. """
HASHTAG = 1 << 2
""" 해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다. """
MENTION = 1 << 3
"""
멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다.
.. versionadded:: 0.8.2
"""
SERIAL = 1 << 4
"""
일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다.
.. versionadded:: 0.14.0
"""
EMOJI = 1 << 5
"""
이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다.
.. versionadded:: 0.18.0
"""
ALL = URL | EMAIL | HASHTAG | MENTION | SERIAL | EMOJI
""" URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다. """
NORMALIZING_CODA = 1 << 16
""" '먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다. """
JOIN_NOUN_PREFIX = 1 << 17
"""
명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG
.. versionadded:: 0.11.0
"""
JOIN_NOUN_SUFFIX = 1 << 18
"""
명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG
.. versionadded:: 0.11.0
"""
JOIN_VERB_SUFFIX = 1 << 19
"""
동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF
.. versionadded:: 0.11.0
"""
JOIN_ADJ_SUFFIX = 1 << 20
"""
형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF
.. versionadded:: 0.11.0
"""
JOIN_ADV_SUFFIX = 1 << 21
"""
부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG
.. versionadded:: 0.15.0
"""
SPLIT_COMPLEX = 1 << 22
"""
더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN
.. versionadded:: 0.15.0
"""
Z_CODA = 1 << 23
"""
조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA
.. versionadded:: 0.15.0
"""
COMPATIBLE_JAMO = 1 << 24
"""
형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다.
.. versionadded:: 0.18.1
"""
SPLIT_SAISIOT = 1 << 25
"""
사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG
.. versionadded:: 0.20.0
"""
MERGE_SAISIOT = 1 << 26
"""
사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG
.. versionadded:: 0.20.0
"""
JOIN_V_SUFFIX = JOIN_VERB_SUFFIX | JOIN_ADJ_SUFFIX
"""
동사/형용사형 파생접미사를 분리하지 않고 결합합니다.
.. versionadded:: 0.11.0
"""
JOIN_AFFIX = JOIN_NOUN_PREFIX | JOIN_NOUN_SUFFIX | JOIN_V_SUFFIX | JOIN_ADV_SUFFIX
"""
모든 접두사/접미사를 분리하지 않고 결합합니다.
.. versionadded:: 0.11.0
"""
class Dialect(IntFlag):
"""
.. versionadded:: 0.22.0
방언 정보를 나타내는 열거형입니다.
"""
STANDARD = 0
""" 표준어 """
표준 = STANDARD
GYEONGGI = 1 << 0
""" 경기 방언 """
경기 = GYEONGGI
CHUNGCHEONG = 1 << 1
""" 충청 방언 """
충청 = CHUNGCHEONG
GANGWON = 1 << 2
""" 강원 방언 """
강원 = GANGWON
GYEONGSANG = 1 << 3
""" 경상 방언 """
경상 = GYEONGSANG
JEOLLA = 1 << 4
""" 전라 방언 """
전라 = JEOLLA
JEJU = 1 << 5
""" 제주 방언 """
제주 = JEJU
HWANGHAE = 1 << 6
""" 황해 방언 """
황해 = HWANGHAE
HAMGYEONG = 1 << 7
""" 함경 방언 """
함경 = HAMGYEONG
PYEONGAN = 1 << 8
""" 평안 방언 """
평안 = PYEONGAN
ARCHAIC = 1 << 9
""" 옛말 """
옛말 = ARCHAIC
ALL = (GYEONGGI | CHUNGCHEONG | GANGWON | GYEONGSANG | JEOLLA | JEJU | HWANGHAE | HAMGYEONG | PYEONGAN | ARCHAIC)
""" 모든 방언 """
Classes
class Dialect (*args, **kwds)-
Added in version: 0.22.0
방언 정보를 나타내는 열거형입니다.
Expand source code
class Dialect(IntFlag): """ .. versionadded:: 0.22.0 방언 정보를 나타내는 열거형입니다. """ STANDARD = 0 """ 표준어 """ 표준 = STANDARD GYEONGGI = 1 << 0 """ 경기 방언 """ 경기 = GYEONGGI CHUNGCHEONG = 1 << 1 """ 충청 방언 """ 충청 = CHUNGCHEONG GANGWON = 1 << 2 """ 강원 방언 """ 강원 = GANGWON GYEONGSANG = 1 << 3 """ 경상 방언 """ 경상 = GYEONGSANG JEOLLA = 1 << 4 """ 전라 방언 """ 전라 = JEOLLA JEJU = 1 << 5 """ 제주 방언 """ 제주 = JEJU HWANGHAE = 1 << 6 """ 황해 방언 """ 황해 = HWANGHAE HAMGYEONG = 1 << 7 """ 함경 방언 """ 함경 = HAMGYEONG PYEONGAN = 1 << 8 """ 평안 방언 """ 평안 = PYEONGAN ARCHAIC = 1 << 9 """ 옛말 """ 옛말 = ARCHAIC ALL = (GYEONGGI | CHUNGCHEONG | GANGWON | GYEONGSANG | JEOLLA | JEJU | HWANGHAE | HAMGYEONG | PYEONGAN | ARCHAIC) """ 모든 방언 """Ancestors
- enum.IntFlag
- builtins.int
- enum.ReprEnum
- enum.Flag
- enum.Enum
Class variables
var ALL-
모든 방언
var ARCHAIC-
옛말
var CHUNGCHEONG-
충청 방언
var GANGWON-
강원 방언
var GYEONGGI-
경기 방언
var GYEONGSANG-
경상 방언
var HAMGYEONG-
함경 방언
var HWANGHAE-
황해 방언
var JEJU-
제주 방언
var JEOLLA-
전라 방언
var PYEONGAN-
평안 방언
var STANDARD-
표준어
var 강원var 경기var 경상var 옛말var 전라var 제주var 충청var 평안var 표준var 함경var 황해
class Match (*args, **kwds)-
Added in version: 0.8.0
분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다. bitwise OR 연산으로 여러 개 선택하여 사용가능합니다.
Expand source code
class Match(IntFlag): """ .. versionadded:: 0.8.0 분석 시 특수한 문자열 패턴 중 어떤 것들을 추출할 지 선택할 수 있습니다. bitwise OR 연산으로 여러 개 선택하여 사용가능합니다. """ URL = 1 << 0 """ 인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다. """ EMAIL = 1 << 1 """ 이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다. """ HASHTAG = 1 << 2 """ 해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다. """ MENTION = 1 << 3 """ 멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다. .. versionadded:: 0.8.2 """ SERIAL = 1 << 4 """ 일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다. .. versionadded:: 0.14.0 """ EMOJI = 1 << 5 """ 이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다. .. versionadded:: 0.18.0 """ ALL = URL | EMAIL | HASHTAG | MENTION | SERIAL | EMOJI """ URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다. """ NORMALIZING_CODA = 1 << 16 """ '먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다. """ JOIN_NOUN_PREFIX = 1 << 17 """ 명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG .. versionadded:: 0.11.0 """ JOIN_NOUN_SUFFIX = 1 << 18 """ 명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG .. versionadded:: 0.11.0 """ JOIN_VERB_SUFFIX = 1 << 19 """ 동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF .. versionadded:: 0.11.0 """ JOIN_ADJ_SUFFIX = 1 << 20 """ 형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF .. versionadded:: 0.11.0 """ JOIN_ADV_SUFFIX = 1 << 21 """ 부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG .. versionadded:: 0.15.0 """ SPLIT_COMPLEX = 1 << 22 """ 더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN .. versionadded:: 0.15.0 """ Z_CODA = 1 << 23 """ 조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA .. versionadded:: 0.15.0 """ COMPATIBLE_JAMO = 1 << 24 """ 형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다. .. versionadded:: 0.18.1 """ SPLIT_SAISIOT = 1 << 25 """ 사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG .. versionadded:: 0.20.0 """ MERGE_SAISIOT = 1 << 26 """ 사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG .. versionadded:: 0.20.0 """ JOIN_V_SUFFIX = JOIN_VERB_SUFFIX | JOIN_ADJ_SUFFIX """ 동사/형용사형 파생접미사를 분리하지 않고 결합합니다. .. versionadded:: 0.11.0 """ JOIN_AFFIX = JOIN_NOUN_PREFIX | JOIN_NOUN_SUFFIX | JOIN_V_SUFFIX | JOIN_ADV_SUFFIX """ 모든 접두사/접미사를 분리하지 않고 결합합니다. .. versionadded:: 0.11.0 """Ancestors
- enum.IntFlag
- builtins.int
- enum.ReprEnum
- enum.Flag
- enum.Enum
Class variables
var ALL-
URL, EMAIL, HASHTAG, MENTION, SERIAL, EMOJI을 모두 사용합니다.
var COMPATIBLE_JAMO-
형태소 분석 결과 출력 시 첫가끝 자모를 호환용 자모로 변환합니다.
Added in version: 0.18.1
var EMAIL-
이메일 주소 형태의 텍스트를 W_EMAIL이라는 태그로 추출합니다.
var EMOJI-
이모지 형태의 텍스트를 W_EMOJI라는 태그로 추출합니다.
Added in version: 0.18.0
var HASHTAG-
해시태그(#해시태그) 형태의 텍스트를 W_HASHTAG라는 태그로 추출합니다.
var JOIN_ADJ_SUFFIX-
형용사 파생접미사를 분리하지 않고 결합합니다. 매콤/XR 하/XSA 다/EF -> 매콤하/VA 다/EF
Added in version: 0.11.0
var JOIN_ADV_SUFFIX-
부사 파생접미사를 분리하지 않고 결합합니다. 요란/XR 히/XSM -> 요란히/MAG
Added in version: 0.15.0
var JOIN_AFFIX-
모든 접두사/접미사를 분리하지 않고 결합합니다.
Added in version: 0.11.0
var JOIN_NOUN_PREFIX-
명사의 접두사를 분리하지 않고 결합합니다. 풋/XPN 사과/NNG -> 풋사과/NNG
Added in version: 0.11.0
var JOIN_NOUN_SUFFIX-
명사의 접미사를 분리하지 않고 결합합니다. 사과/NNG 들/XSN -> 사과들/NNG
Added in version: 0.11.0
var JOIN_VERB_SUFFIX-
동사 파생접미사를 분리하지 않고 결합합니다. 사랑/NNG 하/XSV 다/EF -> 사랑하/VV 다/EF
Added in version: 0.11.0
var JOIN_V_SUFFIX-
동사/형용사형 파생접미사를 분리하지 않고 결합합니다.
Added in version: 0.11.0
var MENTION-
멘션(@멘션) 형태의 텍스트를 W_MENTION이라는 태그로 추출합니다.
Added in version: 0.8.2
var MERGE_SAISIOT-
사이시옷이 포함된 것으로 추정되는 명사를 결합합니다. 만둣국 -> 만둣국/NNG
Added in version: 0.20.0
var NORMALIZING_CODA-
'먹었엌ㅋㅋ'처럼 받침이 덧붙어서 분석에 실패하는 경우, 받침을 분리하여 정규화합니다.
var SERIAL-
일련번호 형태의 텍스트를 W_SERIAL이라는 태그로 추출합니다.
Added in version: 0.14.0
var SPLIT_COMPLEX-
더 잘게 분할 가능한 형태소를 모두 분할합니다. 고마움/NNG -> 고맙/VA-I 음/ETN
Added in version: 0.15.0
var SPLIT_SAISIOT-
사이시옷이 포함된 합성명사를 분리합니다. 만둣국 -> 만두/NNG ᆺ/Z_SIOT 국/NNG
Added in version: 0.20.0
var URL-
인터넷 주소 형태의 텍스트를 W_URL이라는 태그로 추출합니다.
var Z_CODA-
조사/어미에 덧붙은 받침을 Z_CODA 태그로 분리합니다. 했어욗 -> 하/VV 었/EP 어요/EF ㄳ/Z_CODA
Added in version: 0.15.0