Обозначения для граммем

В pymorphy2 используются словари OpenCorpora и граммемы, принятые в OpenCorpora (с небольшими добавлениями).

Полный список граммем OpenCorpora доступен тут: http://opencorpora.org/dict.php?act=gram

Части речи

Граммема Значение Примеры
NOUN имя существительное хомяк
ADJF имя прилагательное (полное) хороший
ADJS имя прилагательное (краткое) хорош
COMP компаратив лучше, получше, выше
VERB глагол (личная форма) говорю, говорит, говорил
INFN глагол (инфинитив) говорить, сказать
PRTF причастие (полное) прочитавший, прочитанная
PRTS причастие (краткое) прочитана
GRND деепричастие прочитав, рассказывая
NUMR числительное три, пятьдесят
ADVB наречие круто
NPRO местоимение-существительное он
PRED предикатив некогда
PREP предлог в
CONJ союз и
PRCL частица бы, же, лишь
INTJ междометие ой

Часть речи можно получить через атрибут POS:

>>> p = morph.parse('идти')[0]
>>> p.tag.POS
'INFN'

Падежи

Граммема Значение Пояснение Примеры
nomn именительный Кто? Что? хомяк ест
gent родительный Кого? Чего? у нас нет хомяка
datv дательный Кому? Чему? сказать хомяку спасибо
accs винительный Кого? Что? хомяк читает книгу
ablt творительный Кем? Чем? зерно съедено хомяком
loct предложный О ком? О чём? и т.п. хомяка несут в корзинке
voct звательный Его формы используются при обращении к человеку. Саш, пойдем в кино.
gen1 первый родительный То же самое, что и родительный; указывается, когда у слова выделяется форма gen2. производство сахара; нет яда
gen2 второй родительный (частичный)   ложка сахару; стакан яду
acc2 второй винительный   записался в солдаты
loc1 первый предложный То же самое, что и предложный; указывается, когда у слова выделяется форма loc2. напомнить о долге; монолог о шкафе; писать о снеге
loc2 второй предложный (местный)   я у него в долгу; висит в шкафу; весь в снегу

Падеж выделяется у существительных, полных прилагательных, полных причастий, числительных и местоимений. Получить его можно через атрибут case:

>>> p = morph.parse('хомяку')[0]
>>> p.tag.case
'datv'

Нестандартные граммемы

В pymorphy2 используются некоторые граммемы, отсутствующие в словаре OpenCorpora:

Граммема Значение
LATN Токен состоит из латинских букв (например, “foo-bar” или “Maßstab”)
PNCT Пунктуация (например, , или !? или )
NUMB Число (например, “204”)

Пример:

>>> p = morph.parse('...')[0]
>>> p.tag
OpencorporaTag('PNCT')

Project Versions

Содержание

Предыдущий раздел

Как принять участие в разработке

Следующий раздел

Внутреннее устройство

На этой странице