Обозначения для граммем

В pymorphy2 используются словари OpenCorpora и граммемы, принятые в OpenCorpora (с небольшими изменениями).

Полный список граммем OpenCorpora доступен тут: http://opencorpora.org/dict.php?act=gram

Часть речи

Граммема Значение Примеры
NOUN имя существительное хомяк
ADJF имя прилагательное (полное) хороший
ADJS имя прилагательное (краткое) хорош
COMP компаратив лучше, получше, выше
VERB глагол (личная форма) говорю, говорит, говорил
INFN глагол (инфинитив) говорить, сказать
PRTF причастие (полное) прочитавший, прочитанная
PRTS причастие (краткое) прочитана
GRND деепричастие прочитав, рассказывая
NUMR числительное три, пятьдесят
ADVB наречие круто
NPRO местоимение-существительное он
PRED предикатив некогда
PREP предлог в
CONJ союз и
PRCL частица бы, же, лишь
INTJ междометие ой

Часть речи можно получить через атрибут POS:

>>> p = morph.parse('идти')[0]
>>> p.tag.POS
'INFN'

Падеж

Граммема Значение Пояснение Примеры
nomn именительный Кто? Что? хомяк ест
gent родительный Кого? Чего? у нас нет хомяка
datv дательный Кому? Чему? сказать хомяку спасибо
accs винительный Кого? Что? хомяк читает книгу
ablt творительный Кем? Чем? зерно съедено хомяком
loct предложный О ком? О чём? и т.п. хомяка несут в корзинке
voct звательный Его формы используются при обращении к человеку. Саш, пойдем в кино.
gen2 второй родительный (частичный)   ложка сахару (gent - производство сахара); стакан яду (gent - нет яда)
acc2 второй винительный   записался в солдаты
loc2 второй предложный (местный)   я у него в долгу (loct - напоминать о долге); висит в шкафу (loct - монолог о шкафе); весь в снегу (loct - писать о снеге)

Падеж выделяется у существительных, полных прилагательных, полных причастий, числительных и местоимений. Получить его можно через атрибут case:

>>> p = morph.parse('хомяку')[0]
>>> p.tag.case
'datv'

Примечание

В OpenCorpora (на июль 2013) есть еще падежи gen1 и loc1. Они указываются вместо gent/loct, когда у слова есть форма gen2/loc2. В pymorphy2 gen1 и loc1 заменены на gent/loct, чтоб с ними было проще работать.

Число

Граммема Значение Примеры
sing единственное число хомяк, говорит
plur множественное число хомяки, говорят
>>> p = morph.parse('люди')[0]
>>> p.tag.number
'plur'

Нестандартные граммемы

В pymorphy2 используются некоторые граммемы, отсутствующие в словаре OpenCorpora:

Граммема Значение
LATN Токен состоит из латинских букв (например, “foo-bar” или “Maßstab”)
PNCT Пунктуация (например, , или !? или )
NUMB Число (например, “204”)
ROMN Римское число (например, XI)

Пример:

>>> p = morph.parse('...')[0]
>>> p.tag
OpencorporaTag('PNCT')

Project Versions

Содержание

Предыдущий раздел

Руководство пользователя

Следующий раздел

Как принять участие в разработке

На этой странице