РАЗРАБОТКА АЛГОРИТМА ПО НОРМАЛИЗАЦИИ ИМЕНИ СУЩЕСТВИТЕЛЬНЫХ НА ЯЗЫКЕ PYTHON
THE DEVELOPMENT OF AN ALGORITHM TO NORMALIZE THE NOUNS IN PYTHON LANGUAGE
Авторы: Жакыпова Жанар Жакыпкызы
Степень (должность): Магистрант
Место учебы/работы: Евразийский национальный университет имени Л.Н.Гумилева
Аннотация на русском языке: В данной статье рассматривается общий жизненный процесс обработки текстовой информации, описываются этапы по приведению текста в нормальную словоформу для применения их при реализации графематического анализа в казахском языке. Представлены правила по разбору словоформ в казахском языке, алгоритм по разбору текстовой информации и в частности, имен существительных и извлечение из них основной формы словоформы. Подробно описан процесс по нормализации имен существительных через отсечение аффиксов и нахождения корня слова. Также представлены модель образования словоформ и возможные комбинации аффиксов при образовании составных слов.

The summary in English:
The article considers the general life process of processing textual information, describes the steps of processing the plain text into a normal form (normalization) to use in the morphological analysis. There are presents rules for normalization word forms in the Kazakh language, an algorithm for intellectual text analysis and particularly parsing nouns and extracting the basic form of a word. The process of normalization of nouns by cutting off affixes and finding the root of the word is described in detail. Also there are considered the model of building word forms and all possible combinations of affixes during formation of composite words.

Ключевые слова: казахский язык, стэмминг, морфологический анализ, токенизация, нормальная форма слова, аффиксы, словоформа.
Key words: Kazakh language, stemming, morphological analysis, tokenization, normalization, affixes, word form.

Следующей может быть Ваша статья!

Контактная информация
E-mail: info@synergy-journal.ru
Группа Вконтакте: vk.com/synergy_journal

© 2016 Электронный журнал "Синергия Наук".
Любое использование размещённых на сайте журнала статей и материалов возможно только с обязательной ссылкой на сайт журнала
«synergy-journal.ru» и автора статьи.
Made on
Tilda