АВТОМАТИЧЕСКАЯ ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА
AUTOMATIC NATURAL LANGUAGE PROCESSING
Авторы: Денисова Дарья Сергеевна
Степень (должность): Магистрант
Место учебы/работы: Балтийский федеральный университет имени Иммануила Канта
Аннотация на русском языке: Статья посвящена вопросу автоматической обработки естественного языка. Сегодня данное направление компьютерной лингвистики широко используется в системах машинного перевода, осуществляя пред- и пост-переводческий анализ. В данной статье даны общие положения о таких технологиях обработки естественного языка как нормализация, минимальное расстояние редактирования, сегментация текста, n-граммы. Благодаря данным технологиям становится возможным проверка орфографии и редактирование ошибок, деление текста на предложения для дальнейшего перевода, выделение основы и нормализация слова. Автором описывается каждая из возможностей обработки естественного языка, также приведены примеры. Дальнейшее изучение и развитие данных технологий являются неотъемлемой частью усовершенствования систем машинного перевода.

The summary in English:
The article is devoted to the issue of automatic natural language processing. Today this area of computational linguistics is widely used in machine translation systems, carrying out pre- and post-translation analysis. In this article, general statements on such natural language processing technologies as normalization, minimum editing distance, text segmentation, n-grams are given. Thanks to these technologies, it becomes possible to check spelling and edit errors, segment the text into sentences for further translation, lemmatize and normalize a word before translating. The author describes each of the possibilities of natural language processing, and also gives examples. Further study and development of these technologies is an integral part of innovations of machine translation systems.

Ключевые слова: автоматическая обработка естественного языка, нормализация, минимальное расстояние редактирования, сегментация текста, N-граммы
Key words: automatic natural language processing, normalization, minimum edit distance, text segmentation, N-grams
Выходные данные: Денисова Д.С. Автоматическая обработка естественного языка // Синергия наук. 2018. № 19. − С. 1401-1409. − URL: http://synergy-journal.ru/archive/article1736

Следующей может быть Ваша статья!

Контактная информация
E-mail: info@synergy-journal.ru
Группа Вконтакте: vk.com/synergy_journal

© 2016 Электронный журнал "Синергия Наук".
Любое использование размещённых на сайте журнала статей и материалов возможно только с обязательной ссылкой на сайт журнала
«synergy-journal.ru» и автора статьи.
Made on
Tilda