МЕТОДЫ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА В СТАТИСТИЧЕСКОМ МАШИННОМ ПЕРЕВОДЕ
METHODS OF NATURAL LANGUAGE PROCESSING IN STATISTICAL MACHINE TRANSLATION
Авторы: Денисова Дарья Сергеевна
Степень (должность): Магистрант
Место учебы/работы: Балтийский федеральный университет имени Иммануила Канта
Аннотация на русском языке: Статья посвящена статистическогому машинному переводу, а именно вопросу качества выходного текста и возможным способам решения данной проблемы. Целью исследования является изучение технологий лингвистического анализа при переводе статистическим методом. В данной статье проанализированы основные принципы работы таких технологий как регулярные выражения, вычисление минимального расстояния при редактировании, н-граммы и анализ эмоциональной окраски текста. C помощью технологий лингвистического анализа может осуществляться качественный пред-переводческий анализ, а также анализ качества перевода для статистического машинного перевода, что, несомненно, лежит в основе качественного перевода.

The summary in English:
The article is devoted to statistical machine translation, namely the questionable quality of the target text and possible solutions to this issue. The aim of the research is to study the technologies of linguistic analysis implemented in statistical machine translation. The basic principles of such technologies- as regular expressions, minimum edit distance, N-grams and sentiment analysis of the text have been analyzed in the article. With the help of technologies of linguistic analysis pre-translational analysis of high quality can be performed, as well as analysis of the quality of translation for statistical machine translation, which is undoubtedly the basis of a quality translation.

Ключевые слова: статистический машинный перевод, обработка естественного языка, регулярные выражения, вычисление минимального расстояния при редактировании, анализ эмоциональной окраски текста.
Key words: statistical machine translation, natural language processing, regular expressions, minimum edit distance, sentiment analysis.
Выходные данные: Денисова Д.С. Методы обработки естественного языка в статистическом машинном переводе // Синергия наук. 2018. № 19. − С. 1393-1400. − URL: http://synergy-journal.ru/archive/article1735

Следующей может быть Ваша статья!

Контактная информация
E-mail: info@synergy-journal.ru
Группа Вконтакте: vk.com/synergy_journal

© 2016 Электронный журнал "Синергия Наук".
Любое использование размещённых на сайте журнала статей и материалов возможно только с обязательной ссылкой на сайт журнала
«synergy-journal.ru» и автора статьи.
Made on
Tilda