Аннотация на русском языке: Статья посвящена статистическогому машинному переводу, а именно вопросу качества выходного текста и возможным способам решения данной проблемы. Целью исследования является изучение технологий лингвистического анализа при переводе статистическим методом. В данной статье проанализированы основные принципы работы таких технологий как регулярные выражения, вычисление минимального расстояния при редактировании, н-граммы и анализ эмоциональной окраски текста. C помощью технологий лингвистического анализа может осуществляться качественный пред-переводческий анализ, а также анализ качества перевода для статистического машинного перевода, что, несомненно, лежит в основе качественного перевода.
The summary in English: The article is devoted to statistical machine translation, namely the questionable quality of the target text and possible solutions to this issue. The aim of the research is to study the technologies of linguistic analysis implemented in statistical machine translation. The basic principles of such technologies- as regular expressions, minimum edit distance, N-grams and sentiment analysis of the text have been analyzed in the article. With the help of technologies of linguistic analysis pre-translational analysis of high quality can be performed, as well as analysis of the quality of translation for statistical machine translation, which is undoubtedly the basis of a quality translation.
Ключевые слова:
статистический машинный перевод, обработка естественного языка, регулярные выражения, вычисление минимального расстояния при редактировании, анализ эмоциональной окраски текста.
Key words:
statistical machine translation, natural language processing, regular expressions, minimum edit distance, sentiment analysis.