Аннотация на русском языке: Статья посвящена алгоритму исправления словарных ошибок в системе статистического машинного перевода. Словарные ошибки – ошибки в слове, которые могут быть обнаружены только путем анализа контекста. В статье дан подробный разбор формул для вычисления вероятности того, что одно слово будет исправлено на другое, а также дан анализ работы сервиса N-gram Viewer, который позволяет анализировать окружение слова.
The summary in English: The article is devoted to the algorithm of correction real-word errors in the system of statistical machine translation. Real-word errors are errors in a word, which can be found only after the analysis of context. The article gives a detailed analysis of the formulas for calculating the probability that one word will be substituted by another, and also the analysis of the N-gram Viewer service with the help of which one can analyze the word in context.
Ключевые слова:
статистический машинный перевод, словарные ошибки, вычисление вероятности, , N-граммы, N-gram Viewer
Key words:
Statistical Machine Translation, real-word errors, probability calculation, N-grams, N-gram Viewer