Аннотация на русском языке: Статья посвящена современным системам машинного перевода, в частности, статистическому машинному переводу. В статье приведены основные характеристики, а также сильные стороны каждой из технологий машинного перевода. Статья также освящает основной принцип работы систем статистического машинного перевода: выравнивание, создание моделей языка и перевода, перевод как таковой. В основе данного алгоритма лежит теорема Байеса. Изучение систем статистического машинного перевода представляется нам наиболее перспективным, поскольку для перевода не требуется создание правил семантического разбора, а также не являются необходимыми знания особенностей человеческих языков.
The summary in English: The article is devoted to modern machine translation systems: in particular, statistical machine translation. The article describes the main characteristics, as well as the strong points of each of the machine translation technologies. The article also reveals the basic sequences of statistical machine translation systems: alignment, the creation of language and translation models, and the translation itself. This algorithm is based on the Bayes' theorem. Statistical machine translation seems the most promising, since the translation does not require the creation of rules for semantic analysis, and the knowledge of human languages features are not essential.
Ключевые слова:
машинный перевод на базе готовых примеров переводов, машинный перевод на базе лингвистических правил, статистический машинный перевод, выравнивание, теорема Байеса, модель перевода, модель языка.
Key words:
Example-based MT, Rule-based MT, Statistical MT, alignment, Bayes' theorem, translation model, language model.