СИСТЕМЫ МАШИННОГО ПЕРЕВОДА > Научные обзоры
IT-Reviews    

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Источник:
Карасев И.В. Артюшина Е.А. Статья в формате PDF 266 KB

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.

Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.

Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.

В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.

Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.

Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:

- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);

- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;

- синтаксический анализ - разбор структуры, нахождение членов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;

- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);

- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;

- синтез выходного предложения (перевода).

Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.

Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.

Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.

Список литературы

  1. Соколова С.  Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
  2. Селегей В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.



Отзывы (через Facebook):

Оставить отзыв с помощью аккаунта FaceBook:


АВТОРИТЕТ ПРЕПОДАВАТЕЛЯ-ВРАЧА

Статья в формате PDF 94 KB...

03 08 2021 13:38:20

ТЕРМОДИНАМИЧЕСКИЕ КОНСТАНТЫ ДИССОЦИАЦИИ ПРОТОНИРОВАННЫХ ОСНОВАНИЙ

Разработана методика определения констант диссоциации протонированных трехкислотных оснований, отличающаяся новым подходом к оценке и учету концентраций всех равновесных частиц, для расчета ионной силы раствора. ...

28 07 2021 15:31:37

К ВОПРОСУ О ДОСТУПНОСТИ ЖИЛЬЯ В ГОРОДЕ ВЛАДИВОСТОКЕ

Статья в формате PDF 100 KB...

22 07 2021 16:54:42

ОСНОВЫ МЕНЕДЖМЕНТА

Статья в формате PDF 279 KB...

19 07 2021 13:17:58

ВТОРИЧНЫЕ ПЕЧЕНОЧНЫЕ ПОРФИРИИ У БОЛЬНЫХ С НАСЛЕДСТВЕННЫМ HLA-АССОЦИИРОВАННЫМ ГЕМОХРОМАТОЗОМ

Проведено исследование ведущих показателей метаболизма порфиринов и железа в сопоставлении с функциональным состоянием печени у 100 больных с гемохроматозом ( Г Х), в динамике. Дана объективная оценка их роли в своевременной и правильной постановке вторичной печеночной порфирии на ранних этапах развития патологического процесса. Порфириновый обмен при наследственном гемохроматозе ( Н Г Х) характеризуется глубоко нарушенными и нестабильными показателями, затрагивающими все этапы синтеза гема гемоглобина (Hb). У больных с Н Г Х и с сопутствующими поздней кожной порфирией ( П К П) и инфекционными вирусными гепатитами В и С, независимо от типа мутации гена HFE ( С289Y или H63D) изменения в обмене железа коррелируют с нарушенным синтезом аминолевулиновой кислоты ( А Л К) и порфобилиногена ( П Б Г). У больных диагностическую ценность в определении функционального состояния печени наряду с трансаминазами представляет исследование экскреции копропорфирина ( К П) с мочой. Выявленные изменения в порфириновом обмене при гомозиготной форме Н Г Х носят постоянный, часто необратимый характер, ухудшая прогноз заболевания. ...

30 06 2021 3:10:27

ШИГАРЕВ ВЕНИАМИН МАКСИМОВИЧ

Статья в формате PDF 68 KB...

23 06 2021 15:12:22

О МОДУЛЯРНЫХ РЕШЕТКАХ В ИЕРАРХИИ СТРАТ

Статья в формате PDF 139 KB...

20 06 2021 7:12:12

ВЛИЯНИЕ ГЕЛИОГЕОФИЗИЧЕСКИХ ФАКТОРОВ НА БИОРИТМЫ ЧЕЛОВЕКА

В настоящее время, только глухой не услышит рассуждений о влияние магнитных бурь на здоровье человека, но и он найдет массу публикаций на эту тему. И все они, за исключением чисто научных сообщений, негативно оценивают воздействие магнитной бури на организм человека. Так ли это? Земля, как планета и человек, проживающий, на ней являются, участниками вселенской карусели с парадными построениями планет, определяющими процессы на небезразличной для нас звезде под названием Солнце. Миллионы лет до нашей планеты и тысячи лет до нас доходит информация из Вселенной, которую мы не можем понять силой своего разума. Астрологи древних цивилизаций смогли определить строгую последовательность движения планет и зависимых от этого изменений на Земле. Так видимо родилось наше представление о времени, цикличность которого не могла быть не замечена. Цикличность Космических событий можно выделить как первооснову Земной жизни. И в этой жизни циклы активности Солнца занимают особое место. Хорошо известно, что в основе многих восточных религий лежит двенадцатилетний событийный цикл. Не трудно предположить, что такая периодичность могла быть определена одиннадцатилетним циклом Солнечной активности (одиннадцать лет – это усредненное значение за сотни лет измерений, при разбросе от 7 до 17 лет). С такой периодичностью связано множество процессов на Земле: извержение вулканов, наводнения, техногенные катастрофы, изменения социально-политических формаций, уровня смертности и рождаемости, динамики инфекционных заболеваний, урожайности и многие другие. Не трудно предположить, что одиннадцатилетние циклы Солнечной активности наиболее значимы для жизни человека, длительность которой ограничена 6-9 циклами. ...

17 06 2021 10:45:59

Еще:
Обзоры -1 :: Обзоры -2 :: Обзоры -3 :: Обзоры -4 :: Обзоры -5 :: Обзоры -6 :: Обзоры -7 :: Обзоры -8 :: Обзоры -9 :: Обзоры -10 :: Обзоры -11 ::

Последовательность подготовки научной работы может быть такой:

Выбор темы. Это важный этап. Во-первых, тема должна быть интересна не только вам, но и большинству слушателей, которым вы будете её докладывать, чтобы вы видели заинтересованность в их глазах, а не откровенную скуку.

Выбор целей и задач своей научной работы. То есть, нужно сузить тему. Например, тема: «Грудное вскармливание», сужение темы: «Грудное вскармливание среди студенток нашего ВУЗа». И если общая тема мало кому интересна, то суженная до рамок собственного института или университета, она становится интересной практически для всех слушателей. Целью может стать: «Содействие оптимальным условиям вскармливания грудью детей студентов нашего ВУЗа», а задачей — доказать, что специальные условия, созданные для кормящих студенток, не помешают их успеваемости, но уменьшат количество пропусков, академических отпусков и способствуют выращиванию здоровых детей — нашего будущего. Понятно, что эта тема подходит для студентов медицинских и педагогических ВУЗов, но и в других учебных учреждениях можно найти темы, интересные всем.

Разработать методы исследования и сбора информации. В случае с естественным вскармливанием, скорее всего, это будет анкетирование студенток, имеющих детей.

Систематизировать материал и подготовить презентацию.

Подготовиться к выступлению.

Выступить и получить: награду, удовольствие и опыт, чтобы в следующем году выступить ещё лучше и сорвать шквал аплодисментов, стать узнаваемым, а значит — более конкурентоспособным!