IT-Reviews    

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Карасев И.В. Артюшина Е.А. Статья в формате PDF 266 KB

Системы машинного перевода (МП) используются для обработки текста, при этом выделяют 2 типа систем: электронные словари и программы-переводчики.

Электронные словари оптимизируют процесс понимания иноязычных слов. Программы-переводчики производят более или менее адекватный перевод иностранных текстов, при этом необходимо участие человека в процессе перевода. По существу, системы МП выдают не перевод, а «подстрочник», который требует дальнейшей литературной обработки, достигающей для художественного текста 100 % всего объема, причем смысл порой полностью изменяется. Для технических текстов существует проблема неоднозначности слов для разных предметных областей.

Идея МП впервые пришла в голову еще в середине 19 века англичанину Чарльзу Бэббиджу, впервые разработавшему проект цифровой аналитической машины. В 1948 году было предложено правило разбиения слова на основу и окончание, которое продолжает активно использоваться современными системами МП.

В СССР работы, связанные с МП начались в 70-е годы под руководством проф. Белоногова.
В 1996 году первая российская система МП получила патент и была зарегистрирована под названием Retrans. В 1991 г. основана российская компания ПРОМТ, которая занимается исследованиями в области прикладной лингвистики, разработки технологий и систем МП для европейских языков.

Основная сложность систем МП состоит в том, что естественные языки плохо поддаются формализации. Сегодня существует 3 подхода к процессу МП: перевод, основанный на правилах; статистический перевод; подход Translation Memory.

Для перевода по правилам используется алгоритм, напоминающий процесс мышления человека, заключающийся в последовательности действий над входным предложением:

- морфологический анализ - поиск частей речи, определение входных словоформ (рода, числа, падежа, спряжения);

- поиск идиом, фразеологизмов для данной предметной области и исключение их из дальнейшего анализа;

- синтаксический анализ - разбор структуры, нахождение членов предложения - подлежащего, сказуемого, дополнения, обстоятельства. При этом общепризнанно, что системе МП легче переводить английский текст, так как в нем порядок слов в предложении жестко фиксируется. Русский язык поддерживает свободный порядок слов в предложении, что значительно усложняет процесс его формализации;

- лексический анализ - отделение однозначных входных слов (лексем) от многозначных (имеющих несколько переводных эквивалентов);

- грамматический анализ - доопределение грамматической информации с учетом данных выходного языка;

- синтез выходного предложения (перевода).

Статистический метод МП заключается в анализе колоссального массива параллельных текстов и выборе для перевода наиболее часто совпадающие варианты. Никаких грамматических правил в программу не заложено. На основе такой технологии построен сервис от компании Google - отдельные словосочетания при статистическом переводе получаются более точными и изящными, но грамматика хромает: иногда предложения настолько несогласованны, что невозможно понять их смысл.

Технология Translation Memory использует правила перевода и сравнивает входной документ с текстами из постоянно пополняющейся базы переводов. Находя совпадения, программа предлагает ранее одобренный вариант.

Признавая существующие недостатки производители систем МП подчеркивают, что их программы не ориентированы на создание художественного текста. И заменить человека они не смогут даже в долгосрочной перспективе - пока не будет создан полноценный искусственный интеллект. Но системы МП являются хорошим подспорьем для специалистов различных профилей, нуждающихся в оперативных переводах иноязычной информации.

Список литературы

  1. Соколова С.  Как переводит компьютер. - http://www.promt.ru/company. technology /articles/article_sokolova.php.
  2. Селегей В. Электронные словари и компьютерная лексикография. - http://www.lingvoda.ru/transforum/articles/selegey_a1.asp.



Отзывы (через Facebook):

Оставить отзыв с помощью аккаунта FaceBook:

УЛЬТРАСТРУКТУРНЫЕ ОСОБЕННОСТИ СТРОЕНИЯ КЛЕТОК ЭПИТЕЛИЯ ТОНКОЙ КИШКИ У ЭКСПЕРИМЕНТАЛЬНЫХ ЖИВОТНЫХ В ЗАВИСИМОСТИ ОТ ХАРАКТЕРА ВСКАРМЛИВАНИЯ (СМЕШАННОЕ, ИСКУССТВЕННОЕ)

В статье освещаются морфофункциональные особенности структуры стенки тонкой кишки в зависимости от характера вскармливания в экспериментальных условиях. Представлены собственные результаты исследования по вопросу о электронно-микроскопическом строении слоев стенки тонкой кишки при смешанном и искусственном вскармливании в эксперименте. ...

20 02 2020 20:33:56

СЛЕПАЯ КИШКА У БЕЛОЙ КРЫСЫ

Статья в формате PDF 253 KB...

09 02 2020 20:15:52

СЕТЕВЫЕ ТЕЛЕКОММУНИКАЦИОННЫЕ ПРОЕКТЫ КАК ФОРМА РАБОТЫ С ОДАРЕННЫМИ УЧАЩИМИСЯ ПРИ ИЗУЧЕНИИ ГЕОГРАФИИ

Учебный предмет география состоит из двух блоков. Физическая география изучает элементы природы как единое целое, формирует “образ территории”. Социально-экономическая география рассматривает развитие общества и экономики в тесной взаимосвязи с природными условиями. Для формирования и поддержания интереса к географии в Ф Т Л № 1 широко используются современные информационные технологии. Компьютерное тестирование систематически используется на уроках. Лицеисты успешно участвуют в различных телекоммуникационных олимпиадах - индивидуальных и групповых конкурсах с использованием электронной почты и сети Интернет. Такие проекты развивают умение работать с различными источниками информации, способствуют межпредметной интеграции знаний и формированию целостной картины мира. ...

01 02 2020 15:42:28

Природа времени

Данная работа посвящена обоснованию несостоятельности современных путей решения вопроса о природе времени. Авторами показана абстрактность этих подходов, а также подчеркивается, что при создании научных теорий, описывающих материю, присутствует идеализация времени. Необходимо отметить, что в процессе решения данного вопроса нельзя забывать о сущности материи. До тех пор пока не будет понимания сущности материи, не будет понимания и природы времени. Поэтому авторы предлагают не создавать отдельных гипотез природы времени, а направить силы на понимание сущности материи. Для этого необходимо рассмотреть в более широком аспекте саму материю и те типичные процессы, в которые она включается. Только через решение вопроса о сущности материи можно прийти к пониманию природы времени. ...

30 01 2020 5:43:52

РОЛЬ ГОСУДАРСТВА В УСЛОВИЯХ ГЛОБАЛИЗАЦИИ

Статья в формате PDF 277 KB...

29 01 2020 12:27:52

ПУТИ ИСПОЛЬЗОВАНИЯ СЕМЯН ОБЛЕПИХИ НА ПИЩЕВЫЕ ЦЕЛИ

Статья в формате PDF 100 KB...

24 01 2020 8:20:22

АКТУАЛЬНОСТЬ ЭКОЛОГИЧЕСКОГО ОБРАЗОВАНИЯ

Статья в формате PDF 129 KB...

14 01 2020 18:30:12

Упрочнение методом наплавки легирующими металлами

Статья в формате PDF 259 KB...

11 01 2020 6:38:56

ФОРМАЛИЗАЦИЯ ВЛИЯНИЯ ВНЕШНИХ СВЯЗЕЙ НА КАЧЕСТВО ОБРАЗОВАНИЯ В ФИЛИАЛЕ ВУЗА

Построена математическая модель системы управления качеством образования филиала В У За с учетом влияния внешних информационных связей, проведена оценка критерия качества и улучшения внешних связей вследствие внедрения информационной системы. ...

30 12 2019 20:32:22

РЕШЕНИЕ IV СЕССИИ РАЕ

Статья в формате PDF 65 KB...

29 12 2019 15:13:17

ДИФРАКЦИОННО-РЕФРАКЦИОННЫЕ ИНТРАОКУЛЯРНЫЕ ЛИНЗЫ

Статья в формате PDF 111 KB...

27 12 2019 12:50:48

НАСУЩИЕ ПРОБЛЕМЫ ОБРАЗОВАНИЯ

Статья в формате PDF 127 KB...

21 12 2019 15:35:50

МАГНИТНЫЕ ПОДРЕШЕТКИ, ИНДУЦИРОВАННЫЕ КАТИОННЫМИ ВАКАНСИЯМИ (НА ПРИМЕРЕ ФЕРРИМАГНИТНОГО ПИРРОТИНА)

На основе анализа s-d обменного взаимодействия в структурах типа NiAs с частично вакантными катионными позициями, моделировались различного рода зависимости результирующей намагниченности от температуры нестехиометрических ферримагнетиков. На основе исследований пирротина методами Я Г Р и Р Ф А доказано, что двухподрешеточный ферримагнетик, содержащий в структуре катионные вакансии, должен рассматриваться, при определенном типе распределения вакансий, как ферримагнетик с четырьмя магнитными подрешетками. В данном случае, дополнительные магнитные подрешетки можно рассматривать как подрешетки, индуцированные характером распределения катионных вакансий в структуре. Квантово-механические расчеты в рамках модели молекулярного поля температурных изменений намагниченности отдельно для каждой из подрешеток, а также анализ результирующей термокривой намагниченности, объясняют ряд экспериментально полученных кривых зависимости намагниченности от температуры нестехиометрического пирротина с различной плотностью вакансий в структуре. ...

12 12 2019 17:31:29

ХЛОР КАК ТОКСИЧЕСКИЙ АГЕНТ

Статья в формате PDF 256 KB...

07 12 2019 13:32:38

ХАРАКТЕРНЫЕ ОБЛАСТИ ПОДВИЖНОЙ ПЛОСКОСТИ

Статья в формате PDF 944 KB...

02 12 2019 17:32:59

СОВРЕМЕННЫЕ ТЕНДЕНЦИИ В БАНКОВСКОМ ДЕЛЕ

Статья в формате PDF 256 KB...

01 11 2019 5:53:59

НЕКОТОРЫЕ ЗАКОНОМЕРНОСТИ ТЕОРИИ РАДИОАКТИВНОСТИ

Статья в формате PDF 83 KB...

25 10 2019 10:35:59

АКТИВНОСТЬ ФОСФОЛИПАЗЫ А2 И СОСТОЯНИЕ ПРОЦЕССОВ ПЕРЕКИСНОГО ОКИСЛЕНИЯ ЛИПИДОВ В ПЕРИФЕРИЧЕСКОЙ КРОВИ У БЕРЕМЕННЫХ С ГЕРПЕС-ВИРУСНОЙ ИНФЕКЦИЕЙ

В работе изучено состояние процессов перекисного окисления липидов и содержание фосфолипазы А2 в периферической крови беременных III триместра с обострением герпес-вирусной инфекции в зависимости от титра антител IgG к вирусу простого герпеса 1 типа. Установлено, что обострение герпес-вирусной инфекции в период гестации способствует активации процессов перекисного окисления липидов, регистрируемого по содержанию Т Б К-активных продуктов (малонового диальдегида), повышению содержания фосфолипазы А2, наиболее выраженное при титре антител IgG к В П Г-1 1:12800 и является причиной деструктивных процессов в составе липидов эритроцитов. ...

24 10 2019 11:58:35

МОДЕРНИЗАЦИЯ ГРОХОТА С ЭЛЕМЕНТАМИ ДИНАМИЧЕСКОГО СИНТЕЗА

В статье даны практические рекомендации для проектирования вибратора грохота, который по технологическим соображениям был переведён в режим работы с повышенной частотой вращения и уменьшенной амплитудой. Разработана динамическая схема грохота и предложен алгоритм решения дифференциального уравнения. Короб грохота рассматривался как одномассная система с элементами переменной жесткости опор короба, что позволило определить требуемую возмущающую силу вибратора и величину статического момента массы дебалансов при заданных кинематических параметрах. На основе полученных результатов разработана рациональная конструкция дебалансов. ...

21 10 2019 13:36:20

Некоторые вопросы занятости населения в крае

Статья в формате PDF 118 KB...

16 10 2019 9:17:31

КАЩЕНКО МИХАИЛ ПЕТРОВИЧ

Статья в формате PDF 319 KB...

15 10 2019 6:35:21

Внутривидовое разнообразие Yersinia pestis

Статья в формате PDF 131 KB...

07 10 2019 15:56:51

К ТЕОРИИ ВИНТОВОГО ПРЕОБРАЗОВАТЕЛЯ СИЛ

Статья в формате PDF 376 KB...

04 10 2019 7:20:24

ОСОБЕННОСТИ МИКРОФИЛЬМИРОВАНИЯ УГАСАЮЩИХ ДОКУМЕНТОВ

В статье рассматривается вопрос долговременного архивного хранения угасающих документов. Проанализированы сложности, возникающие при их микрофильмировании. Предложена методика предварительной компьютерной обработки сканированных изображений таких документов, обеспечивающая повышение качества их визуального восприятия до требований государственного стандарта к микрофильмируемым оригиналам. Обработанные изображения в дальнейшем могут быть выведены на фотоплёнку с использованием COM-систем (Computer Output Microfilm), либо распечатаны на бумажный носитель и микрофильмированы обычным способом. ...

30 09 2019 1:46:34

Еще:
Обзоры -1 :: Обзоры -2 :: Обзоры -3 :: Обзоры -4 :: Обзоры -5 :: Обзоры -6 :: Обзоры -7 :: Обзоры -8 :: Обзоры -9 :: Обзоры -10 :: Обзоры -11 ::

Последовательность подготовки научной работы может быть такой:

Выбор темы. Это важный этап. Во-первых, тема должна быть интересна не только вам, но и большинству слушателей, которым вы будете её докладывать, чтобы вы видели заинтересованность в их глазах, а не откровенную скуку.

Выбор целей и задач своей научной работы. То есть, нужно сузить тему. Например, тема: «Грудное вскармливание», сужение темы: «Грудное вскармливание среди студенток нашего ВУЗа». И если общая тема мало кому интересна, то суженная до рамок собственного института или университета, она становится интересной практически для всех слушателей. Целью может стать: «Содействие оптимальным условиям вскармливания грудью детей студентов нашего ВУЗа», а задачей — доказать, что специальные условия, созданные для кормящих студенток, не помешают их успеваемости, но уменьшат количество пропусков, академических отпусков и способствуют выращиванию здоровых детей — нашего будущего. Понятно, что эта тема подходит для студентов медицинских и педагогических ВУЗов, но и в других учебных учреждениях можно найти темы, интересные всем.

Разработать методы исследования и сбора информации. В случае с естественным вскармливанием, скорее всего, это будет анкетирование студенток, имеющих детей.

Систематизировать материал и подготовить презентацию.

Подготовиться к выступлению.

Выступить и получить: награду, удовольствие и опыт, чтобы в следующем году выступить ещё лучше и сорвать шквал аплодисментов, стать узнаваемым, а значит — более конкурентоспособным!