У. С. БаймуратоваЭлектронный инструментарий переводчика. Использование информационных технологий в переводческой деятельности

У. С. БаймуратоваЭлектронный инструментарий переводчика. Использование информационных технологий в переводческой деятельности

28.07.2019

Данная работа посвящена изучению использования информационных технологий в переводческой деятельности.

На современном этапе переводческой деятельности особую значимость приобретает проблема использования инновационных технологий. К числу таковых по большей части относятся информационные и коммуникационные технологии.

За последние десять-пятнадцать лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись письменного перевода научно-технической, официальной и деловой документации. Сегодня, как правило, уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает от переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, и при этом удовлетворять принятым в данной стране стандартам. От переводчика требуется также умение эффективно использовать ранее выполненные заказы на ту же тему, а работодатель, в свою очередь, рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментов текста. Эти условия можно соблюсти лишь в том случае, если переводчик не только в совершенстве владеет родным и иностранным языком и глубоко изучил выбранную предметную область, но и уверенно ориентируется в современных компьютерных технологиях.

Таким образом, ИТ породили новую культуру передачи информации в электронном виде с одновременным значительным увеличением ее объемов. Под воздействием этого, а также с расширением международного сотрудничества существенно увеличилось количество информативных (нехудожественных) переводов в области науки, техники, экономики, юриспруденции и т.д. Изменился и сам характер процесса перевода, возникла необходимость повысить эффективность ПД за счет использования современных компьютерных технологий. Из изложенного выше можно сделать вывод о несомненной актуальности настоящей тематики.

Целью исследования является изучение возможностей оптимизации процесса перевода средствами ИКТ.

Достижение поставленной цели предполагает решение следующих конкретных задач:

1. Разработать универсальную модель цикла работы над переводом с использованием ИТ, описывающую последовательность действий, необходимых для квалифицированного выполнения и последующего сопровождения заказа на письменный перевод.

2. Проанализировать особенности использования ИТ в «переводческой деятельности»;

3. Провести анализ эффективности использования ИТ в переводческой деятельности и определить, способен ли компьютерный перевод заменить традиционный;

4. На основе полученных результатов дать прогностическую оценку перспектив развития ИТ в переводческой деятельности.

Объектом исследования являются этапы ПД, в частности непосредственно этап перевода и редактирования.

Предметом исследования выступает эффективность использования ИТ в ПД, в частности машинного перевода для осуществления перевода.

Научная новизна исследования заключается в попытке установить значимость использования ИТ в современной переводческой деятельности, определить степень влияния ИТ на качество перевода, разработать универсальную модель цикла работы над переводом с использованием ИТ.

Практическая ценность заключается в оптимизации процесса перевода средствами ИКТ и в результатах эффективности того или иного ПО в ПД, которые могут быть использованы при написании магистерской и в последующей переводческой деятельности.

Обоснованность и достоверность полученных результатов обеспечиваются согласованностью их с фундаментальными положениями дидактики и методики переводческой деятельности; логической структурой исследования; выбором методов исследования, адекватных цели и задачам работы; практической апробацией; внедрением результатов исследования в переводческую практику.

Согласно данным Европейского союза, к 2020 году 90% всех профессий в Европе будут связаны с информационными технологиями. Впрочем, уже сейчас они проникают в самые разные области науки, техники и являются составляющей частью практически любой деятельности.

Востребованность перевода в сфере информационных технологий тоже растет. Она совсем не ограничивается одним только переводом руководств для пользователя и технических описаний. Перевод в сфере информационных технологий включает в себя локализацию программного обеспечения, сайтов, мобильных приложений и компьютерных игр, проекты, связанные с внедрением Интернета вещей и многое другое.

Чем отличается перевод в сфере информационных технологий?
Прежде всего, обилием аббревиатур и сокращений.
Наличием специализированной терминологии, которая, к тому же, постоянно обновляется, ведь вся сфера ИТ стремительно растет и развивается.
Особой стилистикой, характерной только для этой отрасли.

Недавно мы сняли новый бесплатный видеоурок о переводе в сфере ИТ. Его можно посмотреть здесь:

Хотите попробовать свои силы в этом виде перевода? Хотите приобрести новые знания и навыки работы с текстами этой тематики?

Добро пожаловать на наш новый курс «Основы перевода в сфере информационных технологий»!

Для кого этот курс?
Начинающие и практикующие переводчики, желающие получить, систематизировать и/или дополнить свои знания в области ИТ-перевода.

Расписание:
Дата начала – ориентировочно июнь 2019 г .
Количество занятий – 8.
Периодичность занятий – 1 раз в неделю.
Дни и время – уточняются .

Преподаватель курса – , переводчик-фрилансер, преподаватель, независимый консультант по ИТ-переводу и локализации с 15-летним опытом работы в этой сфере.

Краткая программа курса:
1. Знакомство и введение. ИТ-терминология
2. Основы ИТ для пользователей
3. Перевод описаний программного обеспечения
4. Интернет: браузеры, Word Wide Web, протоколы передачи данных и т.д.
5. Аппаратное обеспечение: компьютеры и серверы, сетевое и телекоммуникационное оборудование, мобильные устройства
6. Антивирусное ПО, ИТ для бизнеса и перспективные направления в сфере ИТ
7. Введение в локализацию программного обеспечения
8. Перевод в сфере ИТ как бизнес, обзор отрасли, положение переводчика в отрасли.

Стоимость курса: 6000 или 8400 рублей в зависимости от выбранного .

Что входит в стоимость?
Обучение по заявленной программе с выполнением домашнего задания, полный комплект раздаточных материалов с видеозаписями всех вебинаров (высылаются всем в течение суток после лекции, независимо от присутствия на занятии), экзамен в конце курса, а также сертификат в электронном виде, высылаемый после обучения по эл. почте.

Как можно записаться на курс «Основы перевода в сфере информационных технологий»?
Чтобы записаться на курс «Основы перевода в сфере информационных технологий», нажмите на одну из кнопок «Записаться» или на и заполните заявку. Мы свяжемся с вами.

Скачать бесплатную работу можно по короткой ссылке. Ознакомится с содержимым можно ниже.

Введение 5
1. Актуальные проблемы перевода 7
1.1 Понятие перевода, подходы к переводу текста 7
1.2 Виды переводов 12
2. Методы и инструменты, используемые письменными переводчиками 23
2.1 Распространенные методы для письменного перевода 23
2.2 Инструменты используемы для письменного перевода 28
2.3 Специфика работы с иноязычным текстом – «ложные друзья 32
переводчика» 32
Заключение 39
Список использованных источников 41

Перевод на данный момент – это то самое необходимое, что востребовано фактически во всех сферах общения и взаимодействия людей: новости, политика, экономика, культура и т.д. и конечно же говоря о переводческой деятельности так же важно понимать, что подходов и видов перевода, как и текста может быть очень много.
Текст – особая система символов и знаков, созданная человеком, а, следовательно, и носящий субъективный характер. Особенно важен вопрос создания текстов под влиянием различных внешних обстоятельств, что и в наше время не является чем-то сильно неизвестным. Но подобный подход сильно осложняет работу переводчиков. Так как текст может включать различного рода сложно-переводимые слова, такие как неологизмы, жаргонизмы, сленговые формы, сокращения и прч.
На сегодняшний день единицы людей не могут сказать о себе, что они не знают второй язык, еще в школе все учили либо английский, либо немецкий, иногда французский и итальянский. По сути, получается, что общество находилось в состоянии массовой потребности в знаниях других языков – хотя по факту это не так. И многим так и ни разу в жизни не посчастливилось побывать за рубежом или применить свои знания на практике.
Зато, такая политика привела к феномену так называемого «переводческого взрыва», когда люди стали работать с оригинальными текстами для себя – просто для того, чтобы почитать, а потом что бы получить информацию из первоисточника, а далее, чтобы расширить свой кругозор. Так количество людей, которые знают 2 и более языков росло, а потребность в переводе так и сохранила свои позиции.
Таким образом, тема «Особенности письменного перевода. Информационные ресурсы в деятельности письменного переводчика» довольно актуален. В первую очередь это связано с тем, что сегодня люди живут в условиях постоянного взаимодействия с иноязычными элементами и результатом такого взаимодействия оказалось формирования различных видов перевода и методы для его осуществления.
Предмет исследования – особенности письменного перевода.
Объект – письменный перевод
Целью данного исследования является описание ресурсов используемых при письменном переводе.
Задачи:
дать определение понятию перевода и подходам к переводу текста;
описать виды переводов;
охарактеризовать отличия письменного перевода от устного;
рассмотреть распространенные методы для письменного перевода;
перечислить инструменты и ресурсы необходимые для письменного перевода.
Для подготовки работы использовались публикации, учебные материалы и Интернет-ресурсы.

Подводя итог проделанной работе, можно заключить следующее:
необходимо отметить, что подготавливаясь к переводу того или иного текста переводчик должен быть готов к встречи с рядом трудностей. В частности – с отсутствием аналогов в родном языке, так как язык может включать в свой состав не только устаревшие, но и иноязычные слова, которые могут оказать не добрую службу переводчику, так называемые «ложные друзья», которые на первый взгляд понятны, а с другой стороны имеют совсем другую основу – отличную от подразумевающейся. А, следовательно, качество перевода будет зависеть от опытности и квалифицированности переводчика. И конечно же, важно учитывать и то, что значимость перевода на сегодняшний день заключается в первую очередь в том, что почти все люди на планете сегодня нуждаются в постоянном пополнении информации, и от сюда вытекает значительная заинтересованность всех стран в развитии переводческой деятельности;
перевод – это общественное явление, которое формировалось в процессе развития самого общества и в результате, на сегодняшний день он является неотъемлемой частью жизни общества. Основных видов перевода выделяют 2 – это письменный и устный перевод. Каждый из них имеет свои ответвления и характерные только для этого вида типы работы с текстом. Но как бы там ни было, к этим видам так же можно причислить художественный вид перевода. да, с одной стороны он будет относится к письменному переводу, но так же и устный перевод может быть выполнен в художественном стиле или же над художественным произведением. Но с другой стороны, необходимо отметить, что письменный перевод имеет больше положительных сторон, что выражается в широком перечне методов и инструментов используемых письменными переводчиками;
все возможные методы и способы будут сводится к тому, чтобы сделать перевод как можно более доступным, для переводящего человека, а, следовательно, будет естественным искать аналоги в родном языке переводчика или же попытаться передать смысловую нагрузку. И как было показано на примере художественного текста, именно такой подход и является наиболее приемлемым в работе с именами собственными, так как только при аналогичных вариантах возможно точное донесение смысла до читателя. Кроме того, рассмотрев методы и подходы к переводу имен собственных можно предположить следующее: трансляция, транскрипция и калькирование не всегда спасают переводчика;
не смотря на то что, сегодня у переводчиков прослеживается способность использовать большое количество приемов, методов, принципов и инструментов, для работы с текстом, выбор так или иначе будет сохраняться именно за самим переводчиком – это его личное решение и как следствие – личный путь к совершенствованию профессионализма;
специфических особенностей перевода научных текстов с английского на русский язык довольно много, но главной сложностью и спецификой работы с иностранным научным текстом является то, что многие слова в иностранном языке либо созвучны по произношению с родным языком, либо похожи на те слова, которые все знают и в результате появляется неверный перевод, так как переводчик может решить, что это слово легко переводится и переведет его неправильно. Подобные ситуации приводят к серьезным нарушениям правил перевода, отсутствию связности текста и другим проблемам, связанным с работой над научным текстом. Избежать проблем не могут даже крупные специалисты, но минимизировать их возможно, при условии аккуратного и дословного перевода.

Переводчика

Пензенский государственный педагогический университет
имени, Пенза, Россия

В статье определяются этапы перевода как процесса и раскрываются возможности использования информационных технологий на различных этапах переводческой деятельности.

Bakanova M. V., Soldatova A. V. The role of information technologies in the professional activity of interpreter. The stages of translation as a process are determined, and the possibilities of information technologies on each stage revealed.

В настоящее время деятельность переводчика невозможно представить без использования информационных технологий. Уже на этапе поиска работы переводчик обращается на различные сайты, электронные адреса возможных заказчиков, рассылая свое резюме и т. д. Получение текста для последующего перевода, общение с заказчиком и вся дальнейшая деятельность переводчика также опосредованы информационными технологиями. Все это делает необходимым обучать студентов использованию компьютера в его будущей профессиональной деятельности. Однако, как показывает опыт обучения, простое знакомство студентов с существующими информационными технологиями не представляется эффективным. На каждом из этапов этой сложной профессиональной деятельности использование информационных технологий имеет свою специфику.

Первым этапом в деятельности переводчика является этап получения иноязычного текста и подготовки к его переводу. За основу деления на этапы предлагается разработанная модель обучения переводу в сфере профессиональной коммуникации, которая включает профессионально-ориентирующий, аналитический, синтезирующий и корректирующий этапы. На профессионально-ориентирующем этапе значимым представляется вопрос о том, в каком виде должен быть представлен текст перевода (компьютерная версия текста, его распечатка, пересылка по электронной почте и т. п.), следует ли в тексте перевода представлять графики, схемы и т. д.

Следующей задачей этого этапа, которая также предшествует собственно процессу перевода, является знакомство с предметом высказывания, уточнение тематики текста и подбор соответствующих словарей и справочной литературы . Если текст для перевода предоставлен переводчику в печатном виде, современные возможности компьютера позволяют отсканировать его и использовать систему оптического распознавания текста для его перевода в электронный вид. Только после этого переводчик приступает к следующему этапу своей деятельности – пониманию и интерпретации иноязычного текста по специальности.

Этот этап в деятельности переводчика является чрезвычайно важным, имеет ярко выраженную специфику и значительно отличается от обычного понимания текста. Предпосылкой понимания являются предметные, языковые, социокультурные знания, т. е. профессиональная компетентность переводчика. Для понимания и интерпретации научно-технического текста переводчик анализирует поступающее высказывание. Для него представляется важным понимание всей информации, содержащейся в тексте, понимание глубинного смысла, что требует максимальной активизации всех механизмов, обеспечивающих понимание высказывания. Переводчик должен владеть высшим уровнем понимания и уметь оценивать поступающее сообщение с позиции языковых, предметных и фоновых знаний получателя. На этом уровне переводчик анализирует высказывание и вырабатывает стратегию перевода с учетом всех известных факторов профессиональной ситуации и специфики переводимого научно-технического текста, то есть понимание и адекватная интерпретация научно-технического текста на иностранном языке являются основой его последующего перевода на родной язык.

Наука и техника развиваются стремительными темпами, в публикуемых текстах могут использоваться новые понятия. В данном случае, как отмечают переводчики и исследователи, значительную помощь оказывает поиск нужной информации в различных научных публикациях , энциклопедиях и т. п. Такой информационно-справочный поиск дает возможность познакомиться с используемыми в переводимом тексте понятиями, выявить ключевые понятия, определить используемую терминологию. Начинать обучение информационно-справочному поиску следует с текстов, относящихся к известным областям науки техники, по теме которых имеется много справочной литературы с устоявшейся терминологией, переходя постепенно к текстам, относящимся к новым мало разработанным областям знаний, с не устоявшимся понятийным аппаратом. Поэтому на первом этапе поиск информации проводится в справочниках и энциклопедиях, затем - в специализированных научно-технических журналах, в последних информационных публикациях в сети Интернет, и консультациям у специалистов и т. п. В дальнейшем полученная информация помогает переводчику находить эквиваленты соответствующим терминам, которые вносятся переводчиком в собственную терминологическую картотеку.

В настоящее время все больше проявляется узкая специализация переводимых текстов, поэтому профессиональные переводчики часто обращаются к специалистам той фирмы/предприятия, которые являются заказчиками перевода, для получения у них необходимых консультаций. Конечно, в своей деятельности переводчик будет использовать двуязычные словари, но для понимания и интерпретации научно-технического текста следует опираться в первую очередь на логику и контекст, и только затем на словарь .

Использование компьютера, возможность запросить необходимую информацию через Интернет позволяют значительно расширить информационно-справочный поиск в деятельности переводчика научно-технических текстов. Как показали проведенные опросы переводчиков, на этом этапе своей деятельности переводчик может:

1. Участвовать в профессиональных чатах с носителями языка.

2. Использовать электронные словари и on-line системы автоматизированного перевода.

3. Искать публикации по теме перевода.

4. Посещать форумы переводчиков, т. е. использовать возможности Интернета для профессионального общения.

5. Просматривать последние новости по теме перевода для уточнения контекста и терминологии.

Полученную информацию можно занести в электронный словарь, который ведётся переводчиком на протяжении всей его профессиональной деятельности.

Следующим этапом в деятельности переводчика является синтезирующий этап, т. е. собственно перевод понятого текста. При порождении текста отправной точкой является концепт , который предопределяет смысловое строение текста, а через него логическое строение. Логическое строение и коммуникативная целенаправленность понятого текста диктует выбор того репертуара языковых средств, который реально используется при порождении текста. Если на этапе понимания переводчик должен максимально глубоко, полно и точно понять смысловую сторону высказывания, интенцию автора текста, то на этапе порождения текста-перевода деятельность переводчика связана с выявлением различного рода соответствий между двумя языками, двумя культурами, знаниями отправителя и получателя текста. При порождении текста переводчик должен моделировать его понимание будущим получателем, а также учитывать дискурсивные и жанровые параметры построения текста в русском языке . При письменном переводе на этапе создания понятого текста на русском языке на помощь переводчику пришел компьютер, который дает возможность:

1. Подобрать синонимы слов.

2. Использовать электронные словари.

3. Использовать электронный переводчик при переводе некоторых стандартизованных жанров, как, например, патент или инструкция.

4. Создать систему примечаний переводчика к наиболее спорным или же требующим разъяснения контекста местам.

Завершающим этапом в деятельности переводчика является проверка и сдача сделанного перевода. В настоящее время все переведенные тексты должны быть представлены в электронной версии. Широкие возможности компьютерных технологий значительно облегчают правку и оформление текста перевода. Таким образом, с помощью компьютера на данном этапе возможно:

2. Применить шаблоны форматирования (в соответствии с общепринятыми в стране);

3. Получить статистику по переводимому и переведенному тексту (количество символов, слов, абзацев и т. п.);

4. Использовать графические элементы (графики, диаграммы, таблицы, рисунки и т. д.).

Таким образом, обучение студентов профессии переводчика с использованием информационных технологий нужно проводить поэтапно, учитывая специфику задач, стоящих перед переводчиком на каждом из этапов. Результатом данного процесса будет сформированность переводческой компетенции, т. е. умения извлекать информацию из текста на одном языке и передавать ее путем создания текста (устного или письменного) на другом языке и использовать иностранный язык в профессиональной деятельности и для дальнейшего самообразования.

Библиографический список

1. Алферова обучение переводу научно-технических текстов с использованием информационных технологий: автореферат дис. ... кандидата педагогических наук: 13.00.02. Рос. ун-т дружбы народов. М.: 26с.

2. «Возможные пути использования информационных технологий при подготовке переводчика в сфере профессиональной коммуникации» // Вестник РУДН, серия «Вопросы образования: языки и специальность». Москва, РУДН. - 2008г.

3. Рябова технологии в образовании: проблемы машинного перевода. ict. edu. ru›vconf/files/3518.doc

4. Баканова технологии в обучении профессиональному переводу: Теория и практика формирования профессиональной направленности программистов в обучении иностранному языку. Монография. LAP LambertAcademic Publishing Gmb&Co. Kg. 174 с.

Информационные технологии в переводческой деятельности: преимущества, возможности - страница №1/1

М. В. Умерова

ГУ–ВШЭ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ: ПРЕИМУЩЕСТВА, ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ, ПЕРСПЕКТИВЫ РАЗВИТИЯ

The paper intends to explore modern systems of machine translation. Traditionally translation programs are divided i nto two types: ruled-based and example-based. Example-based systems work on the translation memory principle which prevails in modern computer programs applied for translation.
Сегодня к сфере информационных технологий в переводческой деятельности относят электронные словари, терминологические базы данных, справочники и энциклопедии, а также специальные программы, позволяющие осуществлять компьютеризированный (или машинный) перевод. Рассмотрим основные существующие на сегодняшний день прикладные программы, обеспечивающие компьютерный перевод текстов (Computer-Aided Translation).

Традиционно системы машинного перевода делятся на две категории: основанные на правилах (rule-based) и основанные на примерах (example-based). В первых глубже проработана грамматика, они в большей степени учитывают различные правила. Системы второго типа – самообучающиеся, они строятся на динамическом порождении языковых правил для конкретных текстовых примеров. Границы между системами example-based и rule-based не достаточно четкие, т.к. в обеих используются словари и правила работы с этими словарями. На сегодняшний день наиболее распространенной системой, построенной по принципу example-based является система TRADOS, работающая главным образом на примерах, практически без использования грамматических правил. Такого рода программы называются Translation Memory (TM-tools).

ТМ-инструменты позволяют сохранять в базе данных параллельные предложения: предложение из оригинала и его перевод. В базе данных могут сохраняться и более объемные текстовые фрагменты, но автоматически фиксируются именно предложения (программа обрабатывает текстовые фрагменты от точки до точки). В первый же момент начала работы над переводом предложения программа автоматически проверяет имеющуюся базу данных на наличие такого же или аналогичного предложения и предлагает уже имеющийся перевод. Таким образом, со временем база данных расширяется, что особенно быстро происходит в переводческих центрах, где работает большое количество переводчиков, осуществляющих множество переводов. Большинство таких программ устанавливаются как на персональном компьютере, так и применяются для сетевого использования. Использование общей базы данных всеми переводчиками позволяет выработать единый переводческий стиль всего переводческого агентства. Режим редактирования позволяет исправлять ошибки и исключить их повторение в дальнейших переводах.

Программы категории ТМ предоставляют функцию терминологического обеспечения, т.е. при обнаружении слова или словосочетания, помеченного в предыдущих переводах как термин, программа обращает внимание переводчика на этот фрагмент и предлагает уже имеющийся вариант перевода. Таким образом, принцип единства терминологии может выдерживаться всеми переводчиками агентства. Сегодня существуют готовые терминологические базы, которые могут предоставляться заказчиком перевода в виде дополнительного блока для имеющейся у переводческого агентства программы. Это позволяет ускорить процесс перевода и улучшить его качество.

Система TRADOS предназначена для больших переводческих центров, где накопилось много параллельных текстов. Она позволяет не переводить дважды одно и то же предложение, а находит аналогичное предложение в базе параллельных текстов и выдает уже сделанный когда-то перевод. При больших массивах однотипных текстов такой подход весьма эффективен. Понятие массива документов важно для машинного перевода. Большинство специалистов сходится во мнении, что машинный перевод возможен только для прикладных (технических) текстов, которые могут быть заданы определенными, зачастую просто гигантскими массивами. Художественная литература, при переводе которой приходится решать проблему выбора контекстуального значения многозначного слова, переводить игру слов, контаминированную речь, метафоры, аллюзии и другие стилистические приемы, не будет переводиться компьютером адекватно, по крайней мере, в обозримом будущем.

На российском рынке машинных переводчиков немного, и лидером среди них является система PROMT. По некоторым оценкам PROMT занимает до 95% рынка машинного перевода в России, причем его позиции сильны не только у нас, но и в Европе. PROMT – коммерческая разработка, поэтому внутренние алгоритмы программы недоступны широкому кругу исследователей. С этой точки зрения программа представляет собой, в некотором роде, «черный ящик», содержимое которого невозможно подвергнуть анализу. Но, с достаточной степенью уверенности, можно утверждать, что система использует двуязычные словари, снабженные необходимой лингвистической информацией: морфологической, синтаксической, семантической. Программа умеет отделять однозначные слова от многозначных, после чего однозначные слова переводятся по спискам эквивалентов. Для перевода многозначных слов используются специальные контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на предмет наличия или отсутствия контекстных определителей значения.

Известный ученый-лингвист Ю.Н.Марчук, чьи работы уже стали классикой прикладной лингвистики, уделяет немало внимания проблеме разрешения лексической многозначности при машинном переводе, которая разрешается с помощью обнаружения в тексте определяющих перевод многозначного слова лексических, синтаксических и морфологических детерминант. На сегодняшний день существует большое количество работ, посвященных закономерностям эксплицирования лексики, синтаксиса и семантики в рамках конкретных подъязыков, обладающих собственными лексическими, структурными, синтаксическими и семантическими особенностями.

Ю.Н.Марчук объясняет низкое качество переводов, выдаваемых многими системами машинного перевода тем, что конечный переводной текст рассматривается большинством разработчиков как композиция или сумма переводов его отдельных частей (подобно общеизвестному свойству порождения крупных единиц из более мелких). Но перевод не обладает этим свойством, и из корректных переводов отдельных частей текста нельзя автоматически получить правильный перевод всего текста в целом. Решение данной проблемы Ю.Н.Марчук видит в точном учете специфических особенностей предметного поля и лингвистического состава конкретных подъязыков (т.е. областей, заведомо существенно меньших, чем вся система естественного языка). Для таких языковых общностей как подъязыки возможно определять значение отдельных языковых единиц таким образом, что их совокупность (линейная комбинация) не противоречит идее цельного текста как такового. На этой теоретической основе и возникла идея создания контекстологических словарей для определенных типов текстов в рамках определенных семантических полей и подъязыков, которые сегодня помимо контекстов употребления включают и толкование. Контекстологические словари дают возможность создавать многоязычные терминологические базы данных для широких предметных областей.

Таким образом, контекстологический подход синтезирует две главные тенденции прикладного описания лексики – словарно-центрическую и текстоцентрическую. На текстоцентрическом подходе основаны многие действующие системы машинного перевода: основой описания лексики являются вспомогательные словари-конкордансы, которые возникают в результате анализа больших текстовых массивов. Основное значение здесь имеют текстовые употребления слова, т.е. совокупность его конкретных значений в данном типе текстов. В более ранних системах машинного перевода контекстологический словарь объединялся со специальным алгоритмом, который осуществлял запросы по каждому многозначному слову на наличие контекстных детерминант. Современные языки программирования позволяют реализовывать систему словаря, не соединяя его со специальной алгоритмической процедурой. На сегодняшний день существуют и другие способы разнообразной реализации словаря в компьютерной программе.

Наиболее важным результатом использования контекстологических словарей является эффективное решение проблемы лексической многозначности, ведь уже давно доказано, что именно лексические значения слов передают основную часть семантической информации предложения и текста в рамках дискурса определенной предметной области.

На сегодняшний день разработчики системы машинного перевода PROMPT предлагают интегрированную версию, объединяющую системы PROMT XT Professional и TM TRADOS. Алгоритм совместной работы этих двух систем выглядит следующим образом: сначала система TRADOS анализирует переводимый документ и выявляет сегменты, перевод которых отсутствует в базе или процент его совпадения с базой ниже заданного. Выявленные текстовые сегменты передаются в PROMT XT Professional для дальнейшего машинного перевода. Чтобы повысить качество осуществляемого перевода, пользователю необходимо предварительно настроить систему: выделить тематику переводимого документа, что подключит к работе специализированные словари и обеспечит единство терминологии во всем документе. Переведенные компьютером текстовые сегменты пополняют базу Translation Memory с пометкой о том, что они были созданы PROMT. При дальнейшей работе с документом в системе TRADOS пользователю остается только отредактировать их и сохранить в базе Translation Memory. Результатом совместного использования систем становится не только перевод документа, но и соответствующая база Translation Memory, которую можно использовать в последующих переводах.

Сегодня учебные программы большинства языковых вузов и факультетов предусматривают лекции о существующих системах машинного перевода, но далеко не во всех вузах есть возможности для ознакомления студентов с электронными переводчиками на практике. Так с 2005 года системы перевода PROMT и TRADOS поставляются в некоторые российские вузы (РГГУ, РГПУ им. Герцена и другие). Университеты разрабатывают спецкурсы по обучению работе с компьютерными системами перевода.

Разработчики предлагают очередную обновленную версию X-Translator Revolution, которая функционирует на основе нового ядра перевода, что значительно улучшило качество переводов. Программа предусматривает возможность работы с шестью европейскими языками в различных комбинациях. Есть специальное приложение для перевода сообщений в программе ICQ. Возможности перевода специализированных текстов расширены за счет выпуска новых словарей по тематикам «Коммерция», «Наука», «Техника», общий словарный запас которых составляет более 250 тысяч слов и словосочетаний. Подключение словарей позволяет улучшить качество переводов контрактов, финансовых документов, научных статей, технической документации. В качестве достоинства продукта разработчики выделяют привычный для большинства пользователей интерфейс в стиле Microsoft Office 2003, а также возможность перевода электронной почты и веб-сайтов в режиме онлайн.

Помимо коммерческих разработок в области машинного перевода есть и так называемые академические. Наиболее авторитетной является система ЭТАП, работающая для комбинации русского и английского языков. Для России данная система имеет такое же значение, как ставшая классическим примером система Systran для всего мира. ЭТАП положила начало целому научному направлению, ставшему основным в российских академических разработках в области машинного перевода. Технологии системы ЭТАП (в отличие, например, от PROMT) описывались в открытых публикациях. Сравнивая эти две системы, кандидат технических наук А.Сокирко в своих публикациях оценивает результаты работы PROMT как большую ориентированность на смысловую ясность перевода в ущерб его грамматической правильности в силу того, что PROMT ориентирован на конечного потребителя. Создатели ЭТАПА, как считает А.Сокирко, напротив, уделяют много внимания грамматической правильности перевода, т.к. ЭТАП является академической разработкой и ориентирован именно на корректность полученного результата. Попытка синтезировать эти два подхода (смысловая ясность и грамматическая правильность) была предпринята группой «Диалинг» (www . aot . ru ), которая вела разработки по созданию программы машинного перевода. Данная программа отличается наличием в ней так называемого поверхностно-семантического модуля, в основе разработки которого лежит процедура семантического анализа, хорошо известная в языкознании. Алгоритмическая реализация семантического анализа осуществляется не через привычное для лингвистов толкование, а с помощью графов (т.н. семантических деревьев), в узлах которых стоят слова или единицы, равные словам по объему. Отношения графа задаются перечнем и называются семантическими отношениями (например, отношения субъект – объект, субъект – аспект и т.п.). А.Сокирко показывает, как для каждого предложения входного текста выстраиваются свои собственные семантические структуры, на базе которых осуществляется машинный перевод. Приведем пример графа из статьи А.Сокирко:


Подобные графы могут включать не только слова, но и устойчивые словосочетания и обороты, абстрактные связки, жесткие синтаксические группы (например, «двадцать два мальчика») и т.п. На базе таких семантических структур перевод осуществляется следующим образом: по русской семантической структуре выстраивается такая же английская, с английскими словами и словосочетаниями в узлах, затем по семантической структуре синтезируется цепочка английских слов, что представляет собой многоэтапный процесс, требующий определенных временных затрат. Поэтому одним из слабых мест данной системы является медленная скорость перевода.

Белорусские лингвисты А.Чистяков и А.Скребнев в своих работах уделяют особое внимание еще одной системе, в которой процесс автоматического перевода построен на математической логике и статистическом вычислении вероятности. Разработки в этом направлении, основы которых были заложены известным ученым Францем-Иосифом Охом, ведутся уже более 15 лет. Сегодня на рынке доступен один коммерческий продукт этого направления – программа автоматического перевода Language Weaver. В данной программе не используются никакие словари, содержащие готовые к употреблению лексические и грамматические данные. Программа использует только параллельные тексты (аналогичный принцип используется в Translation Memory Tools), причем объем текстов очень значителен. Программа анализирует оригиналы и переводы, где встречается отрезок текста, схожий с тем, который сейчас необходимо перевести. Сопоставив множество вариантов переводов, программа выбирает тот, который использовался чаще всего. Таким образом, программа фиксирует степень вероятности, с которой, скорее всего, следует переводить данный отрезок текста, постепенно эта степень вероятности приближается к стопроцентной. При этом отпадает необходимость загружать специализированные словари (преимущество статистического метода перед трансформационными программами), т.к. программа сама генерирует постоянно используемый словарь, который ориентирован на данного конкретного пользователя. Создатели программы утверждают, что на сегодняшний день их система обеспечивает более высокое качество перевода по сравнению с другими системами машинного перевода.

Текст, подготовленный для перевода в программе Language Weaver, может быть представлен в различных форматах текстовых и даже звуковых файлов. Собранные параллельные тексты распознаются, и происходит их совмещение на уровне предложения для создания параллельного текстового корпуса. Этот текстовый корпус обрабатывается с помощью подпрограммы Language Learner, которая определяет вероятность того или иного перевода и составляет вероятностный словарь, шаблон или правило, т.е параметры перевода. Созданные параметры используются статистическим переводчиком-декодером при переводе новых текстов.

На нынешнем этапе разработки программа работает не полностью самостоятельно. Конечный вариант оценивает переводчик и выбирает из предложенного программой набора то предложение, которое наиболее соответствует по своей коммуникативной эквивалентности оригиналу. В последующих переводах выбранное предложение используется программой как шаблон или образец.

Данная система наиболее ярко представляет собой образец развития искусственного интеллекта и уподобляется авторами процессу овладения естественным языком ребенком: вначале ребенок срисовывает буквы и слова, не понимая их значения, а затем переходит к осмысленному переписыванию слов и выражений. Таким образом, данная система машинного перевода работает не с языковым материалом (значениями отдельных слов и словосочетаний, синтаксическими правилами), а с прецедентными текстами, т.е. со смыслами высказываний, представляющими собой элементы межкультурной коммуникации. При такой работе с текстами происходит трансформация языковой оболочки смысла как культурного явления, а не самого слова как явления языкового.

Как считают авторы, с увеличением технической мощности компьютеров увеличатся возможности обработки параллельных текстов, и компьютер сможет более или менее самостоятельно устанавливать интертекстуальные связи. Возможно, что в классических текстах обнаружатся математические законы построения. В частности, еще в прошлом веке возникли разделы математики, описывающие произведения Моцарта и Бетховена математическими формулами. Возможно, компьютер сможет работать и с такими паралингвистическими знаковыми системами как интонации и мимика.

Если в будущем будет решена проблема автоматической проверки адекватности перевода, то компьютер станет полностью самообучающейся системой, способной не только переводить, но и, в каком-то смысле, порождать тексты, в зависимости от того, какой «культурный багаж» будет в нем заложен в виде параллельных текстов.

На сегодняшний день компания Language Weaver выпускает очередные обновленные версии машинного перевода, в частности версию SMTS 4.2. В отличие от других электронных переводчиков SMTS (Statistical Machine Translation Software) использует методы статистического анализа, описанного выше, для изучения предложений, фраз и конструкций и выбирает наиболее подходящий вариант перевода среди множества доступных.

Используемая в программе поддержка вывода данных в формате TMX (Translation Memory eXchange) упрощает обмен информацией между SMTS и другими системами машинного перевода. В программу встроен фильтр, который позволяет переводить документы Microsoft Office (MS Word, Excel и PowerPoint) и выводить результаты перевода в оригинальном формате.

Таким образом, многие современные исследователи приходят к выводу, что качество машинного перевода будет совершенствоваться. Большинство специалистов по информационным технологиям сходятся во мнении, что адекватный перевод любого типа тестов, самостоятельно выполненный машиной, станет реальным через 50-70 лет с развитием возможностей искусственного интеллекта.

Литература:


  1. Марчук Ю.Н. Компьютерный перевод многозначных слов, 2000. www.philol.msu.ru

  2. Семенов А.Л. Основы общей теории перевода и переводческой деятельности. – М.: Издательский центр «Академия», 2008.

  3. Сокирко А. Будущее машинного перевода. // Компьютера №21, 5.06.2002.

  4. Чистяков А., Скребнев А. Компьютерный перевод как инструмент межкультурной коммуникации. – Витебск, 2005.


© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows