Информационные технологии в переводческой деятельности: преимущества, возможности применения, перспективы развития. «использование информационных технологий в переводческой деятельности

Введение

Деятельность переводчика всегда заключалась в работе с текстовой информацией. Сейчас все сферы деятельности человека неразрывно связаны с информационными технологиями, поэтому сложно представить процесс перевода без основного инструмента переводчика – компьютера. Культура экрана (англ. screen culture) заменила культуру напечатанного текста, изменились функции и сущность перевода, сама информация стала порождаться, передаваться и восприниматься напрямую через компьютер.

Владение современными компьютерными программами, направленными на оптимизацию деятельности переводчика, готовность и способность осваивать эти программные продукты с целью повышения привлекательности для работодателя и уменьшения затрат на «производственный процесс» письменного перевода – вот главные требования, предъявляемые рынком сегодня. Если переводчик уверенно ориентируется в современных компьютерных технологиях, то умение эффективно использовать ранее выполненные заказы помогает и ему, и работодателю рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментов текста.

Современные компьютерные технологии помогают при решении следующих переводческих задач:

– общение с заказчиком и получение исходного текста;

– восприятие электронного иноязычного текста;

– информационно-справочный поиск по тематике иноязычного текста;

– переводческий анализ иноязычного научно-технического текста;

– создание аннотированных списков информационных ресурсов;

– подбор переводческих соответствий и эквивалентов;

– создание текста перевода;

– создание примечаний переводчика;

– создание электронной информационно-справочной базы переводчика,

– редактирование, корректирование и верстка выполненного перевода иноязычного текста в соответствии с требованиями заказчика;

– оценка качества выполненного перевода иноязычного научно-технического текста;

– сдача выполненного перевода иноязычного научно-технического текста заказчику.

В связи с этим целью нашего пособия является помощь в приобретении основополагающих знаний, умений, навыков в области компьютерного перевода с иностранного языка на русский и с русского языка на иностранный.

Книга состоит из 10 разделов, содержащих сведения об электронном инструментарии переводчика: знание принципов работы, преимуществ и недостатков электронных словарей, систем автоматического и автоматизированного перевода способствует развитию информационно-технологической компетенции переводчика, что важно для ориентирования в открытом и закрытом (проприетарном) программном обеспечении и файловых форматах; базовых принципах компьютерного оформления текстов. При написании пособия огромную помощь оказали книги и статьи А. Соловьевой, А.Б. Кутузова, А.Л. Семёнова, Г.В. Курячего и К.А Маслинского, К.Т. Волченковой, М. Иванова и многих других (см. Список использованных источников).

1 Понятие компьютерных технологий

На современном этапе развития общества все сферы деятельности человека неразрывно связаны с информационными технологиями (англ. Information Technology, IT). Согласно определению, принятому ЮНЕСКО, информационные технологии – это комплекс взаимосвязанных научных, технологических, инженерных дисциплин, изучающих методы эффективной организации труда людей, занятых обработкой и хранением информации; вычислительную технику и методы организации и взаимодействия с людьми и производственным оборудованием, их практические приложения, а также связанные со всем этим социальные, экономические и культурные проблемы.

Современный экономический словарь определяет информационные технологии как процессы накопления, хранения, передачи, обработки, контроля информации, основанные на использовании средств компьютерной техники, коммуникаций и новейших технологий преобразования информации.

В среде специалистов под информационными технологиями понимают широкий класс дисциплин и областей деятельности, относящихся к технологиям управления и обработки данных, в том числе, с применением вычислительной техники.

Однако в последнее время под информационными технологиями чаще всего понимают компьютерные технологии. В частности, информационные технологии имеют дело с использованием компьютеров и программного обеспечения для хранения, преобразования, защиты, обработки, передачи и получения информации. Если же мы говорим про информационные технологии именно в таком упрощенном понимании, необходимо также отдельно упомянуть коммуникационные технологии, так как часто компьютер не подключен к локальной и глобальной сети. Так или иначе, вне зависимости от способа или факта подключения ЭВМ к ЛВС (локальная вычислительная сеть), современное распространение компьютеров навсегда изменило общество, сделав его качественно другим, информационным. Поясним такие термины, как «информационное общество» и «информатизация общества».

Информационное общество – это общество, в котором социальноэкономическое развитие зависит прежде всего от производства, переработки, хранения, распространения информации среди членов общества.

По европейским меркам общество можно назвать информационным, если в нем более 50 % населения занято в сфере информационных услуг. Соответственно, Россия делает только первые шаги в этом направлении.

Информационное общество отличается от предыдущих тем, что главным фактором в нем выступают не материальные, а идеальные факторы – знание и информация.

Своим названием термин «информационное общество» обязан профессору Токийского технологического института Юдзиро Хаяши, чей термин был использован в появившихся практически одновременно – в Японии и США – в работах Фрица Махлупа (1962) и Т. Умесао (1963). В 1969 году японскому правительству были представлены отчеты «Японское информационное общество: темы и подходы» и «Контуры политики содействия информатизации японского общества», а в 1971 году – «План информационного общества».

Информатизация общества – это не столько технологический, сколько социальный и даже культурологический процесс, связанный со значительными изменениями в образе жизни населения. Такие процессы требуют серьезных усилий не только властей, но и всего сообщества пользователей информационнокоммуникационных технологий на многих направлениях, включая ликвидацию компьютерной неграмотности, формирование культуры использования новых информационных технологий и др.

Сам термин «информатизация» (англ. informatization) нашел широкое распространение лишь в России и Китае. Это было связано, во-первых, с недостаточной разработанностью в 80-90-х годах ХХ века глоссария по тематике «информационные технологии» и «информационное общество», во-вторых, с некоторыми специфическими особенностями развития информационнокоммуникационных технологий в этих странах. Они характеризовались высоким уровнем развития прикладных и специализированных аппаратно-программных комплексов и крайне слабой телекоммуникационной инфраструктурой, которая становилась тормозом гармоничного развития информационного общества.

Цель информатизации – трансформация движущих сил общества, которое должно быть перенацелено на производство услуг, формирование производства информационного, а не материального продукта. В ходе информатизации решаются задачи изменения подходов к производству, модернизируется уклад жизни, система ценностей. Особую ценность обретает свободное время, воспроизводятся и потребляются интеллект, знания, что приводит к увеличению доли умственного труда. От граждан информационного общества требуется способность к творчеству, возрастает спрос на знания. Изменяется материальная и технологическая база общества, ключевое значение начинают иметь различного рода управляющие и аналитические информационные системы, созданные на базе компьютерной техники и компьютерных сетей, информационной технологии, телекоммуникационной связи. Как мы уже замечали выше, процесс развития информационного общества начинается с его компьютеризации.

Компьютеризация (англ. сomputerisation) – процесс внедрения компьютеров, обеспечивающих автоматизацию информационных процессов и технологий в различных сферах человеческой деятельности. Цель компьютеризации состоит в улучшении качества жизни людей за счет увеличения производительности и облегчения условий их труда. Наряду с компьютеризацией существует более частное понятие домашней компьютеризации. Домашняя компьютеризация – (англ. home computerisation) – процесс оснащения домашних хозяйств компьютерными устройствами. В России домашняя компьютеризация является элементом государственной политики информатизации, ориентированным на удовлетворение потребностей населения в информации и знаниях непосредственно на дому.

Удовлетворить потребности можно благодаря специальным поисковым системам.

Информационно-поисковая система (англ. Information retrieval system) – система, выполняющая функции:

– хранения больших объемов информации;

– быстрого поиска требуемой информации;

– добавления, удаления и изменения хранимой информации;

– вывода информации в удобном для человека виде.

Различают:

– автоматизированные (англ. computerised);

– библиографические (англ. reference);

– диалоговые (англ. online);

– документальные и фактографические информационно-поисковые системы.

В информационном обществе происходит слияние информационных групп в одно сообщество при помощи сети, т.е. общество становится сетевым.

Сетевое общество (англ. network society) – общество, в котором значительная часть информационных взаимодействий производится с помощью информационных сетей. Причем состав этого общества постоянно пополняется новыми пользователями.

Главным фактором, увеличивающим число пользователей, является, безусловно, информационная потребность населения всей планеты.

Информационная потребность (англ. Information need) – потребность, возникающая, когда цель, стоящая перед пользователем в процессе его профессиональной деятельности либо в его социально-бытовой практике, не может быть достигнута без привлечения дополнительной информации, которой в данном контексте является всемирная паутина (англ. World Wide Web, WWW, Web) – основная служба в сети Интернет, позволяющая получить доступ к информации на любых серверах, подключенных к сети. Всемирная паутина организована на принципах гиперсреды (англ. Hypermedia) – технологии представления информации в виде относительно небольших блоков, ассоциативно связанных друг с другом. Безусловно, всемирная паутина позволяет получать доступ к любой информации на любых серверах, подключенных к сети.

2 Информационно-технологическая компетенция как составляющая профессиональной компетенции переводчика

В современном обществе для обеспечения конкурентоспособности российских переводчиков последние должны обладать навыками и средствами, являющимися стандартом за рубежом. Так, осуществление процесса межъязыковой и межкультурной коммуникации требует от специалиста применения определенных знаний и умений в области информационно-коммуникационных технологий, основными из которых на сегодняшний день являются:

– электронный документооборот;

– работа с пакетами прикладных программ;

– получение оперативной информации;

– связь с удаленными партнерами;

– принятие компетентностных решений;

– ввод и систематизация данных.

Поэтому, по мнению В.В. Ильченко и Е.В. Карпенко, для профессиональной подготовки будущему переводчику просто необходимо изучение информационных ресурсов и технологий, программных и сетевых средств, пригодных для осуществления переводческой деятельности с помощью компьютера, с целью формирования информационно-технологической компетенции переводчика.

Учитывая новые условия деятельности переводчика, А.А. Рыбакова говорит о том, что профессиональная компетенция переводчика (см. рисунок 1) – это интегральная совокупность билингвистической, культурно-когнитивной, профессионально-предметной, собственно переводческой и информационнотехнологической компетенций, которая представляет собой сложный комплекс знаний, умений, навыков, психологических свойств и качеств личности (способностей), потенциально необходимых для осуществления профессиональной переводческой деятельности, проявляющийся в ней в виде той или иной степени их актуализации (профессиональной компетентности).

Рисунок 1 – Информационно-технологическая компетенция


Следовательно, информационно-технологическая компетенция переводчика является неотъемлемой составляющей его профессиональной компетенции и характеризуется следующими положениями, которые обозначили в своем исследовании В.В. Ильченко и Е.В. Карпенко:

– целеполаганием в процессе решения профессиональной задачи с использованием новейших информационных технологий, четкой и ясной постановкой и формулировкой цели этой деятельности, планирование стратегии информационно-технологической деятельности;

– ценностным отношением к информации и информационным технологиям, их выбору в соответствии с целью деятельности, к результатам информационнотехнологической деятельности, достигнутым лично и в обществе; стойким интересом к информационно-технологической деятельности;

– активным использованием информационных технологий в профессиональной деятельности;

– ценностным отношением к себе, как к специалисту, обладающему мировоззрением, соответствующим уровню развития общества, современными знаниями и умениями в области информационных технологий; осмыслением результатов своей деятельности, стремлением к самосовершенствованию и саморазвитию.

3 Электронное рабочее место переводчика

За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись письменного перевода научно-технической, официальной и деловой документации. Сегодня, как правило, уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает от переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, и при этом удовлетворять принятым в данной стране стандартам.

Индустрия перевода 21 века предъявляет к переводчику новые требования, поскольку объёмы перевода стали больше, сроки стали жёстче, и все чаще приходится работать в международных группах. Переводчику приходится быть менеджером проектов, компьютерщиком, документоведом, специалистом в издательском деле, лингвистом-исследователем.

Письменный перевод технической информации всегда был востребован. Но по данным статистики, переводчик без применения компьютерных технологий может перевести не более 2000 слов в день, что влечет за собой высокую стоимость перевода. Автоматизация существенно увеличивает производительность труда переводчика, позволяя снизить цену на конечный продукт.

Большинство электронных средств – это технология ускорения и создания альтернативных вариантов текста перевода (возможности Интернет); другие позволяют авторитетно отбирать среди альтернативных вариантов (переводческие накопители и всевозможные словари). Переводчики создают и отбирают среди альтернативных вариантов, а различные новые технологии не отменяют этих задач, они лишь расширяют круг возможностей, позволяя иметь дело с большим фрагментом действительности в меньшее время. Изобилие информации в наше время позволяет легко создавать альтернативные варианты текста перевода, что предполагает сосредоточение большего внимания на выбор возможного варианта текста перевода.

Необходимо помнить, что главная задача переводчика – обеспечить коммуникацию между людьми, и только затем – работа с электронными средствами. Взгляд на стержневой элемент компетенции должен способствовать тому, чтобы не упускать из виду цели и найти подобающее место элемента в системе компетенций переводчика и использования информации».

Информационно-технологическая компетенция подразумевает собой не просто переход к иным инструментам, а изменение самого подхода к переводческой деятельности как к процессу перевода. Метафорически это можно выразить при помощи эволюции передвижения человека по местности. Аналогия проста: сначала человек для увеличения скорости осваивает верховую езду, это значительно ускоряет скорость передвижения, но не позволяет перевозить большие грузы, этот этап мы ассоциируем с процессом переводческой деятельности до внедрения понятия информационно-технологической компетенции, т.е. наличие словарей позволяет значительно упростить и ускорить процесс перевода. Использование переводчиком различных видов электронных словарей, текстовых редакторов с проверкой орфографических и лексических ошибок аналогично использованию человеком транспорта с тягловым принципом, т.е. телеги, кареты запряжённые лошадьми или аналогичными животными. Несомненно, подобный переход значительно облегчает сам процесс перевода/передвижения, но говорить о полностью качественном переходе можно лишь при использовании автомобилей легковых или грузовых или, говоря о переводческой деятельности, использовании оболочек электронных словарей, их группировку, использовании систем памяти переводов.

Данное сравнение удачно, поскольку оно подразумевает создание и поддержание определённой инфраструктуры: в случае аналогии это поддержание сети автострад и бензоколонок, а в случае объекта нашего исследования подразумевается как экстенсивное, так и интенсивное развитие ИТ средств перевода.

Информационно-технологическая компетенция переводчика может быть реализована в условиях информационной среды, которая представляет собой так называемое «электронное рабочее место переводчика». В этой связи, нам представляется оправданным прежде всего рассмотреть вопрос о так называемом «электронном рабочем месте переводчика» («компьютерном рабочем месте переводчика», «современном рабочем месте переводчика»), которое служит основой реализации информационно-технологической компетенции переводчика и основой ее формирования в вузе.

Как отмечает В. Грабовский, на протяжении столетий рабочее место переводчика по существу не менялось. Его орудия, как рукописные, так и машинописные, по своему функциональному назначению все это время фактически оставались одними и теми же. Принципиально не менялись и трудоемкость, и производительность.

До информационной эпохи, которая связана с изобретением персонального компьютера, сети Интернет, средствами работы переводчика были в основном бумага и ручка. Конечно, бумага понимается в широком смысле как средство ручного каталогизирования, архивирования и поиска среди записей переводчика, библиографических ссылок и базы терминологических примеров. К другим традиционным ресурсам переводчика относятся печатные словари и справочники, а также справочные материалы по предметным областям, которые необходимо было прочитывать.

Ситуация начала меняться к середине 80-х годов прошлого века – на вооружение была взята компьютерная техника. В 1984 г. в США было объявлено о первой попытке коммерческого использования компьютерной техники (на фирме Agnew Tech-Tran Inc.). В начале 90-х годов началась компьютеризация труда переводчика и в нашей стране.

Поначалу, как замечает В. Грабовский в своем историческом обзоре, компьютер воспринимался в качестве своего рода продвинутой пишущей машинки, очень удобной для редактирования текстов. Однако вскоре компьютер придал работе переводчика новое измерение, проявляя свои потенциальные возможности во всевозрастающей степени. Стало возможным пользоваться не только программами для написания и обработки текстов, но и электронными словарями, а также всевозможными справочниками. Шла работа по, условно говоря, механизации и автоматизации труда лингвистов.

К первой категории можно отнести программные продукты технологии TM (Translation Memory), являющиеся базами данных большой емкости. Эти базы данных позволяют сохранять фрагменты текстов оригинала и соответствующий им перевод, причем не только отдельные слова, но и целые фразы. Первыми программами такого рода были Translator"s Workbench (фирма Trados) и Transit (фирма Star). Они позволяли сравнивать фразы переводимого текста с фразами, содержащимися в базах данных и анализировать степень их сходства в процентах. Они существенно облегчают работу с текстами, обеспечивая мгновенный доступ ко всем предыдущим наработкам. Сюда очень подходит известное выражение Билла Гейтса «Information at your fingertips» (Информация у кончиков ваших пальцев).

Предпринимались попытки создания программ, способных самостоятельно делать переводы письменных текстов. В этой связи можно упомянуть известные в нашей стране отечественные продукты Stylus (фирма Promt) и Socrat (фирма Arsenal). Сфера применения этих программ была ограниченной, и во многих случаях их роль является вспомогательной.

Велись и работы по воплощению давней мечты переводчика – созданию полностью автоматизированного рабочего места. Наиболее интересной в этом плане представляется разрабатывавшаяся в начале 90-х в университете Carnegie Mellon (г. Питтсбург) технология Interlingua, основывающаяся на теории машинного интеллекта. Суть этой технологии заключается в том, что на основе специально разработанных алгоритмов программа анализирует смысл текста оригинала и переводит его на промежуточный искусственный язык Interlingua. После этого исходный текст компьютер может автоматически переводить на любой язык, предусмотренный программой и имеющий соответствующие алгоритмы. Можно себе представить, насколько это было бы удобно для производителей техники, выпускающей инструкции по эксплуатации и другие технические материалы сразу на нескольких языках. Данная технология также предусматривала потенциальную возможность устного перевода – при помощи дополнительных программ распознавания человеческой речи и устройств-синтезаторов речи.

К сожалению, эти разработки пока не привели к созданию готового к коммерческому применению продукта, в первую очередь из-за недостаточной мощности вычислительных средств и других технических проблем. Тем не менее, работа в этом направлении продолжается.

В 90-х годах в распоряжении переводчиков появились такие средства коммуникации, как факс и электронная почта. Без электронной почты сейчас уже просто не обойтись. Значительным шагом вперед явилось широкое распространение сканеров, позволяющий работать с графикой и иллюстрациями, а также распознавать текстовые данные и преобразовывать их в электронный формат. Трудно переоценить значение для переводчиков таких продуктов для создания текстовых файлов, как FineReader и CuneiForm. Переводить текстовые файлы гораздо удобней, чем бумажные версии. Появляются программы, предоставляющие дополнительные удобства и сервис в работе. В этой связи можно упомянуть Либретто (анализ и аннотация текстов), Следопыт (поиск текстовых данных на локальном и сетевых дисках), Punto Switcher и др. Особенно удобной представляется последняя, предназначенная для переключения языка клавиатуры.

Punto Switcher

Программа распознает язык, на котором пишется текст, и автоматически переключает на него. Особенно важно, если вы набираете текст, не глядя на экран. Если вы по рассеянности наберете в адресной строке браузера ццц, то Punto Switcher самостоятельно преобразует это в www.

С помощью этой бесплатной программы можно:

1) переключать раскладку автоматически (она распознаёт набранный текст) и горячей клавишей;

2) менять стандартные системные комбинации клавиш для смены раскладки;

3) в выделенном тексте и в тексте из буфера обмена исправлять раскладку и регистр;

4) пользоваться функцией автозамены при наборе часто употребляемых слов.

Кроме того, в программе предусмотрены звуковые сигналы для работы с клавиатурой.

Возвращаясь к историческому обзору электронного рабочего места переводчика, упомянем и быстрый прогресс в сфере носителей электронной информации. Дискеты 5" давно ушли в прошлое. Помимо дискет 3", MO-дисков и всевозможных картриджей появились и все шире применяются диски CD-ROM, в том числе перезаписываемые. Оборудование для записи давно перестало быть экзотикой.

Следует отметить, что за последние лет десять по мере развития программнотехнических средств, находящихся на вооружении лингвистов, изменялся и конечный продукт их труда. Появилась возможность не только подготавливать переведенные и отредактированные текстовые данные, но создавать оригиналмакеты для последующего тиражирования. Наиболее распространены в нашей стране такие программы для компьютерной верстки и создания оригинал-макетов, как PageMaker и QuarkXpress, вытеснившие популярную в первой половине 90-х Ventura Publisher. Менее известны программы FrameMaker и Interleaf.

Оригинал-макеты включали в себя не только текст, но и другие компоненты, необходимые для печатного издания – иллюстрации, графику, предметные указатели и т.д.

Это в корне изменило характер взаимодействия переводчика и потребителя его продукции. Если раньше заказчик получал лишь полуфабрикат – т.е. текстовые данные, и этот полуфабрикат ему приходилось самому доводить до стадии готового продукта, то сейчас он получает готовую к дальнейшему использованию продукцию.

Далее, по мере прогресса мультимедийных технологий, стало возможным не ограничиваться выпуском информации на бумажных носителях, а во взаимодействии со звукозаписывающими студиями готовить CD и видеокассеты с учебными материалами, презентациями и т.д.

Следует упомянуть и о всевозрастающей роли в работе переводчика Интернета. Постоянно растет количество всевозможных справочных ресурсов по любым отраслям знаний. Их значение трудно переоценить. Нельзя не упомянуть и о проблемах для переводчика, возникающих в связи с работой с электронной почтой и в Сети. Главная проблема – это вирусы. Неизбежным инструментом его рабочего места становятся антивирусные программы, прежде всего Нортон Антивирус и Антивирус Касперского.

Сделав небольшой экскурс в историю, мы проследили, как за последние десять лет изменилось рабочее место переводчика и его оснащение. Перейдем к конкретному рассмотрению наполнения термина «компьютерное рабочее место переводчика».

В отечественной литературе практически не встречается понятие, и нет устоявшегося термина для обозначения состава аппаратного и программного обеспечения, а также электронных ресурсов, как единого комплекса обеспечения переводческой деятельности. В англоязычной литературе для обозначения рабочего места переводчика давно используется и вполне привычны такие наименования, как Translator"s Workstation («рабочая станция переводчика», «автоматизированное рабочее место переводчика») или Translator"s Workbench («рабочее место переводчика»).

Что же входит в состав «компьютерного рабочего места переводчика»?

Прежде всего, это аппаратная часть компьютера (системный блок, монитор, принтер, сканер, МФУ и др.). Поскольку так называемая «hardware» часть рабочего места переводчика является скорее объектом дипломного проекта какой-либо технической специальности, мы не будем подробно останавливаться на ней, заметив лишь на основании собственного опыта, что на сегодняшний день большинство ИТ инструментов мало зависит от аппаратной части ЭВМ и выбор как аппаратной платформы, так и технических характеристик компьютера может быть продиктован субъективными предпочтениями, он практически не влияет на работоспособность отдельно взятого программно-аппаратного комплекса.

В состав электронного рабочего места переводчика входят также соответствующие программные средства (программное обеспечение), которые вместе с аппаратными средствами предоставляют ему различные возможности и позволяют переводчику выполнять различные виды операций, необходимых ему для выполнения задач в ходе своей профессиональной деятельности. Кроме того, необходимо наличие определенных ресурсов: словарей, справочников, корпусов (параллельных) текстов. На наш взгляд именно выбор и степень овладения программной частью рабочего места переводчика оказывает влияние на эффективность переводческой деятельности.

Зарубежные эксперты отмечают, что необходимо разделять понятия «электронных средств» и «электронных ресурсов», несмотря на их близость и взаимозависимость в работе переводчика в современных условиях. По сути, «средства» – это те инструменты или оборудование (например, компьютер, программное обеспечение), которые им необходимы для выполнения той или иной повседневной работы (например, программа-конкорданс, проверка орфографии). Не менее важны и ресурсы (например, уже упомянутые нами корпусы текстов, словари, глоссарии, справочные материалы).

В учебном пособии представлены основные теоретические положения переводческой деятельности как аналитико-синтетического процесса. Излагаются принципы компьютеризации текстовой деятельности. Рассматриваются теоретические основы практики использования современных информационных технологий письменного перевода. Наряду с лингвистическими проблемами затрагиваются наиболее актуальные организационные вопросы переводческой деятельности.
Для студентов старших курсов переводческих факультетов, слушателей системы повышения квалификации переводчиков, а также специалистов, заинтересованных в самостоятельном развитии навыков практического перевода.

Первые опыты машинного перевода.
Кропотливый труд переводчика, перенасыщенный множеством рутинных монотонных операций, в сочетании с творческой идеей переводческой деятельности, требующей интеллектуального подхода, всегда был в центре внимания революционеров науки и технологии.

Сразу же с появлением одной только идеи электронной вычислительной машины зародилась мечта о ее использовании в качестве электронного переводчика. Уже в 1946 г. эта мечта получила свое реальное воплощение в трудах американских ученых У. Уивера и А.Д. Бута. Они предлагали различные способы использования вычислительных машин для перевода текста с одного языка на другой. Очередным стимулом для развития научных исследований в области машинного перевода стала декларативная работа У. Уивера «Translation», опубликованная в 1949 г. В прогностическом плане ее автор обосновал возможность и целесообразность создания систем машинного перевода на базе ЭВМ.

Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
Скачать книгу Современные информационные технологии и перевод, Семенов А.Л., 2008 - fileskachat.com, быстрое и бесплатное скачивание.

  • Перевод, Теория, практика и методика преподавания, Латышев Л.К., Семенов А.Л., 2003
  • Учебник персидского языка для I года обучения, Иванов В.Б., Абольхасани 3., 2014
  • Основы языкознания для школьников, 5-8 классы, Факультативный курс, Методическое пособие, Дроздова О.Е., 2016

Следующие учебники и книги.

Современный период развития общества характеризуется сильным влиянием на него компьютерных технологий, которые проникают во все сферы человеческой деятельности, обеспечивают распространение информационных потоков в обществе, образуя глобальное информационное пространство. Неотъемлемой и важной частью этих процессов является компьютеризация переводческих процессов. Компьютеризация процесса перевода стала одной из важных задач с самого начала использования ИТ в науке. Мечта о создании автоматических машинных переводчиков не покидала ученых с самого начала. И хоть полное переведение процесса в сферу деятельности машин на данном этапе развития ИТ невозможно – присутствие человеческого фактора как конечной инстанции принятия решения все еще необходимо – задачей разработчиков стала всяческая помощь переводчику посредством ИТ. Внедрение компьютерных средств в процесс, изначально ориентированный только на человека, его способности к отбору подходящего варианта на уровне опыта и чувства стиля, требует особого внимания к деталям и технике. Кроме разработки подходящего ПО разных типов для выполнения соответствующих сопутствующих задач, на первое место выходит также обучение специалистов использованию этих программ, создание комфортных условий для их применения.

Компьютерные технологии призваны стать не дополнительным «довеском» в переводе, а неотъемлемой частью целостного процесса, значительно повышающей его эффективность, стать «правой рукой» переводчика, ускорить процесс перевода и сделать его более технологичным.

На данном этапе возможности ИТ в переводе используются в неполном, недостаточном объеме.

Основной причиной сложившейся ситуации является недостаточное внимание к возможностям применения ИТ на стадии образования. При подготовке переводчиков в наших ВУЗах полностью отсутствует внимание к возможностям ИТ – не только нет отдельного курса, но об изучении данного вопроса по программе даже нет и речи. Сами педагоги не всегда достаточно знакомы с вопросом, поэтому их советы также не могут полностью удовлетворить потребности учащихся. На нынешнем этапе поиск возможностей использования ИТ при переводе на 90% является задачей самого студента-переводчика.

Актуальность исследования: современный период развития общества характеризуется сильным влиянием на него компьютерных технологий, которые проникают во все сферы человеческой деятельности, обеспечивают распространение информационных потоков в обществе, образуя глобальное информационное пространство. Происходит усовершенствование вспомогательных возможностей ИТ в различных сферах, в том числе и в такой важной области, как перевод.

Объектом являются достижения современных информационных технологий в процессе перевода.

Предметом являются компьютерные программы и интернет-ресурсы, призванные помочь переводчику в процессе перевода.

Цель: осветить возможности использования СИТ при переводе на нынешнем этапе развития, предложить варианты повышения эффективности использования имеющихся достижений.

· Изучить историю развития компьютерных технологий в области перевода;

· Изучить имеющиеся доступные средства перевода, как ПО, так и ИР

· Рассмотреть электронный словарь Lingvo, электронный переводчик PROMT.

· Выявить преимущества и недостатки современных переводческих систем.

· Изучить варианты улучшения эффективности использования ТСП.

Глава 1 История развития современных информационных технологий в переводе.

Осуществление перевода компьютером – сложная, но интересная научная задача. Основная ее сложность состоит в том, что естественные языки плохо поддаются формализации. Отсюда и невысокое качество получаемого с помощью систем МП текста, содержание и форма которого служит неизменным объектом шуток. Однако идея машинного перевода уходит корнями далеко в прошлое.

Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж, разработавший в 1836-1848 гг. проект «цифровой аналитической машины». Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.

А через 100 лет, в 1947 году, У. Уивер (директор отделения естественных наук Рокфеллеровского фонда) написал письмо Норберту Винеру. В этом письме он предлагал использовать технику дешифрования для перевода текстов. Этот год считается годом рождения машинного перевода. В этом же году был разработан алгоритм осуществления пословного перевода, а в 1948 году Р. Риченс предложил правило разбиения слова на основу и окончание. В последующие два десятилетия системы машинного перевода бурно развивались.

В январе 1954 года на машине IBM – 701 была продемонстрирована первая система машинного перевода IBM Mark II. Но в 1967 году специально созданная Комиссия Национальной Академии Наук США признала «машинный перевод нерентабельным», что существенно затормозило исследования в этой области. Новый подъем машинный перевод переживает в 70-е годы, а в 80-е становится экономически выгодным за счет сравнительной дешевизны машинного времени.

Однако в СССР исследования в области машинного перевода продолжались. После демонстрации системы IBM Mark II группа ученых ВИНИТИ начала разработку системы машинного перевода для машины БЭСМ. Первый образец перевода с английского на русский язык был получен к концу 1955 года.

Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М. В. Келдыша РАН) по инициативе А. А. Ляпунова. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине "Стрела". Благодаря работе над созданием систем МП оформилось такое направление, как прикладная лингвистика.

В 70-е годы над созданием систем МП трудилась группа разработчиков ВИНИТИ РАН под руководством проф. Г.Г. Белоногова. Первая их система МП была разработана в 1993 году, а в 1996 году после ряда доработок была зарегистрирована в РОСАПО под названием Retrans. Эта система использовалась министерствами обороны, путей сообщения, науки и технологии.

Параллельные исследования велись в лаборатории Инженерной Лингвистики ЛГПИ им. А. И. Герцена (ныне Педагогический Университет). Именно они и легли в основу наиболее популярной сейчас системы МП “PROMT”. Последние версии этого программного продукта используют наукоемкие технологии и построены на основе технологии расширенных сетей переходов и формализма нейронных сетей.

Глава 2 Классификация средств машинного перевода (по Ларри Чайлду)

«Новые члены форума по иностранным языкам компании CompuServe зачастую задают вопрос о том, не мог ли бы кто-нибудь посоветовать им хорошую программу машинного перевода за умеренную цену. Ответом на этот вопрос неизменно является "нет"». В зависимости от отвечающего, ответ может содержать два основных аргумента: либо о том, что машинам перевод не под силу, либо, что машинный перевод стоит слишком дорого.

Оба эти аргумента в определенной степени справедливы. Однако ответ далеко не так прост. Изучая проблему машинного перевода (МП), следует рассмотреть отдельно различные подразделы этой проблемы. Следующее разделение основано на лекциях Лари Чайлдса, проведенных в рамках Международной Конференции по Техническим Коммуникациям 1990 года:

Системы машинного перевода осуществляют автоматизированный перевод текста. Единицами перевода при этом служат слова или словосочетания, причем последние разработки позволяют учитывать морфологию переводимого слова. «Развитые системы МП осуществляют перевод по заданным разработчиком и/или корректируемым пользователем алгоритмам перевода» .

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков Яз1 –Яз2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя «двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик» . Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

В настоящее время существует две концепции развития систем машинного перевода:

1. Модель «большого словаря со сложной структурой» , которая заложена в большинство современных программ-переводчиков;

2. Модель «смысл-текст» , впервые сформулированная А.А. Ляпуновым, но пока что не реализована ни в одном коммерческом продукте.

На сегодняшний день наиболее известны такие системы машинного перевода, как

PROMT 2000/XT компании PROMT;

Retrans Vista компаний Vista и Advantis;

Сократ – набор программ компании Арсеналъ.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов, как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено. более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Вместо принятого лингвистического подхода, предполагающего выделение последовательных процессов анализа и синтеза предложения, в основу архитектуры систем было положено представление процесса перевода как процесса с "объектно-ориентированной" организацией, основанной на иерархии обрабатываемых компонентов предложения. Это позволило сделать системы PROMT устойчивыми и открытыми. Кроме того, такой подход дал возможность применения различных формализмов для описания перевода разных уровней. В системах работают и сетевые грамматики, близкие по типу к расширенным сетям переходов, и процедурные алгоритмы заполнения и трансформаций фреймовых структур для анализа сложных предикатов.
Описание лексической единицы в словарной статье, которое фактически не ограничено по размерам и может содержать множество различных признаков, тесно взаимосвязано со структурой алгоритмов системы и структурировано не на основе извечной антитезы синтаксис - семантика, а на основе уровней компонентов текста.

При этом системы могут работать и с не полностью описанными словарными статьями, что является важным моментом при открытии словарей для пользователя, от которого нельзя требовать тонкого обращения с лингвистическим материалом.

В системе выделяется уровень лексических единиц, уровень групп, уровень простых предложений и уровень сложных предложений. Все эти процессы связаны и взаимодействуют иерархически в соответствии с иерархией текстовых единиц, обмениваясь синтезируемыми и наследуемыми признаками. Такое устройство алгоритмов позволяет использовать разные формальные методы для описания алгоритмов разных уровней.

Электронный словарь – это, как правило, компьютерная база данных, содержащая закодированные особым образом словарные статьи, которые позволяют осуществлять быстрый поиск нужных слов и словосочетаний. Поиск слов осуществляется с учетом морфологических сочетаний (примеров употребления), а также с возможностью изменения направления перевода (например, англо-русский или русско-английский).

Основное отличие ЭС от СМП заключается в том, что ЭС предоставляет переводчику весь спектр занесённых в его БД значений искомого слова или словосочетания, оставляя выбор наиболее подходящего варианта за человеком, в то время как СМП сама осуществляет подбор варианта из БД на основе встроенных в неё алгоритмов.

Lingvo в переводе с языка эсперанто означает «язык», о чём есть статьи в словарях ABBYY Lingvo (LingvoUniversal и LingvoComputer).

В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами - носителями языка.

В состав программы входит обучающий модуль Lingvo Tutor, помогающий запоминать новые слова.

Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте Ассоциации лексикографов Lingvo.

Разновидности ABBYY Lingvo х3:

· ABBYY Lingvo х3 Европейская версия - 130 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, немецкий, португальский и французский языки и обратно.

· ABBYY Lingvo x3 Многоязычная версия - 150 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, китайский, латинский, немецкий, португальский, турецкий, украинский и французский языки и обратно.

· Мобильный многоязычный словарь ABBYY Lingvo x3 - словарь для смартфонов, коммуникаторов и КПК, содержащий 38 современных полных словарей для 8 языков.

· ABBYY Lingvo х3 Английская версия - 57 общелексических и тематических англо-русских и русско-английских словарей.

· Все версии содержат толковые словари английского языка (Oxford и Collins) и Большой толковый словарь русского языка Ефремовой Т. Ф.

Кроме уже описанных выше средств ПО, служащих для помощи переводчика, также существуют и специальные ИР, позволяющие осуществлять поиск перевода в режиме онлайн, без необходимости загрузки и установки какого-либо ПО.

ИР также можно разделить на два типа: словари и схожие по принципу онлайн БД и машинные переводчики.

Самым известным онлайн словарём можно по праву признать интернет-версию ABBYY Lingvo. Помимо уже привычного пословного перевода и предоставления словарных статей сайт предлагает большой круг дополнительных возможностей:

FineReader Online – это удобный онлайн OCR сервис, который распознает ваши изображения, PDF-файлы или фотографии документов и конвертирует их в нужные форматыMicrosoft Word, Excel, TXT, RTF или PDF с возможностью поиска

Письменный перевод – разработка представителей компании ABBYY Lingvo, которая позволяет заказчику оптимизировать расходы. Тип перевода и его стоимость определяются предназначением документа, тематической областью, объемом и сроками выполнения проекта

Индивидуальное обучение по телефону (или по Интернет – через Skype)

Онлайн-версия программы ABBYY Aligner для выравнивания параллельных текстов и создания баз Translation Memory

Услуга «Перевод по телефону» – это телеконференция, в которой кроме Вас и Вашего собеседника участвует удаленный переводчик

Дополнительно можно обратить внимание на такой ресурс, как Urban Dictionary. Данная онлайн БД создана для знакомства пользователей с постоянно изменяющейся и быстро обновляющейся сферой английского сленга, фраз с переносным значением, разговорных оборотов.

Что касается онлайн переводчиков, то достаточно отметить, что большинство программ МП имеют интернет-версии, в том числе и PROMT. Они предлагают тот же набор функций, что и их программные «собратья».

Заключение

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи электронные словари и программы, осуществляющие машинный перевод, являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей.

Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров (а тем более таких, каким было бы "под силу" осуществлять более или менее современные программы машинного перевода) насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Республика Беларусь все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много. Это явилось следствием того, что на данном этапе процесс обучения профессионального переводчика занимает много времени и весьма трудоёмок. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой – сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное - лингвистики.

В данной работе было произведёно исследование современного рынка ТСП, доступного переводчику.

Были изучены и описаны различные типы перевода с использованием ИТ:

Полностью автоматический перевод;

Автоматизированный машинный перевод при участии человека;

Перевод, осуществляемый человеком с использованием компьютера.

Были рассмотрены, описаны и проанализированы различные типы ТСП:

Электронные словари;

Системы машинного перевода;

Интернет-ресурсы для перевода.

Был произведён обзор конкретных продуктов, имеющихся в доступе на данный момент, были проанализированы их возможности, достоинства и недостатки.

На данном этапе развития ИТ можно сделать следующий вывод: самым перспективным направлением использования ТСП является полностью автоматизированный перевод. Разработка ПО в данной области занимает умы ведущих учёных и является одним из приоритетных направлений исследования в сфере компьютерной лингвистики.

Сейчас же самым популярным является использование ТСП в качестве вспомогательных инструментов в процессе перевода. В этой области современные разработки предоставляют самые широкие возможности по поиску и толкованию слов и выражений. Существуют БД не только по отдельным словам, но и БД устойчивых выражений, жаргонизмов, сленга и т.п.

Главной задачей в улучшении процесса перевода сейчас можно считать внедрение ТСП на всех уровнях, от первичного процесса обучения переводчика в ВУЗе до популяризации ТСП в СМИ. Сейчас же имеющиеся возможности ТСП используются в неполном объёме.

Список литературы к реферату

1. Беляева М.А. Грамматика английского языка / - М.: Высшая школа, 1987.

2. Блох М.Я. Теоретические основы грамматики / - М.: Высшая школа, 2000. – 280 с.

3. Вайхман Г.А. Новое в английской грамматике // Учебное пособие для ин-тов и факультетов иностранных языков / - М.: Высшая школа, 1990.

4. Ильиш Б. А. Современный английский язык // Современный английский язык. Теоретический курс: Учебник для пед. и учител. ин-тов иностр. яз. / - Ленинград,1980.

5. Казакова Т.А. Практические основы перевода / – Спб., 2002. – 324 с.

6. Качалова К.Н., Израилевич Е.Е. Практическая грамматика английского языка / - М.: Внешторгиздат, 1957.

7. Кутузов Л. Практическая грамматика английского языка / - М.: Вече, 1998. – 200с.

8. Семёнов А. Л. Современные информационные технологии и перевод // Учеб пособие для студ. Высш. Учеб. Заведений/ - М.:Издательский центр “Академия”, 2008. – 224 с.

9. Википедия – онлайн-энциклопедия [Электронный ресурс]. – Режим доступа: http://ru.wikipedia.org - Дата доступа: 29.12.2010.

10. Онлайн-словарь ABBYY Lingvо [Электронный ресурс]. – Режим доступа: http://lingvo.abbyyonline.com/ru– Дата доступа: 29.12.2010.

11. Онлайн-переводчик текста компании ПРОМТ [Электронный ресурс]. – Режим доступа: http://translate.promt.by/– Дата доступа: 29.12.2010.

12. UrbanDictionary – the greatest on-line American slang dictionary [Электронный ресурс]. – Режим доступа: http:/www.urbandictionary.com/ – Дата доступа: 29.12.2010.

Предметный указатель к реферату

база данных, 3 , 10

интернет, 3 , 5 , 12 , 13 , 14 , 19 , 22

компьютерных, 4, 5

машинный, 2 , 3 , 6 , 7 , 8 , 13 , 14

перевод, 2 , 3 , 5 , 6 , 7 , 8 , 9 , 11 , 12 , 13 , 14 , 16 , 18 , 24 , 25

переводчик, 5 , 8 , 13 , 16 , 24

программа, 5

ресурс, 3 , 13 , 16, 18 , 19 , 24, 25

словарь, 3 , 5 , 10 , 11 , 12 , 16 , 18 , 19 , 24

электронный, 3 , 5 , 11 , 18

Интернет ресурсы в предметной области исследования

http://lingvo.abbyyonline.com/ru/

ABBYY Lingvo - семейство электронных словарей. Создан российской компанией ABBYY. 13 августа 2008 года вышла новая версия x3 (икс три Объём словарных статей составляет более 8,7 млн. единиц.

Многоязычная версия охватывает 12 языков - армянский, русский, украинский, английский, немецкий, французский, испанский, итальянский, турецкий, латинский, китайский, португальский. Также существует Европейская версия - 130 словарей на 7 языках и англо-русско-английский электронный словарь.

http://translate.promt.by

СМП ПРОМТ – один из самых известных ресурсов МП, осуществляет перевод как отдельных лексических единиц, так и законченных синтаксических целых: предложений, ткстов.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов, как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

http://translate.eu

Онлайн мультиязычный перевод текста и словари. Данный ресурс представляет собой крупнейший комплекс онлайн-словарей. Также он предоставляет возможность перевода текста на 52 языка Европейского Союза во всех направлениях (с любого языка из списка на любой другой язык из списка). Используется во многих международных ведомственных и образовательных струкртурах.

www.urbandictionary.com

Данная онлайн БД создана для знакомства пользователей с постоянно изменяющейся и быстро обновляющейся сферой английского сленга, фраз с переносным значением, разговорных оборотов.

Данный ресурс позволяет пользователям самостоятельно вносить в БД новые слова и выражения, дополнять определения уже существующих. Каждая статья помимо пояснения выражения содержит примеры его употребления, взятые из популярных текстов, песен, фильмов. Также сайт содержит разделы «Слово дня» и «Слово года», где представлены выбранные пользователями путём голосования самые популярные слова и выражения дня и года соответственно.

http://ru.wiktionary.org

Викисловарь (Wiktionary) - свободно пополняемый многофункциональный многоязычный словарь и тезаурус, основанный на вики-движке. Один из проектов фонда «Викимедиа».

http://multitran.ru

Интернет-система, в которую входят 14 двусторонних электронных словарей. В настоящее время это один из наиболее полных и самых популярных автоматических онлайн-словарей Рунета. Наиболее полно представлены англо-русско-английская, немецко-русско-немецкая и французско-русско-французская части словаря. Наименее полно - калмыцко-русско-калмыцкая часть словаря. Помимо интернет-версии, распространяется оффлайн-версия «Мультитрана».

Действующий личный сайт в WWW (гиперссылка).

Приложение Б

Приложение В


Приложение Г





Информационные технологии в переводческой деятельности: преимущества, возможности - страница №1/1

М. В. Умерова

ГУ–ВШЭ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ: ПРЕИМУЩЕСТВА, ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ, ПЕРСПЕКТИВЫ РАЗВИТИЯ

The paper intends to explore modern systems of machine translation. Traditionally translation programs are divided i nto two types: ruled-based and example-based. Example-based systems work on the translation memory principle which prevails in modern computer programs applied for translation.
Сегодня к сфере информационных технологий в переводческой деятельности относят электронные словари, терминологические базы данных, справочники и энциклопедии, а также специальные программы, позволяющие осуществлять компьютеризированный (или машинный) перевод. Рассмотрим основные существующие на сегодняшний день прикладные программы, обеспечивающие компьютерный перевод текстов (Computer-Aided Translation).

Традиционно системы машинного перевода делятся на две категории: основанные на правилах (rule-based) и основанные на примерах (example-based). В первых глубже проработана грамматика, они в большей степени учитывают различные правила. Системы второго типа – самообучающиеся, они строятся на динамическом порождении языковых правил для конкретных текстовых примеров. Границы между системами example-based и rule-based не достаточно четкие, т.к. в обеих используются словари и правила работы с этими словарями. На сегодняшний день наиболее распространенной системой, построенной по принципу example-based является система TRADOS, работающая главным образом на примерах, практически без использования грамматических правил. Такого рода программы называются Translation Memory (TM-tools).

ТМ-инструменты позволяют сохранять в базе данных параллельные предложения: предложение из оригинала и его перевод. В базе данных могут сохраняться и более объемные текстовые фрагменты, но автоматически фиксируются именно предложения (программа обрабатывает текстовые фрагменты от точки до точки). В первый же момент начала работы над переводом предложения программа автоматически проверяет имеющуюся базу данных на наличие такого же или аналогичного предложения и предлагает уже имеющийся перевод. Таким образом, со временем база данных расширяется, что особенно быстро происходит в переводческих центрах, где работает большое количество переводчиков, осуществляющих множество переводов. Большинство таких программ устанавливаются как на персональном компьютере, так и применяются для сетевого использования. Использование общей базы данных всеми переводчиками позволяет выработать единый переводческий стиль всего переводческого агентства. Режим редактирования позволяет исправлять ошибки и исключить их повторение в дальнейших переводах.

Программы категории ТМ предоставляют функцию терминологического обеспечения, т.е. при обнаружении слова или словосочетания, помеченного в предыдущих переводах как термин, программа обращает внимание переводчика на этот фрагмент и предлагает уже имеющийся вариант перевода. Таким образом, принцип единства терминологии может выдерживаться всеми переводчиками агентства. Сегодня существуют готовые терминологические базы, которые могут предоставляться заказчиком перевода в виде дополнительного блока для имеющейся у переводческого агентства программы. Это позволяет ускорить процесс перевода и улучшить его качество.

Система TRADOS предназначена для больших переводческих центров, где накопилось много параллельных текстов. Она позволяет не переводить дважды одно и то же предложение, а находит аналогичное предложение в базе параллельных текстов и выдает уже сделанный когда-то перевод. При больших массивах однотипных текстов такой подход весьма эффективен. Понятие массива документов важно для машинного перевода. Большинство специалистов сходится во мнении, что машинный перевод возможен только для прикладных (технических) текстов, которые могут быть заданы определенными, зачастую просто гигантскими массивами. Художественная литература, при переводе которой приходится решать проблему выбора контекстуального значения многозначного слова, переводить игру слов, контаминированную речь, метафоры, аллюзии и другие стилистические приемы, не будет переводиться компьютером адекватно, по крайней мере, в обозримом будущем.

На российском рынке машинных переводчиков немного, и лидером среди них является система PROMT. По некоторым оценкам PROMT занимает до 95% рынка машинного перевода в России, причем его позиции сильны не только у нас, но и в Европе. PROMT – коммерческая разработка, поэтому внутренние алгоритмы программы недоступны широкому кругу исследователей. С этой точки зрения программа представляет собой, в некотором роде, «черный ящик», содержимое которого невозможно подвергнуть анализу. Но, с достаточной степенью уверенности, можно утверждать, что система использует двуязычные словари, снабженные необходимой лингвистической информацией: морфологической, синтаксической, семантической. Программа умеет отделять однозначные слова от многозначных, после чего однозначные слова переводятся по спискам эквивалентов. Для перевода многозначных слов используются специальные контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на предмет наличия или отсутствия контекстных определителей значения.

Известный ученый-лингвист Ю.Н.Марчук, чьи работы уже стали классикой прикладной лингвистики, уделяет немало внимания проблеме разрешения лексической многозначности при машинном переводе, которая разрешается с помощью обнаружения в тексте определяющих перевод многозначного слова лексических, синтаксических и морфологических детерминант. На сегодняшний день существует большое количество работ, посвященных закономерностям эксплицирования лексики, синтаксиса и семантики в рамках конкретных подъязыков, обладающих собственными лексическими, структурными, синтаксическими и семантическими особенностями.

Ю.Н.Марчук объясняет низкое качество переводов, выдаваемых многими системами машинного перевода тем, что конечный переводной текст рассматривается большинством разработчиков как композиция или сумма переводов его отдельных частей (подобно общеизвестному свойству порождения крупных единиц из более мелких). Но перевод не обладает этим свойством, и из корректных переводов отдельных частей текста нельзя автоматически получить правильный перевод всего текста в целом. Решение данной проблемы Ю.Н.Марчук видит в точном учете специфических особенностей предметного поля и лингвистического состава конкретных подъязыков (т.е. областей, заведомо существенно меньших, чем вся система естественного языка). Для таких языковых общностей как подъязыки возможно определять значение отдельных языковых единиц таким образом, что их совокупность (линейная комбинация) не противоречит идее цельного текста как такового. На этой теоретической основе и возникла идея создания контекстологических словарей для определенных типов текстов в рамках определенных семантических полей и подъязыков, которые сегодня помимо контекстов употребления включают и толкование. Контекстологические словари дают возможность создавать многоязычные терминологические базы данных для широких предметных областей.

Таким образом, контекстологический подход синтезирует две главные тенденции прикладного описания лексики – словарно-центрическую и текстоцентрическую. На текстоцентрическом подходе основаны многие действующие системы машинного перевода: основой описания лексики являются вспомогательные словари-конкордансы, которые возникают в результате анализа больших текстовых массивов. Основное значение здесь имеют текстовые употребления слова, т.е. совокупность его конкретных значений в данном типе текстов. В более ранних системах машинного перевода контекстологический словарь объединялся со специальным алгоритмом, который осуществлял запросы по каждому многозначному слову на наличие контекстных детерминант. Современные языки программирования позволяют реализовывать систему словаря, не соединяя его со специальной алгоритмической процедурой. На сегодняшний день существуют и другие способы разнообразной реализации словаря в компьютерной программе.

Наиболее важным результатом использования контекстологических словарей является эффективное решение проблемы лексической многозначности, ведь уже давно доказано, что именно лексические значения слов передают основную часть семантической информации предложения и текста в рамках дискурса определенной предметной области.

На сегодняшний день разработчики системы машинного перевода PROMPT предлагают интегрированную версию, объединяющую системы PROMT XT Professional и TM TRADOS. Алгоритм совместной работы этих двух систем выглядит следующим образом: сначала система TRADOS анализирует переводимый документ и выявляет сегменты, перевод которых отсутствует в базе или процент его совпадения с базой ниже заданного. Выявленные текстовые сегменты передаются в PROMT XT Professional для дальнейшего машинного перевода. Чтобы повысить качество осуществляемого перевода, пользователю необходимо предварительно настроить систему: выделить тематику переводимого документа, что подключит к работе специализированные словари и обеспечит единство терминологии во всем документе. Переведенные компьютером текстовые сегменты пополняют базу Translation Memory с пометкой о том, что они были созданы PROMT. При дальнейшей работе с документом в системе TRADOS пользователю остается только отредактировать их и сохранить в базе Translation Memory. Результатом совместного использования систем становится не только перевод документа, но и соответствующая база Translation Memory, которую можно использовать в последующих переводах.

Сегодня учебные программы большинства языковых вузов и факультетов предусматривают лекции о существующих системах машинного перевода, но далеко не во всех вузах есть возможности для ознакомления студентов с электронными переводчиками на практике. Так с 2005 года системы перевода PROMT и TRADOS поставляются в некоторые российские вузы (РГГУ, РГПУ им. Герцена и другие). Университеты разрабатывают спецкурсы по обучению работе с компьютерными системами перевода.

Разработчики предлагают очередную обновленную версию X-Translator Revolution, которая функционирует на основе нового ядра перевода, что значительно улучшило качество переводов. Программа предусматривает возможность работы с шестью европейскими языками в различных комбинациях. Есть специальное приложение для перевода сообщений в программе ICQ. Возможности перевода специализированных текстов расширены за счет выпуска новых словарей по тематикам «Коммерция», «Наука», «Техника», общий словарный запас которых составляет более 250 тысяч слов и словосочетаний. Подключение словарей позволяет улучшить качество переводов контрактов, финансовых документов, научных статей, технической документации. В качестве достоинства продукта разработчики выделяют привычный для большинства пользователей интерфейс в стиле Microsoft Office 2003, а также возможность перевода электронной почты и веб-сайтов в режиме онлайн.

Помимо коммерческих разработок в области машинного перевода есть и так называемые академические. Наиболее авторитетной является система ЭТАП, работающая для комбинации русского и английского языков. Для России данная система имеет такое же значение, как ставшая классическим примером система Systran для всего мира. ЭТАП положила начало целому научному направлению, ставшему основным в российских академических разработках в области машинного перевода. Технологии системы ЭТАП (в отличие, например, от PROMT) описывались в открытых публикациях. Сравнивая эти две системы, кандидат технических наук А.Сокирко в своих публикациях оценивает результаты работы PROMT как большую ориентированность на смысловую ясность перевода в ущерб его грамматической правильности в силу того, что PROMT ориентирован на конечного потребителя. Создатели ЭТАПА, как считает А.Сокирко, напротив, уделяют много внимания грамматической правильности перевода, т.к. ЭТАП является академической разработкой и ориентирован именно на корректность полученного результата. Попытка синтезировать эти два подхода (смысловая ясность и грамматическая правильность) была предпринята группой «Диалинг» (www . aot . ru ), которая вела разработки по созданию программы машинного перевода. Данная программа отличается наличием в ней так называемого поверхностно-семантического модуля, в основе разработки которого лежит процедура семантического анализа, хорошо известная в языкознании. Алгоритмическая реализация семантического анализа осуществляется не через привычное для лингвистов толкование, а с помощью графов (т.н. семантических деревьев), в узлах которых стоят слова или единицы, равные словам по объему. Отношения графа задаются перечнем и называются семантическими отношениями (например, отношения субъект – объект, субъект – аспект и т.п.). А.Сокирко показывает, как для каждого предложения входного текста выстраиваются свои собственные семантические структуры, на базе которых осуществляется машинный перевод. Приведем пример графа из статьи А.Сокирко:


Подобные графы могут включать не только слова, но и устойчивые словосочетания и обороты, абстрактные связки, жесткие синтаксические группы (например, «двадцать два мальчика») и т.п. На базе таких семантических структур перевод осуществляется следующим образом: по русской семантической структуре выстраивается такая же английская, с английскими словами и словосочетаниями в узлах, затем по семантической структуре синтезируется цепочка английских слов, что представляет собой многоэтапный процесс, требующий определенных временных затрат. Поэтому одним из слабых мест данной системы является медленная скорость перевода.

Белорусские лингвисты А.Чистяков и А.Скребнев в своих работах уделяют особое внимание еще одной системе, в которой процесс автоматического перевода построен на математической логике и статистическом вычислении вероятности. Разработки в этом направлении, основы которых были заложены известным ученым Францем-Иосифом Охом, ведутся уже более 15 лет. Сегодня на рынке доступен один коммерческий продукт этого направления – программа автоматического перевода Language Weaver. В данной программе не используются никакие словари, содержащие готовые к употреблению лексические и грамматические данные. Программа использует только параллельные тексты (аналогичный принцип используется в Translation Memory Tools), причем объем текстов очень значителен. Программа анализирует оригиналы и переводы, где встречается отрезок текста, схожий с тем, который сейчас необходимо перевести. Сопоставив множество вариантов переводов, программа выбирает тот, который использовался чаще всего. Таким образом, программа фиксирует степень вероятности, с которой, скорее всего, следует переводить данный отрезок текста, постепенно эта степень вероятности приближается к стопроцентной. При этом отпадает необходимость загружать специализированные словари (преимущество статистического метода перед трансформационными программами), т.к. программа сама генерирует постоянно используемый словарь, который ориентирован на данного конкретного пользователя. Создатели программы утверждают, что на сегодняшний день их система обеспечивает более высокое качество перевода по сравнению с другими системами машинного перевода.

Текст, подготовленный для перевода в программе Language Weaver, может быть представлен в различных форматах текстовых и даже звуковых файлов. Собранные параллельные тексты распознаются, и происходит их совмещение на уровне предложения для создания параллельного текстового корпуса. Этот текстовый корпус обрабатывается с помощью подпрограммы Language Learner, которая определяет вероятность того или иного перевода и составляет вероятностный словарь, шаблон или правило, т.е параметры перевода. Созданные параметры используются статистическим переводчиком-декодером при переводе новых текстов.

На нынешнем этапе разработки программа работает не полностью самостоятельно. Конечный вариант оценивает переводчик и выбирает из предложенного программой набора то предложение, которое наиболее соответствует по своей коммуникативной эквивалентности оригиналу. В последующих переводах выбранное предложение используется программой как шаблон или образец.

Данная система наиболее ярко представляет собой образец развития искусственного интеллекта и уподобляется авторами процессу овладения естественным языком ребенком: вначале ребенок срисовывает буквы и слова, не понимая их значения, а затем переходит к осмысленному переписыванию слов и выражений. Таким образом, данная система машинного перевода работает не с языковым материалом (значениями отдельных слов и словосочетаний, синтаксическими правилами), а с прецедентными текстами, т.е. со смыслами высказываний, представляющими собой элементы межкультурной коммуникации. При такой работе с текстами происходит трансформация языковой оболочки смысла как культурного явления, а не самого слова как явления языкового.

Как считают авторы, с увеличением технической мощности компьютеров увеличатся возможности обработки параллельных текстов, и компьютер сможет более или менее самостоятельно устанавливать интертекстуальные связи. Возможно, что в классических текстах обнаружатся математические законы построения. В частности, еще в прошлом веке возникли разделы математики, описывающие произведения Моцарта и Бетховена математическими формулами. Возможно, компьютер сможет работать и с такими паралингвистическими знаковыми системами как интонации и мимика.

Если в будущем будет решена проблема автоматической проверки адекватности перевода, то компьютер станет полностью самообучающейся системой, способной не только переводить, но и, в каком-то смысле, порождать тексты, в зависимости от того, какой «культурный багаж» будет в нем заложен в виде параллельных текстов.

На сегодняшний день компания Language Weaver выпускает очередные обновленные версии машинного перевода, в частности версию SMTS 4.2. В отличие от других электронных переводчиков SMTS (Statistical Machine Translation Software) использует методы статистического анализа, описанного выше, для изучения предложений, фраз и конструкций и выбирает наиболее подходящий вариант перевода среди множества доступных.

Используемая в программе поддержка вывода данных в формате TMX (Translation Memory eXchange) упрощает обмен информацией между SMTS и другими системами машинного перевода. В программу встроен фильтр, который позволяет переводить документы Microsoft Office (MS Word, Excel и PowerPoint) и выводить результаты перевода в оригинальном формате.

Таким образом, многие современные исследователи приходят к выводу, что качество машинного перевода будет совершенствоваться. Большинство специалистов по информационным технологиям сходятся во мнении, что адекватный перевод любого типа тестов, самостоятельно выполненный машиной, станет реальным через 50-70 лет с развитием возможностей искусственного интеллекта.

Литература:


  1. Марчук Ю.Н. Компьютерный перевод многозначных слов, 2000. www.philol.msu.ru

  2. Семенов А.Л. Основы общей теории перевода и переводческой деятельности. – М.: Издательский центр «Академия», 2008.

  3. Сокирко А. Будущее машинного перевода. // Компьютера №21, 5.06.2002.

  4. Чистяков А., Скребнев А. Компьютерный перевод как инструмент межкультурной коммуникации. – Витебск, 2005.

Скачать бесплатную работу можно по короткой ссылке. Ознакомится с содержимым можно ниже.

Введение 5
1. Актуальные проблемы перевода 7
1.1 Понятие перевода, подходы к переводу текста 7
1.2 Виды переводов 12
2. Методы и инструменты, используемые письменными переводчиками 23
2.1 Распространенные методы для письменного перевода 23
2.2 Инструменты используемы для письменного перевода 28
2.3 Специфика работы с иноязычным текстом – «ложные друзья 32
переводчика» 32
Заключение 39
Список использованных источников 41

Перевод на данный момент – это то самое необходимое, что востребовано фактически во всех сферах общения и взаимодействия людей: новости, политика, экономика, культура и т.д. и конечно же говоря о переводческой деятельности так же важно понимать, что подходов и видов перевода, как и текста может быть очень много.
Текст – особая система символов и знаков, созданная человеком, а, следовательно, и носящий субъективный характер. Особенно важен вопрос создания текстов под влиянием различных внешних обстоятельств, что и в наше время не является чем-то сильно неизвестным. Но подобный подход сильно осложняет работу переводчиков. Так как текст может включать различного рода сложно-переводимые слова, такие как неологизмы, жаргонизмы, сленговые формы, сокращения и прч.
На сегодняшний день единицы людей не могут сказать о себе, что они не знают второй язык, еще в школе все учили либо английский, либо немецкий, иногда французский и итальянский. По сути, получается, что общество находилось в состоянии массовой потребности в знаниях других языков – хотя по факту это не так. И многим так и ни разу в жизни не посчастливилось побывать за рубежом или применить свои знания на практике.
Зато, такая политика привела к феномену так называемого «переводческого взрыва», когда люди стали работать с оригинальными текстами для себя – просто для того, чтобы почитать, а потом что бы получить информацию из первоисточника, а далее, чтобы расширить свой кругозор. Так количество людей, которые знают 2 и более языков росло, а потребность в переводе так и сохранила свои позиции.
Таким образом, тема «Особенности письменного перевода. Информационные ресурсы в деятельности письменного переводчика» довольно актуален. В первую очередь это связано с тем, что сегодня люди живут в условиях постоянного взаимодействия с иноязычными элементами и результатом такого взаимодействия оказалось формирования различных видов перевода и методы для его осуществления.
Предмет исследования – особенности письменного перевода.
Объект – письменный перевод
Целью данного исследования является описание ресурсов используемых при письменном переводе.
Задачи:
дать определение понятию перевода и подходам к переводу текста;
описать виды переводов;
охарактеризовать отличия письменного перевода от устного;
рассмотреть распространенные методы для письменного перевода;
перечислить инструменты и ресурсы необходимые для письменного перевода.
Для подготовки работы использовались публикации, учебные материалы и Интернет-ресурсы.

Подводя итог проделанной работе, можно заключить следующее:
необходимо отметить, что подготавливаясь к переводу того или иного текста переводчик должен быть готов к встречи с рядом трудностей. В частности – с отсутствием аналогов в родном языке, так как язык может включать в свой состав не только устаревшие, но и иноязычные слова, которые могут оказать не добрую службу переводчику, так называемые «ложные друзья», которые на первый взгляд понятны, а с другой стороны имеют совсем другую основу – отличную от подразумевающейся. А, следовательно, качество перевода будет зависеть от опытности и квалифицированности переводчика. И конечно же, важно учитывать и то, что значимость перевода на сегодняшний день заключается в первую очередь в том, что почти все люди на планете сегодня нуждаются в постоянном пополнении информации, и от сюда вытекает значительная заинтересованность всех стран в развитии переводческой деятельности;
перевод – это общественное явление, которое формировалось в процессе развития самого общества и в результате, на сегодняшний день он является неотъемлемой частью жизни общества. Основных видов перевода выделяют 2 – это письменный и устный перевод. Каждый из них имеет свои ответвления и характерные только для этого вида типы работы с текстом. Но как бы там ни было, к этим видам так же можно причислить художественный вид перевода. да, с одной стороны он будет относится к письменному переводу, но так же и устный перевод может быть выполнен в художественном стиле или же над художественным произведением. Но с другой стороны, необходимо отметить, что письменный перевод имеет больше положительных сторон, что выражается в широком перечне методов и инструментов используемых письменными переводчиками;
все возможные методы и способы будут сводится к тому, чтобы сделать перевод как можно более доступным, для переводящего человека, а, следовательно, будет естественным искать аналоги в родном языке переводчика или же попытаться передать смысловую нагрузку. И как было показано на примере художественного текста, именно такой подход и является наиболее приемлемым в работе с именами собственными, так как только при аналогичных вариантах возможно точное донесение смысла до читателя. Кроме того, рассмотрев методы и подходы к переводу имен собственных можно предположить следующее: трансляция, транскрипция и калькирование не всегда спасают переводчика;
не смотря на то что, сегодня у переводчиков прослеживается способность использовать большое количество приемов, методов, принципов и инструментов, для работы с текстом, выбор так или иначе будет сохраняться именно за самим переводчиком – это его личное решение и как следствие – личный путь к совершенствованию профессионализма;
специфических особенностей перевода научных текстов с английского на русский язык довольно много, но главной сложностью и спецификой работы с иностранным научным текстом является то, что многие слова в иностранном языке либо созвучны по произношению с родным языком, либо похожи на те слова, которые все знают и в результате появляется неверный перевод, так как переводчик может решить, что это слово легко переводится и переведет его неправильно. Подобные ситуации приводят к серьезным нарушениям правил перевода, отсутствию связности текста и другим проблемам, связанным с работой над научным текстом. Избежать проблем не могут даже крупные специалисты, но минимизировать их возможно, при условии аккуратного и дословного перевода.



В продолжение темы:
Android

Популярная социальная сеть ВКонтакте позволяет находить новых друзей и держать контакт со всеми близкими. Помимо этого, каждый пользователь может делиться собственными...