Машинный перевод в профессии переводчика
Автор: Kirti Vashee
Переводчик: Мария Кудинова
Редактор: Ирина Бодункова
Профессиональными переводчиками востребованы программы гибкие, простые в управлении, быстро обучающиеся и обладающие высокой скоростью обработки информации. Сейчас разрабатывается все больше новых алгоритмов машинного перевода. Например, одно из новшеств — способность переводческой программы предсказывать возможные варианты перевода, не опираясь на статистические данные.
Машинный перевод широко распространен и используется по всему миру. По самым скромным оценкам, бесплатные автоматические переводчики обрабатывают триллионы слов в месяц и используются сотнями миллионов пользователей ежедневно.
По мере роста количества пользователей Интернета, увеличивается и нагрузка на системы машинного перевода, которые делают глобальный Интернет с большим количеством контента на разных языках более доступным для пользователей. На текущий момент технологии искусственного интеллекта используются для воссоздания мертвых, искусственно созданных или исчезающих языков, носителей которых осталось мало. Это способствует глобализации использованиямашинного перевода.
Взрыв спроса на контент
Широкое использование общедоступного машинного перевода и глобальная цифровизация бизнеса свидетельствуют о возросшем спросе не только на профессиональный перевод, но и на машинный перевод высокого качества. Спрос на контент на всех языках мира растет по экспоненте, а это значит, что и объемы переводов растут так же стремительно. Со значительной его частью можно справиться с помощью тщательно оптимизированных систем машинного перевода, но в таком случае потребуется постоянно растущий штат технически подкованных переводчиков для постоянного совершенствования переводческих программ.
Обратимся к исследованиям Всемирного банка. В 2022 году объем годового интернет-трафика увеличился примерно на 50% по сравнению со значениями 2020 года и достиг 4,8 зеттабайт, что соответствует 150 000 ГБ в секунду. Рост глобального интернет-трафика и его объемы поражают.
По оценкам исследователей, объем цифровых данных, которые будут созданы в течение следующих пяти лет, более чем в два раза превысит объем данных, созданных с момента появления технологии облачного хранения. В прогнозе на 2020-2025 годы ежегодный рост объема создаваемых и реплицируемых данных в мире составит 23%. Тенденции роста трафика данных прежде всего связаны с экономическим развитием и процветанием цифровых технологий.
Взрывное увеличение объемов контента, вызванное этими тенденциями, порождает опасение по поводу нехватки переводчиков. Показательным примером сложившейся ситуации является скандал, связанный с нерелевантным переводом популярного корейского сериала «Игра в кальмара».
Поставщики лингвистических услуг и профессиональные переводчики играют ключевую роль в распространении локального контента по всему миру. Но в условиях нехватки кадров и отсутствия эффективных автоматизированных решений переводческая отрасль работает на пределе своих возможностей.
«Я могу с уверенностью сказать, что в ближайшие два-три года в индустрии переводов предложение превысит спрос», – заявляет Дэвид Ли, генеральный директор компании Iyuno-SDI, одного из крупнейших в отрасли поставщиков услуг дубляжа и создания субтитров. «Некому переводить, некому озвучивать, некому сводить — в индустрии просто не хватает исполнителей для этих задач». Лидеры ведущих переводческих компаний согласны с тем, что для большинства стриминговых сервисов наступил переломный момент. Сейчас необходимо решить, готовы ли компании пожертвовать качеством перевода, дабы перевести массу накопившегося контента в срок.
Несмотря на то, что поставщикам лингвистических услуг еще только предстоит научиться эффективно использовать программы машинного перевода, и то, что уровень оплаты труда переводчика падает, наблюдаются положительные тенденции в использовании машинного перевода.
Например, компания Translated выполняет 95% переводческих заказов с использованием программ машинного перевода и утверждает, что при этом качество перевода практически не падает. Поэтому, если для вас первостепенны такие критерии, как гибкость, простота и высокая скорость работы, и не так важны детали, то вам подойдет машинный перевод. Такой вид переводческой программы будет удобно использовать в путешествии или во время чтения зарубежных статей и постов.
Почему человечеству важно участвовать в машинном обучении
О методике Human-In-the-Loop (HItL)
Высокие требования менеджеров по клиентскому опыту к предоставлению релевантного контента клиентам предполагают большую вовлеченность человека в процесс усовершенствования машинного перевода. Все больше компаний начинают понимать, что повышение качества машинного перевода должно быть связано с повышением роли человека в автоматизации перевода. Вовлечение специалистов в процесс разработки необходимо для того, чтобы система машинного перевода более точно передавала специфику узконаправленных текстов.
Человечество всегда было обеспокоено тем, что искусственный интеллект достигнет такого уровня развития, что сможет конкурировать с человеком в профессиональной сфере переводов. Именно поэтому важно помнить о том, что язык — это краеугольный камень человеческого разума.
Появление языка является высшей точкой развития человеческого интеллекта. Это то, что отличает нас от других биологических видов. Язык лежит в основе человеческой цивилизации.
Создание машин, «понимающих» язык, стало главной целью для разработчиков искусственного интеллекта еще на этапе ранних разработок, однако эта задача оказалась крайне трудоемкой. Современные технологии машинного перевода — это результат 70-летних опытов и исследований. Именно поэтому создание машины, в полной мере владеющей языком, может либо оказаться в принципе невозможным, либо произойти в гораздо более отдаленном будущем, чем могли себе представить сторонники теории сингулярности.
Это связано с тем, что овладение машиной языком — комплексная задача: искусственный интеллект, способный понимать язык так же, как человек, будет способен к любой другой интеллектуальной деятельности человеческого уровня. Проще говоря, решение языковой проблемы означает создание искусственного интеллекта, эквивалентного человеческому. Поэтому, чтобы технологии машинного перевода совершенствовались, необходимо более целостное вовлечение человека в машинное обучение.
Еженедельно триллионы слов переводятся программами машинного перевода. Однако без человеческого контроля не обойтись. Все автоматические переводы редактируются профессиональным переводчиком.
Область применения машинного обучения постоянно расширяется. Вместе с этим растет и понимание того, что человек в этой системе необходим, потому что машине попросту не хватает осмысленности восприятия и общих способностей к познанию и пониманию — тех элементов, которые составляют разум.
В основе многих общедоступных движков машинного перевода лежат базы двуязычных предложений, которые призваны «обучать» переводческую программу. Специалисты в области искусственного интеллекта все чаще признают, что овладение языком — это действительно сложная задача. Она не может быть решена только за счет внедрения большего количества баз данных и алгоритмов. Возникает необходимость использовать другие стратегии.
Это не значит, что современные системы машинного перевода не применимы в сфере профессиональных переводов. Однако нужно иметь в виду, что такие программы необходимо использовать с осторожностью и должным вниманием, по крайней мере, до тех пор, пока машины не обретут способность здраво мыслить.
Эффективная реализация методики Human-In-the-Loop (HItL) способствует внедрению в систему больших пластов актуальных языковых данных и, как следствие, ее активному развитию.
Другой способ взглянуть на эту проблему — рассмотреть искусственный интеллект или систему машинного перевода как систему прогнозирования, а не как репрезентативную модель профессионального переводчика.
Что, если использовать уже имеющуюся информацию, чтобы получить новую?
При разработке большинства систем машинного перевода используется технология памяти перевода (использование баз данных, содержащих набор ранее переведенных сегментов текста). Такие системы берут новый текст на исходном языке и делают прогноз возможного перевода на основе загруженных в них переводческих данных. Наиболее эффективен такой машинный перевод в работе с информацией, уже содержащейся в загруженных в систему базах двуязычных текстов.
Благодаря использованию методики глубокого обучения, системы машинного перевода стали более продвинутыми в выявлении закономерностей при машинном переводе. Однако обрести осмысленность и способности к восприятию и пониманию машины смогут только в необозримом будущем.
Профессиональный переводчик, способный направить поток своего сознания в русло выполнения переводческих задач, обладает гораздо большими возможностями, чем машина. Выполнение некоторых подзадач при переводе требует вовлечения человеческого интеллекта, разностороннего жизненного опыта и осмысленности.
Квалифицированные переводчики часто обращаются к экстралингвистическому контексту. Чтобы обеспечить максимальный уровень адекватности перевода, они определяют коммуникативную интенцию и семантику текста, а также учитывают культурный контекст. Также стоит отметить, что переводчики часто обращаются к своему жизненному опыту, чтобы прочитать то, что написано между строк, и учесть это при переводе.
Согласитесь, все это кардинально отличается от подхода машин к переводу: буквального перевода слов и предложений с исходного языка на целевой. Даже такие переводческие системы, в которые загружены гигантские базы двуязычных текстов, не способны понять, как переводит человек.
Опять же, нужно помнить, что правильнее рассматривать систему машинного перевода как систему прогнозирования, а не как систему, способную понимать. Все больше задач решается при помощи моделей прогнозирования. К ним, например, относится разработка систем беспилотного управления и автоматизированных механизмов выявления мошенничества. Именно с этим связаны последние достижения в области искусственного интеллекта и машинного обучения.
И хотя прогнозы систем машинного перевода оказываются не всегда точными, они могут быть очень полезны. Системы машинного перевода постоянно самосовершенствуются, а также они обладают высокой скоростью обработки информации, а значит могут быть хорошими помощниками для профессиональных переводчиков.
За 70 лет исследований в области машинного перевода стало очевидным то, что вовлечение человека в процесс машинного обучения является одним из самых быстрых и эффективных путей улучшения систем машинного перевода.
Представленная схема наглядно показывает преимущества методики Human-In-the-Loop (HItL). Человек, оценивая и корректируя полученные варианты перевода, запускает процесс машинного обучения. Лучшие системы машинного обучения в режиме реального времени принимают обратную связь, анализируют и редактируют варианты перевода, предложенные машиной, и загружают обновленные базы данных для улучшения машинного перевода материалов узконаправленной тематики.
Скорость и удобство внедрения машинного обучения являются важнейшими факторами, определяющими ценность системы машинного перевода для переводчика. Улучшение прогностических алгоритмов системы машинного перевода имеет большое значение как для исполнителя, так и для заказчика.
Текст публикуется в ознакомительных целях и не монетизируется.