интернет-журнал о бизнесе, карьере и образовании
3 .. 5
  • Курсы ЦБ РФ
  • $ 65.31
  • 75.37
спецпроект
Альтернатива есть

Трудности перевода: 25 лет спустя

 

Разбираемся в том, как развивались программы перевода текстов и речи. Сможет ли компьютер однажды заменить переводчика? Суждено ли сбыться мечтам российского правительства об импортозамещении в сфере программного обеспечения? И каким будет искусственный интеллект будущего? О перспективах рынка машинного перевода «Понедельнику» рассказала Светлана Соколова, генеральный директор компании PROMT.

Текст: Анастасия Столбова

 

— Светлана, компания PROMT вышла на рынок в 1991 году с уже готовой программой для перевода, в то время компьютеры только появлялись, и программа была востребована. С какими трудностями вы столкнулись на старте?

— Вообще, я бы сказала много хороших слов про 1990-е, несмотря на то, что сейчас их принято ругать. Однако рыночная экономика появилась именно тогда, а без нее никаких успехов сейчас бы не было. Да, мы, как и многие другие предприниматели, столкнулись с финансовыми и юридическими сложностями: не было инвесторов, не на что было снимать офис, да банально — не было компьютеров в нужном количестве! Прибавьте к этому отсутствие опыта ведения бизнеса (правда, этого тогда никто не умел, все учились на ходу). И, конечно, пиратство.

 

 

Но при этом бизнес развивался семимильными шагами, настолько силен был потребительский «голод». Например, на одной из первых выставок нам пришлось в какой-то момент давать людям пустые коробки как гарантию того, что очень скоро сможем предложить им работоспособный продукт. Рассчитывали, что просто покажем образцы, кто-то, возможно, заинтересуется, программа на тот момент была еще не готова до конца. Но вокруг продукта начался ажиотаж, люди готовы были сразу купить программу!

— Как со временем в обществе менялось отношение к виртуальным переводчикам? Поначалу их ведь многие не воспринимали всерьез, одно дело перевести слово — а другое — целый текст. И что помогло изменить ситуацию?

— В 1950-е, по итогам джорджтаунского эксперимента, когда в штаб-квартире IBM был продемонстрирован полностью автоматический перевод 60 очень простых предложений с русского на английский в режиме реального времени, на машинный перевод возложили слишком большие ожидания. Тогда казалось, что еще немного — и компьютеры лишат работы профессиональных переводчиков. Однако разочарование пришло очень быстро, и оно имело такие масштабы, что на какое-то время финансирование исследований в области машинного перевода со стороны правительства США вообще прекратилось. Но исследования велись по всему миру, в том числе у нас в Пединституте им. Герцена, в Лаборатории инженерной лингвистики, из которой и выросла впоследствии компания PROMT.

Переломным моментом стали 1980–1990-е годы, когда у коммерческих компаний появилась потребность в быстром и недорогом переводе без посредников: началась массовая глобализация бизнеса, в России рухнул железный занавес, и надо было как-то общаться с миром. Первые программы перевода нельзя было назвать совершенными, для их развития потребовалось не только много сил и знаний, но и время. PROMT работает с технологиями искусственного интеллекта уже более 25 лет, и все это время мы непрерывно обучаем и совершенствуем наши системы. Надо понимать, что язык человека неотделим от мышления, а машина работает с данными и вряд ли будет когда-либо переводить как человек. Зато она делает это быстро, и пользователю не нужно искать переводчика, зависеть от его возможностей, сроков, обстоятельств. В последнее десятилетие произошел огромный скачок в развитии технологий, стало больше данных для анализа, появилась возможность более тонкой настройки. Изменилось и отношение людей к машинным переводчикам — люди все больше и чаще готовы использовать их в бизнесе и частной жизни.

 

 

— Что вы думаете о тренде последних лет на импортозамещение зарубежного софта? Правительство страны планирует закупать отечественное ПО для госпредприятий и служб. Как вы считаете, это хороший шанс для развития российских компаний или наоборот — это шаг назад в развитии технологий? Вообще, возможно ли импортозамещение в программном обеспечении?

— Курс правительства на импортозамещение вызывает много вопросов, да и до сих пор не видно ярких примеров успешного импортозамещения — реального, а не на бумаге. Любой продукт, создаваемый на экспорт, более конкурентоспособен: чем больше внедрений, тем эффективнее он развивается. Почти всегда одного локального рынка мало, тем более российского. Обычно приводят в пример компанию 1C. Это замечательная бизнес-идея и успешная история настоящего импортозамещения (случившаяся, кстати, еще до официального курса на него), но повторить ее очень сложно, ведь успех программ 1С на российском рынке связан, прежде всего, с особенностями российского бухучета и его несоответствием международным нормам. Мы, как и большинство игроков IT-рынка, считаем, что главной поддержкой отрасли будет не ограничение присутствия иностранных компаний в России, а сохранение льгот по страховым взносам для IT-компаний, поддержка российских компаний на международном уровне. В этом случае станет возможным «естественное импортозамещение», когда у местного бизнеса на своем рынке будет больше возможностей и меньше рисков.

— Как вы считаете, не упал ли в России интерес к программам для языкового перевода после введения санкций?

— Он не упал ни в России, ни у иностранных компаний, которые покупали российский софт. Несмотря на то, что события в политической жизни повлияли на отношение к России западных стран, на IT-рынке это практически никак не сказалось, продажи и переговоры по проектам по-прежнему есть, партнеры отношений не прерывают. У PROMT есть партнеры во Франции, Германии, Японии и других странах, с которыми компания работает более 15 лет, они не изъявили желания прервать сотрудничество, они доверяют нам как разработчикам, им нравятся наши технологии, с чего бы им его прекращать?

 

 

— Не приведет ли падение курса рубля к тому, что российские IT-компании в поисках заработка массово хлынут на иностранные рынки вместо того, чтобы воплощать в жизнь идею правительства об импортозамещении?

— Может показаться, что перспектива именно такого развития событий очень реальна — потому что рубль дешевеет, ликвидности становится меньше, а компаниям нужно выживать — как минимум платить зарплату. Кроме того, давайте не забывать, что российский IT-рынок — это 1% от общемирового, поэтому, если компания занимается продажами только в России, то это очень маленький рынок, он быстро насытится. Однако для того чтобы выйти на зарубежные рынки, мало хорошего софта, намного важнее — маркетинг, для которого требуются немалые средства. Я бы сказала, что в структуре стоимости продукта 20% — это создание самого продукта, а 80% — это расходы на маркетинг. И здесь мы возвращаемся к той же проблеме — где взять средства на зарубежный маркетинг в условиях дешевеющего рубля.

Года три назад российский рынок IT стал впервые показывать отрицательную динамику, так что для многих ориентация на зарубежные рынки — чуть ли не единственно возможный спасательный круг. Есть еще и бизнес-эмиграция, например, в Эстонии сейчас образовалась плотная коммуна IT-специалистов, которые используют Прибалтику как перевалочный пункт, чтобы уехать дальше, в ЕС или США, где их труд оплачивается выше, а у компаний больше перспектив и меньше рисков. Бизнес ведь очень чувствителен к экономической и политической ситуации.

 

 

Что касается PROMT, то да, мы нацелены на то, чтобы работать активнее не только с российским рынком, но и с зарубежными рынками. Правда, это непросто. Во-первых, выше конкуренция, во-вторых, особенности ведения бизнеса, ментальность.

— Один из ваших конкурентов Google и его онлайн-переводчик, как вам удается конкурировать с такой крупной компанией?

— В сегменте b2b в России у нас прямых конкурентов нет, так как нет других поставщиков корпоративных решений для автоматического перевода тестов и документов целиком, для установки в корпоративную сеть или интеграции в бизнес-приложения, с возможность адаптации решения под задачи клиентов — и все это для 20 языков, включая европейские и азиатские языки. А среди онлайн-сервисов конкуренция очень высокая. Конечно, это Google, «Яндекс», компании, у которых есть собственные поисковики и которые создали свои сервисы перевода, чтобы привлекать и удерживать аудиторию. С одной стороны, они способствовали популяризации машинного перевода, с другой — сделали так, что машинный перевод стал ассоциироваться с чем-то обязательно бесплатным. Мы делаем ставку на постоянное повышение качества, это позволяет нам в чем-то обходить Google.Translate и других конкурентов. Уже четыре года подряд, с 2013-го по 2016-й, мы получаем лучшие оценки экспертов за автоматический перевод с английского языка на русский на семинаре по автоматическому переводу под эгидой международной Ассоциации компьютерной лингвистики (ACL). Для сравнения результатов перевода используются системы, созданные университетскими лабораториями со всего мира (из Англии, Германии, Швеции, Индии других стран), коммерческие системы, а также организаторы используют переводы, полученные на известных онлайн-сервисах — «Яндекс», Google, Bing.

— Есть ли у вас статистика, тексты какой тематики пользователи вашего онлайн-сервиса чаще всего хотят перевести с русского на английский, а какие с английского на русский?

— Да, мы постоянно анализируем эти данные. В этом году 31% пользователей сайта Translate.ru переводили с русского на английский свои личные переписки, 23% пользователей переводили деловые переписки, около 20% — делали домашние задания по английскому языку. В 2010 году, например, по учебе запросов было больше. Сейчас вырос процент обращения пользователей за деловой перепиской, и появилось новое направление — онлайн-шопинг. В основном это претензии к товарам и вопросы по доставке. Спецификой именно русско-английского направления стало появление огромного количества запросов по переводу шуток и постов из социальных сетей.

 

 

Если брать переводы с английского на русский, то сейчас основные темы по популярности — это учеба, онлайн-покупки, личная переписка, бизнес. Лет пять назад картина немного отличалась: на первом месте стояла личная переписка, на втором — общие темы, третье место — онлайн-покупки, затем шли бизнес-тематика, компьютерная терминология, техника.

Популярность тем очень сильно зависит от сезона и от культурной и политической обстановки. В 2014 году случилась аннексия Крыма, мы получили резкий скачок запросов по этой теме. Есть и сезонный показатель — перед Новым годом и Рождеством резко возрастает количество запросов на перевод тематических слов.

— Светлана, а кто ваш клиент?

— У нас есть продукты как для частных, так и для корпоративных пользователей, есть серверные и мобильные решения для разных платформ. Необходимо упомянуть и наш бесплатный сервис онлайн-перевода Translate.ru, который вообще был первым в Рунете онлайн-переводчиком. Большинство частных пользователей сегодня — это пользователи сервиса и мобильных приложений Translate.ru и PROMT Offline. Что касается корпоративных клиентов, то в основном это средние и крупные российские и зарубежные компании, которые работают на международных рынках и выбирают наш главный продукт — PROMT Translation Server. Например, PROMT в свое время делал переводчик для астронавтов NASA на международной космической станции, сейчас мы работаем с такими гигантами, как PayPal, Cisco, Tripadvisor, Amadeus и другие. Из российских это ЛУКОЙЛ, «Газпром», «Лаборатория Касперского», МТС — список внушительный. Кроме продажи готовых решений, у нас есть и проекты, требующие создания новых разработок для заказчика: например, решение для перевода поисковых запросов в разноязычных базах данных или сервис SMS-перевода для абонента.

 

 

Недавно выпустили новый продукт — PROMT Cloud API. Он представляет собой облачный сервис с помесячной оплатой, который компания может легко интегрировать в свой проект или сайт. Очень надеемся, что он заинтересует разработчиков мобильных приложений и владельцев сайтов.

— Какие тренды в машинном переводе вы отмечаете в последнее время? Какие языки сейчас наиболее популярны?

— Основной тренд — это «мобилизация», использование облачных технологий и голосовой перевод. Сегодня переводчик, как и многие другие удобные инструменты, должен быть «под рукой», то есть в смартфоне или планшете, данные могут храниться в облаке, чтобы можно было синхронизировать их между устройствами, еще один тренд — перевод не текста, а речи.

 

 

Что касается популярных языков, то в России около 85% пользователей нуждаются в переводе с английского и на английский. На втором месте — немецкий и французский. Набирают популярность азиатские языки, хотя их доля по сравнению с английским все-таки очень мала.

— Отмечаете ли вы рост популярности китайского языка? Как-то планируете расширять услуги и сервисы в этом плане?

— Мы наблюдаем большой интерес к лингвистическим технологиям в целом — это и бизнес, и онлайн-обучение, и интернет вещей. Сейчас наша компания много работает над решениями для корейского, арабского, турецкого и китайского языков, это одно из стратегических направлений. Недавно стали работать с крупнейшим дистрибутором и провайдером технологических решений на Азиатско-Тихоокеанском рынке Chuanhow Technologies.

Что касается популярности азиатских языков, то, если судить по данным нашего онлайн-сервиса, то наиболее востребован турецкий язык. Видимо, Турция нам пока ближе, чем Китай (смеется).

— А что скажете о качестве перевода текстов при машинном переводе? Насколько такие переводы адекватны, насколько им можно доверять, в каких сферах можно использовать? Например, у Google Translate переводы иногда могут быть довольно забавными.

 

 

— Надо понимать, что сравнивать машинный перевод с «человеческим» нецелесообразно — у них разные возможности и задачи. Машина не способна на художественный литературный перевод, да и в принципе не должна этим заниматься. Хотя бывают забавные истории, когда машинный перевод литературного текста используется как художественный прием. Например, недавно была заметка про постановку режиссером Юрием Клавдиевым в Театре наций пьесы «Заводной апельсин», которая была «пропущена» через Google Translate, и, по словам режиссера, обрела таким образом новое звучание. Аналогичная история была 12 лет назад в киевском Центре театрального искусства имени Леся Курбаса. Режиссер Александр Остапенко использовал перевод PROMT для работы с текстами Шекспира, дабы сохранить аутентичность текста.

Машинный перевод — это инструмент, поэтому важен не только сам инструмент, но и то, в чьих он руках. Многие сайты публикуют «забавные» примеры перевода, выполненные с помощью машинных переводчиков, но, во-первых, мы не всегда знаем, что в оригинале, во-вторых, это как раз использование переводчика «as is», без контроля за результатом. Наверно, ничего страшного, если такой перевод делает мелкий торговец, чтобы привлечь внимание туристов, но бывают и неприятные истории. В мае этого года интернет облетела история про нерадивых сотрудников Министерства энергетики Белоруссии, которые прислали своим литовским коллегам документ «Оценка воздействия Островецкой АЭС на окружающую среду», переведенный автоматическим переводчиком без последующей редактуры и содержащий множество грамматических и смысловых ошибок.

Преимущество машинного перевода очевидно: ввел текст — и сразу есть результат, плохой или хороший, но есть. Это создает иллюзию (до сих пор!), что больше ничего не надо делать. Однако для гарантированно качественного перевода нужна настройка самой системы на конкретную тематику со специфической лексикой, и тогда получаются специализированные решения для перевода разных текстов. В случае с машинными переводчиками все как у людей: один после обучения и многих лет практики хорошо переводит техническую документацию, другой — тексты на медицинскую тематику, а третий специализируется на экономике. У нас неслучайно есть линейка отраслевых продуктов — для IT, для нефтегазовой отрасли, для медицины: все эти переводчики настраиваются и обучаются на текстах определенной тематики.

— Насколько для PROMT актуальна тема пиратства? Насколько сейчас развит пиратский рынок и как вы боретесь с этим явлением?

— У нас к этой проблеме философский подход, мы понимаем, что это некоторая неизбежность и эффективных методов борьбы практически нет, хотя стараемся хоть немного усложнять процесс взлома наших решений. Десктопные продукты для Windows и Mac OS X взламывают, увы, часто, и процент использования нелицензионных программ будет в ближайшее время, скорее всего, расти. В условиях нестабильной экономики люди будут стараться снижать затраты.

 

 

Хотя нельзя не отметить, что в последнее десятилетие пользователи стали осознаннее, в России стала развиваться культура потребления лицензионных виртуальных продуктов — музыки, фильмов, программ. Кроме того, появилось много продуктов с тестовым доступом или ограниченными опциями, которые можно протестировать и понять, подходят ли они, прежде чем купить полную версию. Это также снижает уровень пиратства и повышает лояльность потребителей.

— Вы говорили, что вот уже 25 лет работаете над созданием искусственного интеллекта, что вам удалось сделать в этом направлении и каким вы видите искусственный интеллект будущего?

— Мы гордимся, что нам вместе с другими специалистами в области компьютерной лингвистики из разных стран мира удалось создать реально работающие технологии искусственного интеллекта, которыми сегодня пользуются миллионы людей во всем мире. Еще с момента постановки вопроса об искусственном интеллекте в середине XX века, машинный перевод выделялся как одна из актуальнейших задач в этой области. Сейчас можно смело сказать, что эта задача решена — компьютер переводит, и люди пользуются результатом, это неоспоримый факт. Однако нужно еще многое сделать для улучшения работы наших систем, и мы активно этим занимаемся.

Разработанные нами технологии анализа текста, которые лежат в основе наших систем перевода, открывают уникальные возможности для работы над еще одной задачей, которая всегда исторически относилась к области искусственного интеллекта. Это задача понимания смысла текста. В этом направлении мы тоже активно работаем, и уже есть первые прототипы. Технологии искусственного интеллекта, связанные с лингвистикой, в ближайшее время будут развиваться еще интенсивнее. Во всяком случае, сейчас со всех сторон поступает информация о новых достижениях и планах в этой области.

— Как вы считаете, как может измениться рынок лингвистических IT-решений в ближайшие несколько лет?

— Будет появляться больше решений для работы с Big Data, бизнес учится извлекать из данных прибыль, и ему нужны соответствующие инструменты. Несмотря на наличие многих революционных технологий, и бизнес, и государственные институты нуждаются в эффективных продуктах для работы с информацией. PROMT недавно начал работу в большом международном проекте DANTE по созданию платформы по поиску, обработке и анализу информации, связанной с терроризмом, и интегрирует туда свое решение, адаптированное для перевода пользовательского контента и устной речи. Куда еще может пойти развитие технологий — так это в сторону социальных сетей, переводчиков для устной речи.

 

 

Есть явный тренд на голосовое управление мобильными девайсами. То же самое ждет переводчики: есть программы распознавания речи и превращения ее в текст, а если есть текст, то его можно автоматически перевести и потом озвучить. Правда, есть сложность в том, что распознанная устная речь сильно отличается от письменной, там множество нюансов, и нужно будет адаптировать технологии перевода. Такие проекты мы в PROMT уже реализовывали — настраивали наш переводчик с английского, испанского, французского на русский для перевода автоматически записанной речи дикторов новостей. Но массовое их использование еще впереди.

Следить за комментариями этой записи   
Войдите с помощью или , чтобы оставить комментарий

Свежие статьи

Осторожно, бизнес закрывается

Осторожно, бизнес закрывается

Как пережить закрытие проекта и двигаться дальше?

21 марта 2019 0 7
Повод для счастья

Повод для счастья

Почему можно ли быть счастливым, находясь на рабочем месте?

20 марта 2019 0 52
Не просто translate

Не просто translate

Как устроено бюро переводов: темы, сроки, ответственность.

19 марта 2019 0 40