Регистрация

ABBYY SmartCAT: от переводчика к постредактору

26
0
1 956 0
Аудио Текст
6 мая 2014

Объем ежедневно генерируемого в мире текстового контента растет лавинообразно. А вместе с тем усиливается потребность в инструментах, повышающих производительность труда переводчиков. О том, какова сейчас ситуация на рынке переводов, рассказывает Иван Смольников, генеральный директор компании ABBYY Language Services.

Из передачи вы узнаете:
— каковы сейчас объем и ландшафт мирового рынка профессиональных переводов;
— почему не всякий перевод должен соответствовать качеству «приемлемо для публикации»;
— что такое CAT-системы и для каких типов контента их использование наиболее эффективно;
— в чем суть технологии Translate Memory и каковы границы ее применимости;
— в связи с чем стоимость перевода в обозримом будущем будет только падать;
— заменят ли постредакторы профессиональных переводчиков;
— как системы автоматизированного перевода повлияют на рынок труда;
— и многое другое.

Сергей Иванов: Здравствуйте, друзья! В эфире программа «Бизнес online», с вами я, Сергей Иванов. Объем ежедневно, точнее, ежесекундно генерируемого текстового контента растет лавинообразно. Поэтому требуется качественная интенсификация труда переводчиков. О том, какие технологии сейчас правят бал на этом рынке, мы поговорим с генеральным директором компании ABBYY Language Services Иваном Смольниковым. Иван, привет!
Иван Смольников: Привет, Сергей!

Иван Смольников, генеральный директор ABBYY Language Services.
Родился в 1982 году в городе Свободный.
В 2004 году с отличием окончил Московский физико-технический институт по специальности «прикладная физика и математика».
В 2004 году совместно с партнерами основал компанию «Переведем.ру». В 2007 году стратегическим инвестором «Переведем.ру» стала компания ABBYY.
В 2007 году стал генеральным директором компании ABBYY Language Services.

С. И.: Иван, для начала хочу узнать, каков объем рынка переводов в мире? Как-то ты можешь измерить его деньгами?
И. С.: Рынок достаточно большой. Большинство людей обычно удивляется, когда узнает. Сейчас его оценивают более чем в 30$ млрд. И Россия здесь, конечно, играет не самую главную роль, потому что объем международного бизнеса в России не столь велик, как, например, в США. Поэтому Россия — это несколько процентов из этих 30$ млрд, а больше всего бизнесов сконцентрировано в США либо в странах Западной Европы.
С. И.: Зачем же США так много переводить, ведь английский — язык международного общения?
И. С.: Международная компания, скажем Coca-Cola, переводит много технической документации, маркетинговой, всякие интерфейсы к ПО, которые локализуются на все страны, где торгует Coca-Cola. Coca-Cola может, я думаю, переводиться на десятки языков, может быть, даже на 80 или 100, покрывать буквально все существующие языки. Это глобальная корпорация, которая продает свои продукты по всему миру. Именно этим обусловлена потребность.
С. И.: Поговорим о качестве перевода. Часто при оценке качества перевода приходится сталкиваться с термином «пригодно для публикации». Что вкладывается в это понятие?
И. С.: Вообще, конечно, любой текст люди оценивают по-разному. Сколько людей, столько и мнений. Несмотря на то что мы с тобой носители русского языка, мы будем смотреть на один и тот же текст и по-разному его оценивать. Хотя он может быть грамматически корректен и в целом без каких-то грубых ошибок. Тем не менее на рынке есть некоторые метрики, которые выработались за годы. Это количественная оценка качества перевода, а не просто «нравится — не нравится». Количественная оценка определяется по набору критериев: терминологических, грамматических, стилистических и т. д. Говоря о качестве переводов для публикаций, обычно имеют в виду наивысшее качество, которого только возможно достичь. Потому что если текст, который переведен, призван донести идею компании до широкой аудитории, он должен быть максимально высокого качества. Но существует много типов перевода, когда текст используется для других нужд. Например, для внутренней переписки, для внутреннего согласования, просто для быстрого понимания того, что содержится в документе. И в этом случае совершенно не обязательно «вылизывать» текст до уровня, о котором ты сказал.
С. И.: Лишь бы он был читабельным и понимаемым, да?
И. С.: Да. Лет пять-десять назад на рынке говорили, что перевод всегда должен быть абсолютно идеальным. Но, как ты сам сказал, объемы контента растут. Если бюджеты будут прогрессировать с той же скоростью, то никаких денег не хватит на то, чтобы весь этот контент перевести. Поэтому компании вынуждены думать о том, как снижать издержки и как переводить быстрее. Поэтому, если какой-то текст предназначается не для публикации, зачем тратить на него в два раза больше усилий, если можно потратить меньше и получить результат быстрее, ознакомиться быстрее и потом уже решить, надо его «вылизывать» или нет.
С. И.: Мы заговорили о бюджетах и трудозатратах. А правда ли, что сейчас большая часть переводчиков пользуется так называемыми CAT-системами? Можешь рассказать, что стоит за этим понятием?
И. С.: Совершенно верно. Это computer-assisted translation, автоматизированный перевод… Не полностью автоматический, когда машина что-то делает за человека.
С. И.: Да, интересно понять разницу!
И. С.: В основе автоматизированного перевода лежит технология Translation Memory, «память переводов». Когда переводчик единожды что-то перевел, это сохраняется в некоей базе данных. И потом, когда переводчик сталкивается с аналогичным предложением повторно, оно может быть ретранслировано из базы данных и предложено ему в качестве варианта. Таким образом, если что-то единожды было переведено, оно сохранилось, и в следующий раз его можно «переиспользовать». Таким образом можно снизить затраты, можно переводить быстрее и на самом деле качественнее. И это, собственно, основа технологии Translation Memory и CAT-систем, о которых ты упомянул.
С. И.: На днях вы объявили о выходе из бета-версии вашей новой системы SmartCAT. Расскажи, пожалуйста, нам, какие функции она включает и, самое главное, чем отличается от других систем?
И. С.: Мы очень долго к этому шли. Там много интересных вещей, которые, на наш взгляд, на данный момент пока еще не реализованы другими участниками рынка. Начнем с того, что система «облачная», она не требует развертывания тяжеловесного ПО, каких-то специалистов, которые настроят что-то, каких-то серверов, которые нужно купить и т. д.
С. И.: Все мощности находятся у вас.
И. С.: Текущие решения лидеров рынка в данной области таковы, что их нужно реально разворачивать у себя: купить какой-то сервер, разобраться в какой-то поддержке, иметь каких-то специалистов. Если мы говорим о переводчике, то ему со всем этим непросто работать. Если мы говорим о небольшой переводческой компании — а большинство компаний на переводческом рынке небольшие, — то у них просто нет этих возможностей: купить дополнительный сервер, развернуть что-то, поддерживать и т. д.
Вторая история, которая очень важна для современного рынка перевода, состоит в том, что переводчики работают в основном удаленно, внештатно, по всему миру. Ведь основной принцип правильной локализации на иностранный язык состоит в том, что переводчик должен быть носителем целевого языка. Если мы переводим с английского на вьетнамский, то группа переводчиков должна быть во Вьетнаме, а не в России и даже не в Америке. Дальше возникает вопрос: как этим всем переводчикам дать доступ к твоей централизованной системе, где у тебя лежат все базы Translation Memory, глоссарии, еще какие-то лингвистические активы? Это некоторая проблема. Нужно этому переводчику дать какой-то клиент, который будет коннектиться к какому-то серверу у тебя, который стоит в России, например, или в Америке, научить его этим пользоваться, установить и т. д. В «облачной» системе можно дать доступ через браузер. Нужно увеличить в проекте количество участников-переводчиков до двухсот? Пожалуйста: открываешь двести новых лицензий. Люди регистрируются, коннектятся и начинают участвовать в проекте. Это очень важно для современного мира перевода, потому что объемы нарастают. И проектов, когда нужно, чтобы работал не один переводчик и не десять, а двадцать, тридцать или сто, становится все больше. При этом нужно иметь возможность масштабировать быстро. Сегодня тебе нужно сто лицензий, а завтра — двести. Если покупать их у классического игрока рынка, получится очень дорого. Ты не можешь купить с запасом. Это безумные деньги для переводческой компании. А наша идея состоит в том, что количество лицензий должно быть неограниченно, стоить они должны дешево и подключаться за две секунды. Это базовое преимущество. Про всякие уникальные фичи я еще даже не начал говорить. Если очень кратко, то в системе подразумевается возможность совместной работы, очень быстрой и эффективной.
С. И.: Ну, если у вас «облако», то нельзя не использовать преимущества «облака», да.
И. С.: Да. Удивительный факт состоит в том, что первые «облачные» продукты начали появляться на рынке полтора года назад, и до сих пор не все они реализовали возможность одновременной работы. Они банально работают следующим образом: вот у тебя есть проект, ты даешь один кусок одному переводчику, другой — другому.
С. И.: Я именно так себе и представлял почему-то.
И. С.: Они практически друг о друге ничего не знают, они максимум через единую централизованную базу Translate Memory синхронизуются как-то. Но идея вся состоит в том, чтобы все переводчики работали одновременно и видели вклад другого участника, могли его «переиспользовать». Если у нас документ на тысячу страниц, то неплохо, чтобы Вася, который переводит страницы с 950-ю по 1000-ю, «переиспользовал» то, что его коллеги уже «напереводили» в начале проекта.
С. И.: А например, если я перевожу этот термин одним словом, а другой человек —иначе…
И. С.: Совершенно верно! Здесь как раз, что касается одновременной работы, подразумевается следующее: мы реализовали возможность того, чтобы редактор мог приступить к проекту сразу же. Это, в общем, не реализовано в других системах на данный момент. Редактор начинает работать сразу за переводчиком, фиксируя те вещи, которые могут «переиспользовать» другие участники проекта.
С. И.: А все остальные участники видят зафиксированные моменты?
И. С.: Да-да. Они имеют доступ только к тому, что, например, уже одобрено редактором. Так же используется единое хранилище терминов. Это работа с терминологией. Мы можем подготовить глоссарий до начала работы и сделать так, чтобы переводчики не смогли переводить термин иным образом, нежели зафиксировано в глоссарии. И когда он начинает переводить определенный термин, ему уже выводится подсказка, говорящая о том, что этот термин есть в глоссарии, его нужно переводить таким образом.
С. И.: Среди всех вариантов выбираем только этот.
И. С.: Да. Кроме того, можно в процессе добавлять термины в глоссарий, и редактор будет их фиксировать. Это тоже реализовано.
С. И.: Наряду со SmartCAT ваша компания поддерживает и другие «облачные» проекты, такие как «Переведем.ру», Lingvo.Pro. Они будут интегрированы в SmartCAT как отдельные инструменты?
И. С.: Обязательно!
С. И.: А какие еще из существующих инструментов туда войдут?
И. С.: Скажу пару слов о «Переведем.ру». Сложно сказать пару слов, потому что это то, с чего мы начали бизнес десять лет назад. Это был первый проект, это наше детище, которое мы лет пять или семь назад оставили, и оно не развивалось совершенно. И вот сейчас мы, наконец, его обновили с точки зрения дизайна, интерфейсов…
С. И.: С использованием других технологий, насколько я понимаю?
И. С.: Да, с использованием технологий совершенно другого уровня на back-end, на work-flow, который происходит именно на той стороне производственного процесса. Не то, что клиент видит, а то, как это выполняется. И, собственно, этот back-end, этот work-flow и основан как раз на SmartCAT. Точно так же, как, например, Coursera. Если ты заходишь на сайт, ты видишь некоторый интерфейс, где люди, рейтинги, видно, как последний перевод пришел. Это клиентский интерфейс, front-end. А есть back-end — где волонтеры, которые делают этот перевод, переводят. Там можно залогиниться и посмотреть, как это устроено. Основа практически на 85% повторяет то, что есть в SmartCAT. Точно так же на «Переведем.ру». Переводческий back-end полностью будет основан на SmartCAT. Возвращаясь к истории «Переведем.ру»: почему лет пять или шесть назад мы ее оставили, так сказать, до лучших времен?
С. И.: Потому что время не пришло.

И. С.: Мы поняли, что с «Переведем.ру» немножко опередили время. В то время была пара стартапов, которые делали аналогичный сервис, и они все благополучно умерли. Они жили на венчурные деньги, а мы, к счастью или сожалению, в то время просто не знали, что такое венчурные фонды и венчурные деньги. Мы начали зарабатывать в классическом сегменте, там, где рынок был в тот момент. И оставили эту идею до лучших времен, пока везде не появилось стабильное покрытие интернетом.

С. И.: Сколько же проектов погибло из-за того, что «выстрелило» не в свое время и пытались развиваться против течения!
И. С.: Совершенно верно. Тогда мы не только не знали, что такое венчурные фонды, мы тогда еще не знали и того, что такое «облачные» технологии. В 2010-2011 годах появилось понятие «облако», стало ясно, как это нужно делать. Теперь понятно, как сделать так, чтобы переводчики сидели в онлайне. Пришел заказ от клиента, он тут же рассчитал, показал им стоимость, и клиент сразу видит, как пошел прогресс. Нет больше этих звонков: «Алло, бюро переводов? Можете мне перевести что-то? А покажите расчет стоимости». Нажал одну кнопку — и процесс пошел прямо в онлайне. Но тогда это была фантастика. Мы именно так тогда это хотели сделать. Но когда столкнулись с автоматизацией не только front-end, но и back-end, то поняли, что поднять это просто не можем. Нереально было перенести все эти тяжелые технологии типа Translation Memory, управления терминологией в «облако», которого нет, с переводчиками, которые подключены через ADSL-модемы в лучшем случае. А тогда еще и диалап был жив. В общем, стало понятно, что это утопия. Поэтому сейчас наступил ренессанс для сервиса «Переведем.ру». Про Lingvo.Pro была вторая часть вопроса?
С. И.: Да.
И. С.: Lingvo.Pro — это выделенное решение, которое нацелено на управление терминологией. Когда клиенту не нужен весь комплекс решений, о которых мы сейчас говорили: Translation Memory, Machine Translation, SmartCAT, — а нужно просто управлять терминологией. Чтобы термины на разных языках были доступны всем сотрудникам, кто работает с контентом. Это выделенный кусок, который отчасти входит в SmartCAT, оформленный в виде отдельного продукта. Если ты пользуешься всей платформой, то у тебя управление терминологией там будет. Вот что такое Lingvo.Pro.
С. И.: Насколько я знаю, ABBYY Language Services используют собственную технологию Translation Memory?
И. С.: Да, абсолютно верно.
С. И.: Но ведь существуют мировые стандарты, открытые системы. Почему вы пошли именно своим путем?
И. С.: Качественных систем Translation Memory на OpenSource в данный момент на рынке нет. Есть стандарт качества. Качество технологии Translation Memory определяется определенными параметрами, в частности, как хорошо ты находишь эти совпадения. И в этом плане наша система по качеству точно не уступает никому. Но качество базовой технологии для пользователя очень сложно ощутимо до тех пор, пока все хорошо, пока она работает, как ожидается. Наша работает так, как ожидается, или даже немного лучше. Но взять чье-то и «переиспользовать» — просто не было такой возможности, и нет ее до сих пор. Нужно было свою создать. И в этом одна из ключевых затрат на R&D — сделать хорошую качественную базовую технологию так, чтобы она быстро функционировала в «облаке» при многопользовательской работе. Это одна из важнейших задач, которые мы решали. Интерфейсы потом навесит» тоже непросто, но это все-таки проще, когда критический момент пройден, когда технология перенесена в «облако» и хорошо работает.
С. И.: Перейдем к любимой теме наших передач — к деньгам. Какова будет модель монетизации SmartCAT?
И. С.: Тут есть несколько интересных путей того, как мы планируем двигаться в этом направлении.
С. И.: На ум приходит абонентская плата, но….
И. С.: Да, это модель подписки, когда клиент не платит сразу какую-то большую сумму денег, не поняв, какой будет ROI, какой возврат инвестиций. Он платит очень небольшую сумму денег ежемесячно или, если это крупный корпоративный клиент, в лучшем случае ежегодно.
С. И.: Вне зависимости от объема перевода?
И. С.: Мы думаем, что да, что это будет определяться количеством переводческих лицензий, которые работают у него в проекте.
С. И.: Что такое «количество переводческих лицензий»?
И. С.: Ну, например, клиент компании Х использует в своей работе сто переводчиков. Вся прелесть «облачной» системы будет состоять в том, что, например, можно выбрать минимальное количество per-seat licenses, когда покупается лицензия на рабочее место. Клиент может купить сто рабочих мест, но если завтра ему понадобится 150, то для этого не нужно обязательно покупать эти 50 мест в полную собственность! Ты, по сути, арендуешь их. Вся работа по подписке — это некоторая аренда рабочих мест. Ты можешь купить эти дополнительные 50 на один месяц, например.
С. И.: Да, я понял, мы сравниваем с «коробочными» версиями, которые покупаешь раз и навсегда.
И. С.: Еще есть один интересный момент, который мы уже начали реализовывать и который считаем основным трендом 2014 года для нас. Он состоит в том, что внештатным переводчикам специальную версию продукта для фрилансеров мы планируем раздавать бесплатно. Если ты внештатный переводчик, на сегодняшний момент у тебя есть несколько вариантов выбора. Ты можешь либо бесплатно получить очень ущербный, условно, продукт с очень ограниченным функционалом, либо купить достаточно дорогостоящий продукт в собственность. Есть модели и по подписке, они уже появились, но их тоже придется купить за деньги. Мини-революция, которую мы хотели бы совершить, состоит в том, что мы планируем абсолютно бесплатно дать переводчикам профессиональный продукт с полным набором функций, который только существует на рынке, и еще с некоторой тележкой того, чего на рынке не существует.
С. И.: И в какую же сумму обойдется тем счастливчикам, которые будут работать со SmartCAT, его использование?
И. С.: Это десятки долларов. Не единицы, но и не сотни. Десятки долларов за одну лицензию в месяц. 100, 200, может быть 300 долларов, в зависимости от уровня и функционала, в год для одной рабочей лицензии. Это совершенно точно меньше, чем просят на рынке в данный момент.
С. И.: Получается, что вы рассчитываете на действительно массовое внедрение и широкое распространение системы. И возникает вопрос, за какое время вы собираетесь «отбить» собственные вложения?
И. С.: Это интересный вопрос.
С. И.: Интересный. Это высокотехнологичный продукт, стоимость которого будет достаточно невысока. Все понимают трудности массового распространения, даже чудесным вещам требуется определенный период, определенное преодоление недоверия.
И. С.: Это, конечно же, будет зависеть от той скорости, с которой у нас получится двигаться. И мы, конечно же, сейчас говорим не только о российском рынке. Вообще, ABBYY уже 15 лет как международная компания.
С. И.: Мы даже специальную передачу проводили по поводу того, как правильно устраивать экспансию на мировые рынки, на примере ABBYY. Это про вас, да.
И. С.: Это правда, потому что не так много в России компаний, которые смогли, оставаясь российской компанией, уверенно себя чувствовать на иностранных рынках и получать существенную часть своего дохода, даже больше половины, с иностранных рынков. ABBYY Language Services, следуя за материнской компанией, идет по тому же пути. Мы делаем все возможное, чтобы быть международной компанией.
С. И.: Система переводит как с иностранного на русский, так и на все остальные?
И. С.: Конечно.

Translation Memory у нас сейчас работает, по-моему, для 80 или 100 языковых пар. Мы подключаем разные движки машинного перевода, несмотря на то что у нас есть свой собственный. Мы не будем занимать позицию «используйте только наш». У любой компании, у переводчика будет возможность использовать другие движки, если мы сами считаем или они считают, что для конкретной языковой пары или тематики они дают более высокое качество.

Поэтому система SmartCAT абсолютно международная, подразумевается для продвижения на иностранных рынках, прежде всего для рынка США, наряду, безусловно, с приоритетом для рынка России, который у нас есть всегда.
С. И.: Тем не менее самый богатый и самый активный рынок упускать нельзя.
И. С.: Конечно. Там, безусловно, будет совсем другая «война». Если в России на данный момент нет ни одной компании, которая обладает всем набором технологий собственного перевода, то там есть очень крупные компании, которые себя неплохо чувствуют. При этом продукта такого же класса, мы считаем, на данный момент нет. Но это не значит, что он не появится завтра. Вот мы сейчас разговариваем, а завтра наш ближайший конкурент объявит, например, дополнительные три функции, которые сделать сложно, но ему удалось. Там конкуренция будет, конечно же, гораздо более ожесточенной.
С. И.: Будет ли уменьшаться стоимость окончательного перевода по мере накопления текстовых сегментов?
И. С.: Конечно.
С. И.: Да? То есть себестоимость сама по себе будет падать, да?
И. С.: Это самая главная ценность, которую получает клиент. Смотри, у тебя есть, допустим, договор. Ты только начинаешь свою деятельность, только начинаешь вести бизнес. У тебя пока нет никакой базы Translation Memory. Тебе нужно сначала его перевести с нуля. Экономия за счет технологии Translation Memory на этом этапе будет равна нулю, а Machine Translation можно, в принципе, использовать уже сейчас. Но когда ты переведешь первый договор, потом второй, третий, у тебя начнет накапливаться база Translation Memory. И это означает, что когда ты будешь переводить десятый, то…
С. И.: … фактически даты подставить.
И. С.: Если ты не сильно поменял договор, то буквально так — подставить даты. Иногда бывает очень смешно — люди присылают договор и говорят: «Ой, переведите, он очень большой, сможете это сделать до утра?». Мы пересылаем его через два часа и говорим: «Слушайте, ребята, мы тут даты заменили, корректор уже проверил, с вас 50 руб.». У людей шок! Мы стараемся объяснять, как работает технология и какую ценность от этого получает клиент. Поэтому мы всегда рассказываем, сколько они сэкономили и как так получилось. У нас есть статистика, что у клиента стоимость снижается на 70% по отношению к тому, с чего мы начали. Потому что накопилась база Translation Memory и постепенно эти 70% вырисовываются просто автоматически.
С. И.: Какие требования к квалификации переводчика требуются для получения того самого приемлемого для публикации перевода при работе со SmartCAT?
И. С.: Людей, которые хорошо подготовлены, из вузов выпускается крайне мало. Их часто учат всяким теоретическим вещам, практическим — в меньшей степени. Мы хотим наш SmartCAT дать вузам бесплатно, дабы они начали в своем учебном процессе людей учить тому, как на практике работает отрасль в данный момент. Потому что выходят люди, которые просто не понимают основ того, как качественно переводить: что нужно использовать отраслевую терминологию, что она должна быть единообразна в переводе и т. д. Поэтому, конечно, когда мы говорим о переводе с качеством для публикаций, то обычно требуются люди с реальным опытом, проверенные боем, так сказать. Мы обычно, конечно же, возьмем, но дадим некое количество тестов, которые потом внимательно, до буквы, разберем нашим отделом контроля качества. Он даст свою обратную связь, расскажет и т. д. Это кропотливая работа по выбору людей, демонстрирующих хорошее качество перевода, который потом можно отредактировать. Профессиональная компания никогда не будет сдавать клиенту перевод, который не отредактирован. Если, конечно, это не оговорено заранее и, как мы говорили, перевод не предназначен просто для понимания или внутреннего использования. Тогда можно сэкономить время, деньги и просто отдать сырой контент после переводчика или даже вообще после машины, просто чтобы клиент понял, о чем речь. Когда мы говорим про перевод для публикации, это значит, что он переведен, отредактирован, откорректирован, проведено как минимум три стадии работы. А потом в дело вступает контроль качества, где проверяют выборочно соответствие, так сказать, продукции заявленному стандарту. Так вот, речь о том, что у людей, которые часто совершенно не имеют опыта, качество перевода важных текстов может быть таково, что их даже отредактировать сложно. Редактор столько усилий тратит, что говорит: «Слушайте, давайте заново, а потом я начну редактировать».
С. И.: Да-да-да.
И. С.: Это ровно как с машинным переводом, когда мы говорим о том, что машинный перевод дает некое сырье. И его качество может быть таким, что отредактировать сложнее, чем перевести заново. И с профессиональными переводчиками, условно профессиональными, иногда тоже так бывает, к сожалению. Они только начали, может быть, что-то делать, не понимают, как это делать. И мы их просто берем, начинаем учить, даем им вначале задачи попроще, редактируем за ними, высылаем им правки. Постепенно они подтягиваются до нужного уровня. Это многостадийная длительная работа. И с вузами мы хотели бы поработать в этом отношении, чтобы помочь им лучше готовить людей.
С. И.: А как ты относишься к термину «постредактор», который описывает переводчика, по сути, как некий интеллектуальный модуль для финальной полировки результатов машинного перевода?
И. С.: Это, конечно, имеет несколько иной смысл. Это не модуль. Не нужно думать, что это такой винтик. Если мы вернемся к машинному переводу в принципе, то ситуация такова, что машинный перевод уже на рынке, он никуда не исчезнет. Ты сам сказал, что объем контента растет с огромной скоростью. Это приводит к тому, что и потребность в переводе растет с огромной скоростью.
С. И.: А переводчики так быстро не плодятся.
И. С.: Не плодятся.
С. И.: Поэтому армия «постредакторов» в любом случае должна появиться.
И. С.: Совершенно верно. И это неизбежно. Некоторые переводчики говорят испуганно: «Вот, вы тут хотите вообще от нас избавится! Все будет делать машинный перевод». Такого никогда не будет. Во всяком случае, этого мы не увидим ближайшие десять лет, а может быть и тридцать, и пятьдесят.
С. И.: Но не «постредактор» ли будет основным пользователем вашей системы?
И. С.: Безусловно, объем постредактирования будет нарастать. И в какой-то момент — и это мы увидим, я считаю, на горизонте единиц лет, — их будет больше, чем переводчиков. Почему? Потому что потребность огромная. Растет и количество переводов, которые требуют такого высокого уровня качества, что и постредактирование неприемлемо. Хотя еще раз повторюсь, что постредактирование при правильном процессе дает на выходе результат, который совершенно не хуже, чем если не получать на входе машинный перевод. Тем не менее будет оставаться объем работ, который будет делаться абсолютно без машинного перевода: художественная литература, маркетинговые материалы и т. д. Но объем постредактирования будет расти, расти и расти. Я считаю, что через несколько лет он по абсолютному значению будет больше того, что делается с нуля. Возьмем, например, UGC-контент. Вот представь, например, что какая-нибудь компания, у которой огромное комьюнити пользователей, генерирует какой-то контент, описывает что-то, какие-то отзывы пишет, какие-то вопросы задает. И все это комьюнити, весь этот UGC-контент компания решает сделать доступным своим пользователям на десяти других рынках. Переводить этот огромный контент, который еще и генерируется ежедневно с огромной скоростью, профессиональным образом не просто безумно дорого — невозможно. Нужно будет это делать огромным количеством переводчиков, это просто нерентабельно и бессмысленно. Если мы говорим о UGC-контенте, то, вообще говоря, отредактировать машинный перевод, просто сделать его понятным для данной задачи абсолютно достаточно. Или eBay ты вспоминал, например, да? Сейчас вообще не редактируют, если ты посмотришь.
С. И.: Читать невозможно, да.
И. С.: А знаешь, почему так делают? Потому что есть исследования, которые говорят, что при онлайн-покупке, если контент не на английском, а на твоем родном языке, вероятность покупки возрастает в два раза. Это если контент качественно переведен. Если контент просто машиной переведен, все равно вероятность покупки больше. Поэтому делают так, и это лучше для бизнеса.
С. И.: Мы понимаем, что профессиональных переводчиков не может в одну секунду появиться много, что количество «постредакторов» будет расти. Тем не менее каких ты ждешь изменений на рынке труда с приходом столь мощной системы, как SmartCAT? Ведь в любом случае изменения неизбежны. Каста переводчиков останется, но вакуум заполнится. Кем? Может быть, появится какая-то новая профессия в цепочке «автопереводчик — читатель»?
И. С.: Сейчас на рынке есть некоторая нехватка ресурсов. Если ты поговоришь с любой профессиональной переводческой компанией — а их не так много, по пальцам можно пересчитать, — они все тебе скажут: «Нам не хватает кадров». Не хватает людей, которые в состоянии что-то делать, в состоянии профессионально переводить, в состоянии использовать современные технологии автоматизации. Принося на рынок продукт, который абсолютно прост в использовании, абсолютно доступен, мы хотим изменить в том числе ситуацию на рынке труда. Людей, которые в состоянии переводить профессионально с точки зрения и качества текста, и умения использовать современные технологии, станет намного больше. Сейчас есть их недостаток, реальный недостаток. Мы хотим, чтобы их просто стало достаточно. Мы говорим о постредактировании. Понимаешь, ведь задача постредактирования возникают не тогда, когда нужно перевести пару страниц. Ты взял, в офисе машиной перевел, кинул переводчику. Это тоже есть, но это совершенно незначительная штуковина по сравнению с тем потоком контента, про который мы сейчас говорили: динамического UGC-контента на каком-нибудь eBay, Amazon и т. д. Вот здесь возникает задача другого характера. Нужно не рассылать по две страницы, нужно в онлайне сделать систему типа SmartCAT, куда люди-«постредакторы» смогут приходить в любом количестве, тысячами, и «постредактировать» этот контент. Сейчас без такой технологии это просто невозможно. Поэтому люди, которые могли бы стать профессиональным переводчиками, начать с постредактирования или с волонтерского перевода на проекте типа Coursera, просто не прорастают. Им негде прорастать, понимаешь. А в итоге где-то на верхушке пищевой цепи сидят профессиональные заказчики, которые говорят: «Нам очень не хватает кадров, нам очень не хватает профессиональных кадров». А откуда они возьмутся, как им прорасти?
С. И.: Да еще и в короткий срок.
И. С.: Поэтому мы считаем, что поможем и себе, и другим компаниям просто получить большее количество людей, которые и переводить умеют качественно, и пользоваться современными технологиями.
С. И.: Ну что ж, Иван, я хотел тебе в завершение передачи сказать спасибо за интересный рассказ. Я не отказываюсь от своего спасибо, но еще, видимо, дополнительное спасибо за то, что рабочие места не убиваются, как я предполагал в начале передачи, а создаются новые.
И. С.: Создаются, создаются. Кстати, это было интересно: когда-то, когда появился Google Translate, на заре машинного перевода, поднялся вой: «Что же будет, все рабочие места убьют!» Тогда наиболее разумные люди говорили: «Ребята, успокойтесь. Потребность такова, что, если бы даже все сейчас решили вам, профессиональным переводчикам, все отдать, вы бы не справились никогда в жизни». Это во-первых. А во-вторых, имея возможность увеличить свою производительность за счет постредактирования, вы таким образом только увеличиваете эту потребность. Потому что сейчас этот контент некуда направить. Профессионально, как я уже сказал, многие типы контента просто нерентабельно переводить. Но его можно «слить», условно говоря, в work-flow, который его сможет поддержать в таком объеме, с такой скоростью и с минимальной ценой. Поэтому машинный перевод — это точно не зло, это добро для будущего отрасли и для переводчиков, которые хотят расти и развиваться. А SmartCAT — это гораздо шире, чем машинный перевод, это система автоматизации. Можно не использовать машинный перевод и работать в SmartCAT успешно, и все будет хорошо.
С. И.: Ну что ж, я надеюсь, что все преимущества новых технологий в области перевода наши зрители скоро оценят, а мы получим отклик и отзывы. Спасибо тебе за интересный рассказ!
И. С.: Спасибо тебе, Сергей! Спасибо за очень интересные вопросы. Прямо чувствуется, что ты либо в теме, либо очень хорошо подготовился.
С. И.: Это наша профессия. На этом я прощаюсь с вами, уважаемые телезрители. Это была программа «Бизнес online». Всего вам доброго, пока!

Развернуть текстовую версию
Комментарии
Похожие видео
Еще видео