Поймать вавилонскую рыбку

Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.

Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.

Введение

Искусственный интеллект все глубже проникает в нашу жизнь, вписываясь в нее настолько органично, что мы порой даже не задумываемся об этом. Например, ставшие привычными нам «умные» колонки и часы, голосовые помощники в смартфонах, навигаторы, системы рекомендации фильмов и сериалов в киносервисах — все это основано на искусственном интеллекте. Технология может решать и гораздо более серьезные задачи. Так, основанные на искусственном интеллекте программы по анализу снимков помогают врачам ставить диагнозы. Специалисты из Гарвардского университета научили компьютер выполнять необходимые для прогнозирования землетрясений расчеты. Причем делает он это примерно в 500 раз быстрее человека, работающего с обычным программным обеспечением, — значит, у жителей опасных районов будет намного больше времени на эвакуацию. Благодаря искусственному интеллекту время, в течение которого пилоты управляют самолетом в ручном режиме, измеряется минутами, а не часами. Беспилотные автомобили уже ездят по улицам некоторых городов мира. Нейросети пишут музыку и создают картины.

Но что вообще мы называем искусственным интеллектом? Умение компьютера думать? Если так, то сможет ли он заменить или превзойти человека в творческих сферах? Как тогда изменится наша жизнь?

Эти вопросы волнуют людей не одно десятилетие, и я не дам на них исчерпывающего ответа — думаю, для этого понадобится слишком много страниц. Мы посмотрим на искусственный интеллект применительно всего лишь к единственной сфере — переводу письменной и устной речи.

Итак, сократим список вопросов до одного: заменит ли компьютер переводчика? Чтобы найти ответ, сначала мы разберемся в том, как вообще люди (и животные) осваивают языки, узнаем, где они «хранятся» и как работает мозг синхронного переводчика. А потом поговорим про искусственный интеллект — затронем историю разработки систем машинного перевода и поймем, на каком этапе развития эти системы находятся сейчас. И конечно, дадим слово переводчикам, лингвистам и специалистам по машинному обучению — они расскажут о том, каково, на их взгляд, будущее перевода.

Лично я думаю, что по крайней мере до конца века компьютеры не заменят людей в этой сфере. Не исключаю, что я излишне оптимистична (или пессимистична — как посмотреть), но мне нравится думать, что изучать разные языки и говорить на них — это уникальный навык, присущий только человеку. Не отрицаю, что мое отношение к этой теме предвзято: благодаря родителям я начала учить английский язык в три года. К концу школы свободно владела английским и французским. В университете моей специальностью был китайский язык: за четыре года мы прошли длинный путь от освоения тонового произношения и прописей (в китайском они необходимы, поверьте) до синхронного перевода отрывков из выступлений китайских политиков и биржевых сводок. (Работать с китайским я, правда, так и не начала, поняв на втором курсе, что ни эта специальность, ни регион меня не привлекают.) Потом я начала учить немецкий и испанский — просто так, потому что хотелось. Сегодня последним в этом списке стоит карельский (да, это не опечатка: недавно я начала учить собственно-карельское наречие, одно из трех основных наречий карельского языка).

Так что сейчас я с разной степенью уверенности могу говорить на шести языках, не считая родного русского. Для работы мне постоянно пригождается только английский, еще я преподаю французский, испанский и русский как иностранный, но в целом весь мой языковой арсенал приобретался не для каких-то определенных практических целей. Я учу языки, потому что они помогают мне чувствовать себя комфортно во многих странах мира. Мне нравится читать книги, видя оригинальную игру слов и понимая оттенки эмоций автора. Я люблю сравнивать языки: находить фразеологизмы с общей структурой, проводить параллели между грамматическими конструкциями, видеть различия в том, как люди из разных стран говорят об одних и тех же вещах.

Но представьте на минуту: что, если в один прекрасный день все эти знания и навыки станут ненужными? Если появятся программы для перевода текстов — не привычные нам, встроенные в браузер и делающие смешные ошибки, а настолько качественные, что они смогут переводить художественные книги и стихи не только без потери смысла, но и с сохранением красоты авторского слога? Если станет возможным купить устройство, которое будет не хуже профессионального синхрониста переводить устную речь? Перестанем ли мы тогда нуждаться в переводчиках, пропадет ли целый пласт профессий, связанных с адаптацией лингвистических реалий носителей одного языка для носителей другого?

В книге я попробовала ответить на эти вопросы, и думаю, что у меня получилось. Но мне трудно было бы справиться без помощи тех людей, которые поделились со мной своими знаниями и опытом. Я хочу поблагодарить:

полиглотов Викторию, Кристину, Анастасию, Евгению и Максима;
переводчиков и экспертов по межкультурной коммуникации Кристину Роппельт, Викторию Волошину, Марию Кленницкую, Риту Ключак;
переводчиков и специалистов по машинному переводу Руслана Мурашкина и Дениса Лазука;
профессора Женевского и Венского университетов, руководителя исследовательского центра «Лаборатория по изучению мозга и языка» (Brain and Language Lab) Нэрли Голестани;
научного журналиста и специалиста по нейронаукам, главного редактора портала Neuronovosti.ru Алексея Паевского;
научного редактора книги Елизавету Носову — специалиста по компьютерной лингвистике, занимающуюся обучением и внедрением моделей для обработки естественного языка;
друга и коллегу Николая Подорванюка, из дискуссии с которым родилась идея этой книги;
моего мужа Алексея Шередегу, ставшего первым читателем и критиком книги, а также моих родителей Светлану и Игоря Хлюстовых за поддержку во всех начинаниях.

Глава 1

Что такое язык?

Начнем разговор с совсем, казалось бы, простого вопроса: что такое язык? Базовое и очень короткое определение может звучать так: это инструмент коммуникации, который мы используем, чтобы обмениваться информацией.

Такое определение, однако, в свою очередь вызовет множество вопросов и замечаний, и первое из них будет таким: но ведь информацией обмениваются не только люди. Мы прекрасно знаем, что животные постоянно взаимодействуют между собой. Они координируют свои действия (например, птицы, стаей летящие на юг, или косатки во время охоты на тюленей) и передают важную информацию (пчелы, обнаружившие нектар, сообщают об этом другим обитателям улья, исполняя специальный танец). А что насчет наших домашних питомцев? Любой владелец собаки знает, как красноречиво пес может заявить о своем желании пойти на прогулку или получить внеочередную порцию угощения. Значит ли это, что язык не привилегия людей?

«Говорящие» обезьяны

Обезьяны максимально похожи на человека, поэтому логично, что именно они стали основными участниками экспериментов по обучению животных языку. Особенности строения голосовых связок, гортани и челюсти не позволяют обезьянам управлять своим голосом так же, как это делаем мы, и произносить те же звуки. Впрочем, эксперименты по обучению обезьян говорению все же проводились. Так, например, шимпанзе Вики за несколько лет научилась произносить четыре английских слова: mama (мама), papa (папа), cup (чашка), up (вверх). И это самые значительные достижения, потому что остальные участники таких опытов (шимпанзе Джонни, Рената и Кокомо) могли выговорить лишь слово mama. После этих неудачных экспериментов ученые сконцентрировались на обучении животных американскому жестовому языку — амслену. Его используют глухие люди в США, некоторых частях Канады, ряде стран Западной Африки и Юго-Восточной Азии. Каковы же были результаты?

Горилла Коко

Наверное, одной из самых известных в мире обезьян, говорящих на амслене, стала горилла Коко. Она родилась в 1971 году в зоопарке Сан-Франциско и прожила бóльшую часть жизни на западе Калифорнии, в заповеднике Санта-Круз.

Приматолог Франсин Паттерсон начала обучение Коко жестовому языку, когда той был один год. Через две недели горилла научилась использовать жесты, чтобы говорить о еде и напитках. Организаторы эксперимента утверждают, что через 40 лет словарный запас Коко составлял более тысячи слов — согласно исследованиям, примерно таким же лексиконом владеют трехлетние дети. Паттерсон также сообщала, что вдобавок к этому Коко понимала на слух около 2000 слов на английском языке.

Горилла была в состоянии не просто уведомить сотрудников заповедника о своих базовых потребностях или поддерживать с ними разговор на простые темы. Паттерсон рассказывает, что однажды Коко показали скелет и спросили, живой это объект или мертвый. Горилла ответила: «Мертвый». Потом ее спросили: «Куда попадают животные после смерти?» На это Коко, продемонстрировав прощальный поцелуй, ответила: «В удобную нору».

Паттерсон поясняет, что к этому моменту горилла была знакома с концепцией смерти: на прогулках смотрители заповедника обращали ее внимание на погибших птиц и мелких зверьков, которые иногда встречались на дороге. В понимании того, что такое смерть, Коко не была уникальной. Ученые отмечают, что гориллы в зоопарках иногда хоронят мертвых животных.

Коко обладала способностью самостоятельно расширять свой словарный запас: так, однажды она сконструировала слово «кольцо» при помощи комбинации жестов, обозначающих «палец» и «браслет». На Рождество горилла попросила подарить ей котенка (Коко понимала, что такое праздники, и с нетерпением ждала дня рождения и подарков). Получив игрушечного кота, Коко расстроилась и продолжала сообщать о своем желании сотрудникам заповедника. В конце концов ей разрешили завести настоящего котенка, которого она очень любила, пытаясь заботиться о нем так же, как о собственном детеныше. Не обходилось и без забавных случаев: однажды Коко разозлилась и в приступе гнева вырвала из стены своей комнаты умывальник. Когда смотритель спросил, зачем она это сделала, горилла попыталась свалить вину на кота, сказав жестами, что это натворил он.

К несчастью, жизнь кота оборвалась трагически: он сбежал из вольера и попал под машину. Коко очень расстраивалась и скучала по нему, и сотрудники заповедника разрешили завести ей новых любимцев — двух котов, которых горилла назвала Липс (Lips) и Смоуки (Smoky).

Шимпанзе Уошо

Впрочем, пальма первенства в освоении амслена принадлежит не всемирно известной Коко (которая дважды появлялась на обложке журнала National Geographic). Первопроходцем стала шимпанзе Уошо. В 1967 году, когда ей было около двух лет, американские зоологи Аллен и Беатрис Гарднер начали учить ее жестовому языку, причем делали это максимально естественным образом. Они обращались с Уошо почти как с ребенком: обезьяна часто носила одежду, ела за столом, с ней гуляли и брали на автомобильные прогулки. У нее был свой небольшой домик с кроватью, другой мебелью и даже холодильником. Гарднеры, в отличие от Франсин Паттерсон, общались с Уошо только на амслене, не используя обычную английскую речь: они считали, что без смешивания двух языков шимпанзе будет проще.

Эксперимент Аллена и Беатрис длился пять лет, за это время Уошо освоила около 350 слов, что было подтверждено независимыми специалистами в ряде экспериментов. (Слово считалось выученным, если Уошо использовала его на протяжении 14 дней подряд в спонтанной речи и в уместной ситуации.) Как и Коко, Уошо демонстрировала не только отличные умственные способности, но и незаурядный эмоциональный интеллект. Так, например, когда однажды к ней пришли студенты, шимпанзе разговаривала с ними на языке жестов нарочито медленно, как бы предполагая, что у них не хватит опыта, чтобы понять ее беглую речь. Была и еще одна примечательная история: Кэт, одна из смотрительниц, работавших с Уошо, несколько недель не появлялась на работе — у нее случился выкидыш. Когда женщина наконец-то пришла к шимпанзе, та дала ей понять, что обижена — ведь Кэт так давно ее не навещала. Смотрительница извинилась и показала на языке жестов: «Мой ребенок умер». Уошо опустила глаза, потом посмотрела на Кэт и показала слово «плакать», а затем провела пальцем по собственной щеке, изображая текущую слезу (физиологически шимпанзе не способны плакать). Позже Кэт отмечала, что один этот жест сказал ей о способностях Уошо гораздо больше, чем все составленные шимпанзе длинные фразы.

Шимпанзе Лана

Для обучения шимпанзе использовались и искусственные языки. Шимпанзе Лана стала первой обезьяной, которая освоила язык йеркиш (такое название он получил в честь Роберта Йеркса, специалиста в области поведения животных и одного из основоположников зоопсихологии). Ученые разработали йеркиш специально для того, чтобы учить обезьян речи. В нем применяются лексиграммы — небольшие картинки-символы, обозначающие слова и комбинирующиеся по определенным правилам (рис. 1). Лексиграммы специально сделали непохожими на предметы, которые они обозначают, и сгруппировали по классам: неодушевленные объекты, приматы, другие живые существа, разные типы действий и т.п.

Лексиграммы размещались на устройстве, похожем на клавиатуру. Положение каждой клавиши не было фиксированным — иногда их меняли местами, чтобы обезьяна запоминала не расположение лексиграммы, а ее значение. Когда шимпанзе нажимала на клавиши, символы выводились на экран.

Грамматика йеркиша различает три типа предложений: утверждение, просьба, вопрос. Каждый из них оформляется по своим правилам (например, просьба начинается с лексиграммы «пожалуйста», вопрос — с лексиграммы «вопрос»). В конце предложения должна ставиться точка. Эти правила были введены для того, чтобы объективно оценивать действия шимпанзе и четко различать сознательно выстроенные фразы и случайные комбинации символов, которые могут нести какой-то смысл.

Рис. 1 A, B. Примеры лексиграмм

Шимпанзе Лану начали учить йеркишу в 1971 году. Она довольно быстро научилась просить еду или, например, сообщать исследователям, что хочет посмотреть слайд-шоу из фотографий. Если Лана делала ошибку в процессе написания предложения и понимала это, то сразу нажимала кнопку для стирания фразы, после чего могла начать заново.

Рис. 2. Шимпанзе Лана печатает предложения из лексиграмм

Источник: Georgia State University

К 1974 году Лана выучила около сотни лексиграмм и составляла предложения длиной до семи символов. Она могла называть цвета предметов, спрашивала у работавшего с ней исследователя Тима, как называется тот или иной объект. Шимпанзе научилась читать лексиграммы на экране компьютера — так ученые получили возможность задавать ей вопросы. Иногда, если Лану спрашивали одно и то же несколько раз подряд (чтобы проверить, что она действительно понимает вопрос, а не случайно жмет на клавиши), она раздражалась и могла ответить фразой: «Тим, пожалуйста, выйди из комнаты».

Результаты этих и других подобных экспериментов отражены в десятках научных публикаций и подтверждены многими учеными. Значит ли это, что говорить могут не только люди?

Речь или не речь?

Несмотря на впечатляющи…