МЕДИА
6 мин

Язык на княжение. Кто поможет человечеству расшифровать речь инопланетян

Космос постепенно становится все менее необитаемым, и шансы на контакт с иными формами разума растут. Невозможно даже теоретически предсказать, где мы встретим разумную речь инопланетянэ6 в казавшихся бессмысленными радиосигналах, в рентгеновских вспышках в районе  ближайшей звезды, подземных пещерах на Марсе или в ультразвуковых вибрациях подо льдом спутника Юпитера Европы. Журналист и сценарист Сергей Боголепов считает, что в ее расшифровке нам точно понадобится помощь нечеловеческого разума. 

Космос вокруг нас бурлит — теперь его осваивают не только государства, но и частные компании. И это уже не только активность на земной орбите. Blue Ghost, первый частный лунный посадочный модуль, созданный компанией Firefly Aerospace, успешно сел на Луну 2 марта 2025 года (в феврале 2024 года модуль Odysseus компании Intuitive Machines приземлился, но опрокинулся). Частная компания Space X Илона Маска готовится к миссии на Марс. 

Не пора ли задуматься, как мы поймем инопланетян, если встретим?

Кто расшифрует язык инопланетян

Представьте, что однажды ночью в пустыне Нью-Мексико радиотелескоп VLA ловит сигнал: короткие и длинные вспышки с интервалами в 0,73 и 1,09 секунды — это не пульсар, не земной спутник, но что-то искусственное. Рассчитывать на «Привет, земляне!» не приходится — скорее всего, мы получим непонятный поток звуков, импульсов или световых узоров. Фантасты на этом моменте не зацикливаются — их инопланетяне быстро учат земные языки, или у людей уже есть универсальные переводчики. Но в реальности их язык может быть настолько чуждым (как в фильме «Прибытие»), что лингвистам придется понимать язык не линейно, а все времена одномоментно, иначе — по фильму — не избежать катастрофы. А если не найдется подходящей подсказки к необычному пониманию времени в эйнштейновской или какой-то иной знакомой нам физике?

Понимание инопланетного языка — большой вызов. Вероятнее всего, придется искать аналогии во всех земных языках и науках — лингвистике, информатике, астрофизике и биологии. Это будет не просто космический ребус, но глобальная междисциплинарная задача. И здесь потребуется кто-то существенно более работоспособный, чем человек. 

Искусственный интеллект даже на текущем уровне своего развития уже расшифровывает клинопись и древние тексты, взламывает шифры и даже анализирует коммуникацию животных. Кажется логичным, что именно ИИ можно использовать для понимания языков инопланетян, если мы когда-либо получим сигнал из космоса. Это сложная задача, и успех будет зависеть от многих факторов, включая природу самого языка.

Текущие возможности ИИ в лингвистике

ИИ уже уверенно работает с человеческими языками. Большие языковые модели на базе архитектуры типа трансформеров (вроде GPT-4 или BERT) обучаются на больших наборах текстовых данных размером в десятки терабайт и миллиарды слов и способны предсказывать пропущенные слова в тексте с точностью до 90%, опираясь только на контекст. У этого метода есть очевидные ограничения — при обучении нейросети нужен образец, достаточно большой массив контента. И конечно же, учитель — тот кто сумеет проверить и дать рекомендации.

Но для успешного перевода редких земных языков ИИ нужен хотя бы минимальный объем уже распознанных данных, а рассчитывать на азбуку или какую-нибудь книгу для инопланетного языка не приходится. Нейронкам придется искать и выделять какие-то базовые единицы через частотный анализ. Например, закон Ципфа (если очень упрощенно: 20% самых распространенных элементов составляют около 80% текста) или энтропию Шеннона (мера неопределенности, связанная со случайными величинами). По сути, это как пытаться распознать мелодию в шуме реактивного двигателя — сложно, очень трудоемко, но не безнадежно. А перспективные технологии, применяющие неконтролируемое обучение, уже позволяют ИИ находить скрытые закономерности самостоятельно, без указания их наставником-человеком в явном виде, что очень важно для анализа неизвестных систем.

Декодирование неизвестных языков

В 1952 году лингвист Майкл Вентрис расшифровал линейное письмо Б (письменность бронзового века, известную по табличкам из обожженной глины), подсчитав, что один из символов встречается в 12% случаев, и сопоставив его с греческим «a». Это заняло годы подсчетов на бумаге. Сегодня ИИ значительно ускоряет процесс. Одна из команд MIT, например, разработала алгоритм расшифровки, который может работать с огромным количеством возможных преобразований и при недостатке входной информации. В основу легли расшифровки мертвых языков — угаритского и того самого линейного письма Б (подробнее можно почитать тут). 

Израильские ученые разработали нейросеть, которая расшифровывает древние аккадские (ассиро-вавилонские) надписи. Чтобы алгоритм машинного обучения сумел расшифровать надписи на мертвом языке, ее обучили 104 известным языкам и загрузили в нее транскрипции 10 тысяч клинописных табличек. Нейросеть смогла не только расшифровать надписи, но и восполнить утраченные слова и даже целые фразы. Проверенная экспериментально точность системы составила 89%. Так что этот метод почти наверняка сработает — конечно, если мы как-то сумеем найти для инопланетного языка свой близкородственный «древнегреческий».

ИИ, квантовые компьютеры и криптоанализ

Инопланетный язык — шифр без инструкции. А в криптоанализе ИИ уже практически профи: алгоритмы выявляют статистические аномалии, частотные характеристики, структурные паттерны или даже уязвимости шифрования (например, через атаки по сторонним каналам, анализируя косвенные признаки вроде времени выполнения операций или энергопотребление). 

Но язык порой устроен посложнее, чем шифры, в основе которых все же лежит известная нам математика. Иногда мы можем распознать структуру, но без общего контекста не поймем смысла. А что делать в случае, если язык будет не «линейный», а «многомерный»? Например, каждое «слово» будет состоять не только из набора звуков, но и длительности пауз, высоты тона и т. п. И это как раз ресурсоемкая задача для ИИ — все это надо как-то упорядочить и разглядеть систему, например, строя графы зависимостей с различными весами ребер или матрицы переходов, тестируя десятки тысяч гипотез в секунду.

Квантовые компьютеры способны взламывать любой неквантовый шифр, и, кстати, их принцип работы отлично подходит для архитектуры ИИ — они умеют быть одновременно в разных состояниях, как инопланетяне из «Прибытия». 

Коммуникация с животными

В конце марта умер гениальный шимпанзе-бонобо Канзи, юморист, фанат Minecraft’а, самый известный нам лингвист в мире обезьян, общавшийся с людьми на трех языках — специально исследовательском (клавиши с картинками), английском (понимал речь) и на языке жестов (говорил сам). И этот тот случай, когда животные, выучив наш язык, сделали для понимания, пожалуй, больше, чем люди. Приматы, такие как шимпанзе, имеют до 30 вокализаций своего языка, но их общение не ограничивается звуками. Распознавание поз и жестов приматов тоже можно смело поручить ИИ.

Из общения с животными можно предположить, что инопланетяне могут вовсе не говорить в привычном нам смысле, а петь или пахнуть. Язык дельфинов, например, состоит из двух частей — издаваемых звуков и принимаемых поз, которые как-то комбинируются между собой. Как именно, пытаются разобраться уже давно, а с 2017 года и составить дельфиний словарь с помощью искусственного интеллекта. А проект Earth Species Project и вовсе тренирует биоакустичесий ИИ, который когда-нибудь сможет общаться вообще со всей обменивающейся звуковой информацией фауной. 

В мире насекомых в ходу другие сигналы. Например, химические вещества для передачи сигналов друг другу, как у муравьев. Эти вещества могут быть летучими и обнаруживаться на расстоянии через обоняние, или нелетучими — и передаваться при тактильном контакте насекомых. Другие насекомые общаются с помощью вибраций и движений. Пчелы как минимум умеют командовать друг другу «Стоп!», предупреждать об опасности и координировать действия других пчел — это уже достаточно изучили с помощью компьютерного зрения.

Сигналы насекомых можно систематизировать и проанализировать с помощью ИИ, вопрос только в датчиках, камерах и прочих приспособлениях для их считывания. Ну и как их повесить, к примеру, на кузнечика, чтобы пореже гоняться за ним с батарейками?

SETI и ИИ

Проекты по поиску внеземных цивилизаций и возможному контакту SETI (Search for Extraterrestrial Intelligence) — та самая сфера, где ИИ применяется давно и достаточно успешно (хоть он никого пока не нашел, но значительно облегчил жизнь ученым и энтузиастам). Машинное обучение хорошо подходит для автоматической идентификации и обнаружения аномалий электромагнитных волн в доступных данных, наблюдений в реальном времени. 

К примеру, авторы этого прикладного эксперимента обучили сверточную нейронную сеть (CNN) для классификации целей в радарной системе FMCW. Только посмотрите, с какой абракадаброй ей приходится разбираться. В итоге обученную модель удалось упростить до размера всего 200 кб (для использования на устройствах в программируемой матрице (FPGA)), но на заранее не известных данных она достигала точности около 94%.

Возможности и вызовы

Конечно, расшифровка языка инопланетян окажется сложной и уникальной задачей. Но даже если это случится прямо сейчас, человек приступит к ней уже не с пустыми руками.

У нас уже есть технологии обработки естественного языка (NLP) для анализа сложных лингвистических закономерностей (последовательности символов, поиска сходства в их организации, выявления неявных грамматических правил и т. п.). Сверточные нейронные сети помогут разобраться с анализом визуальных данных (символы, изображения или видео), поиском закономерностей и взаимосвязей в них. Мультимодальные модели пригодятся для сложного контента, сочетающего разные элементы и формы коммуникации. Кроме того, ИИ можно будет использовать для проверки гипотез с помощью интерактивного моделирования.

Но и без этого у нас будет много сложностей с расшифровкой языка, у которого нет ни земных аналогов, ни общего контекста для сравнения. Если только инопланетяне тоже не озаботятся этим вопросом и не вложат в свои послания (как люди в послания «Вояджеров») свои представления о чем-то универсальном для Вселенной — математике, времени, строении атомов и т. п. Также инопланетный язык может быть сформирован на базе совершенно иных физических принципов восприятия мира — за рамками наших технологических возможностей это считать и воспроизвести.

Этрусский, хаттский, ронго-ронго, касситский и иберийский — все это непереведенные земные языки. У них просто не нашлось достаточных массивов текста, родственных аналогов или хотя бы подсказки — означают эти символы звуки, слоги или целые слова. Даже если ИИ сможет выявить закономерности в инопланетном послании, вычленить одиночные слова и вычислить их значение, это вовсе не гарантирует, что мы сможем понять смысл: переведенный дословно сонет Шекспира — та еще тарабарщина.

***

Искусственный интеллект переводит мертвые языки, взламывает коды и слушает животных, ищет ключи к химическому языку муравьев и анализирует радиосигналы. Очевидно, если контакт состоится, люди будут использовать ИИ, чтобы понять инопланетян. Но если слабые человеческие ум и чувства окажутся не нужны, заметят ли инопланетяне нас самих? А если заметят, будем ли мы им интересны? Поэтому даже в эпоху нейросетей нам бы следовало продолжать пытаться понимать друг друга, хотя это порой бывает не проще, чем понять инопланетянина.

Пишите нам

Спасибо, что написали! Вернемся к вам на почту :)

Мы мечтаем собрать самую большую команду талантливых авторов в России. Если вы придумали идею большого текста, готовы поделиться опытом в формате колонки или стать героем нашего подкаста, напишите нам.

 

Как говорили в популярной рекламе начала 00-х: лучшие руки трудоустроим.

Имя *
e-mail *
о себе *
Читайте также