ИИ уже начал понимать язык животных. Вот что удалось выяснить

Искусственный интеллект уже давно помогает нам общаться с Siri и Alexa, но теперь учёные решили направить эту технологию на совершенно другие виды. Несколько крупных научных проектов используют машинное обучение, чтобы попытаться расшифровать общение животных. Полноценный «разговор» с котом пока остаётся научной фантастикой, однако первые результаты уже впечатляют и заставляют серьёзно задуматься о природе языка в целом. Неудивительно, что тема вызывает такой интерес: учёным даже удалось провести эксперимент по «общению» с китом.

ИИ уже начал понимать язык животных. Вот что удалось выяснить

Есть ли у животных язык и как это проверяют учёные

Прежде чем пытаться что-то «переводить», нужно разобраться: а что именно мы пытаемся перевести? Люди общаются с помощью слов, жестов и мимики. Животные тоже используют сложные сигналы: собаки виляют хвостом, пчёлы исполняют танцы, дельфины щёлкают и свистят, а слоны, как выяснилось, могут обращаться друг к другу по имени. Но можно ли всё это назвать языком?

Дениз Херцинг, руководитель проекта Wild Dolphin Project, объясняет: мы пока не знаем наверняка, есть ли у животных настоящий язык, но искусственный интеллект способен выявлять в их коммуникации структуры, похожие на языковые — элементы, напоминающие грамматику или словарь. Если такие паттерны будут обнаружены, это станет сильным аргументом в пользу того, что животные общаются гораздо сложнее, чем мы предполагали.

Однако здесь возникает главная трудность. Юлия Фишер из Немецкого центра изучения приматов предупреждает: ИИ — не волшебный инструмент. Алгоритм может найти закономерности в звуках, но без тщательного наблюдения за поведением животных в естественной среде эти находки теряют смысл. Недостаточно просто записать тысячи часов звуков — их обязательно нужно соотнести с тем, что животные делают в момент вокализации. Иначе все попытки «поговорить» с животными так и останутся красивой, но пустой идеей.

Как искусственный интеллект расшифровывает звуки животных

Элоди Брифер, специалист по поведению животных из Копенгагенского университета, отмечает: вокализации животных содержат множество видов информации — от идентификации особи и её эмоционального состояния до социального статуса и описания внешних событий. В теории всё это может распознать искусственный интеллект.

Главную роль здесь играет машинное обучение — вид ИИ, который анализирует данные без заранее заданных жёстких правил. Алгоритм самостоятельно обрабатывает записи и находит скрытые паттерны. Это та же технология, что используется в предиктивном тексте смартфонов и голосовых помощниках. Только вместо человеческих слов модель работает со звуковыми сигналами: щелчками, свистами, хрюканьем и даже ультразвуком.

По словам Брифер, главное преимущество машинного обучения — его масштаб. Там, где человеку потребуются годы на ручной анализ, алгоритм за короткое время обработает тысячи часов записей и заметит закономерности, которые исследователь мог бы легко пропустить.

Проект Earth Species: расшифровка языка животных

Одна из ведущих организаций в этой области — некоммерческий проект Earth Species Project. Его цель — расшифровать общение животных с помощью ИИ. Учёные проекта представляют язык в виде геометрической структуры, похожей на галактику: каждое «слово» — это звезда, а расстояния между ними отражают смысловые связи. Если формы двух языков совпадают, их можно «наложить» друг на друга и выполнить перевод.

В конце 2021 года Earth Species Project опубликовал в журнале Scientific Reports статью об алгоритме, который решает так называемую «проблему коктейльной вечеринки». Представьте шумную вечеринку, где одновременно говорят множество людей, и выделить отдельный голос почти невозможно. Та же проблема возникает при записи звуков группы животных. Алгоритм проекта смог определить, какой именно дельфин, макак или летучая мышь издаёт звук в общей какофонии.

ИИ уже начал понимать язык животных. Вот что удалось выяснить
Исследователи анализируют спектрограммы звуков животных

Сейчас проект разрабатывает NatureLM-audio — первую в мире большую аудиоязыковую модель, специально созданную для анализа звуков животных. Она обучена на огромных массивах данных: от человеческой речи и музыки до звуков природы. Первые результаты показывают, что паттерны, извлечённые из человеческой речи, действительно помогают лучше понимать вокализации других видов.

Язык китов и дельфинов: проекты CETI и DolphinGemma

Другой масштабный проект — Project CETI (Cetacean Translation Initiative) — сосредоточен на изучении кашалотов. Эти киты общаются с помощью ритмичных серий щелчков, которые называют «кодами». Раньше их считали чем-то вроде азбуки Морзе. Однако исследования с использованием генеративных нейросетей (GAN) показали удивительное: акустические свойства щелчков кашалотов очень напоминают гласные звуки человеческой речи — они различаются по длительности, частоте и траектории.

Учёные CETI уже выделили 156 различных типов код и их базовые элементы — по сути, «фонетический алфавит» кашалотов. В проекте участвуют около 50 специалистов из восьми институтов: лингвисты, робототехники, криптографы и морские биологи.

У дельфинов тоже есть прогресс. Wild Dolphin Project под руководством Дениз Херцинг ещё в 2013 году добился интересного результата: учёные научили дельфинов ассоциировать определённый свист с саргассовыми водорослями, а алгоритм потом успешно распознал этот сигнал в естественной среде. Недавно Google совместно с Wild Dolphin Project и Технологическим институтом Джорджии представил модель DolphinGemma — ИИ на основе архитектуры Gemma, обученный на многолетних записях атлантических пятнистых дельфинов.

ИИ уже начал понимать язык животных. Вот что удалось выяснить
Кашалот в океане: учёные расшифровывают структуру его щелчков-код

DolphinGemma работает по принципу «звук на входе — звук на выходе». Модель анализирует последовательности дельфиньих звуков и предсказывает, какой звук должен последовать дальше — примерно так же, как языковая модель предсказывает следующее слово. При этом модель достаточно компактная (около 400 миллионов параметров), чтобы работать прямо на смартфоне Google Pixel в полевых условиях.

Как ИИ распознаёт эмоции животных по звукам

Внимание учёных привлекают не только морские млекопитающие. Элоди Брифер и её коллеги обучили ИИ распознавать положительные и отрицательные эмоции в хрюканье, визге и похрюкивании свиней. Это важно не только теоретически — понимание эмоционального состояния сельскохозяйственных животных может значительно улучшить условия их содержания.

У грызунов ситуация ещё интереснее. Мыши и крысы общаются в ультразвуковом диапазоне, который человек не слышит. Программа DeepSqueak, созданная в Вашингтонском университете, преобразует ультразвуковые сигналы в спектрограммы и анализирует их с помощью нейросетей. У грызунов обнаружили около 20 типов вокализаций, и они используют разные «песни» в зависимости от контекста — например, самцы мышей по-разному поют рядом с другим самцом и рядом с самкой.

Зачем учёные используют ИИ для понимания языка животных

Помимо любопытства (наконец-то узнать, о чём думает ваш кот), понимание коммуникации животных имеет важные практические последствия. Для домашних и сельскохозяйственных животных это напрямую связано с их благополучием.

«Для видов, которые живут рядом с нами, понимание их состояния крайне важно, потому что их благополучие зависит от человека», — подчёркивает Элоди Брифер.

Но последствия могут быть гораздо шире. Если выяснится, что у животных действительно есть элементы языка, это может заставить человечество пересмотреть своё отношение к ним — в спорте, развлечениях, науке и сельском хозяйстве. Всё больше исследований показывают, что многие виды гораздо разумнее, чем мы считали раньше. Учёные Project CETI уже сотрудничают с юристами Нью-Йоркского университета, изучая, как новые данные о коммуникации кашалотов могут повлиять на правовой статус животных.

Есть и глубокий научный интерес: изучение коммуникации животных помогает лучше понять эволюцию языка как явления.

Дениз Херцинг высказывает ещё более смелую идею: инструменты, которые мы создаём для земных видов, в будущем могут пригодиться для поиска и понимания жизни на других планетах.

Важно сохранять реалистичный взгляд: до настоящего полноценного «разговора» с животными ещё очень далеко. Машинное обучение отлично находит паттерны в звуках, но превращение этих паттернов в осмысленную коммуникацию — задача намного более сложная, которая требует многолетних полевых наблюдений. Тем не менее впервые в истории у учёных появились инструменты, позволяющие анализировать коммуникацию животных в масштабах, которые раньше были недостижимы. Каждый новый найденный паттерн — это ещё один шаг к пониманию того, насколько сложным и богатым является мир, который мы делим с миллионами других видов.

Оцените статью