В рамках крупнейшего исследования глубоких нейронных сетей, обученных выполнению аудиозадач, команда Массачусетского технологического института обнаружила, что большинство этих моделей генерируют внутренние представления, схожие с теми, которые формируются в человеческом мозге при прослушивании тех же звуков. Это открытие может способствовать разработке более совершенных слуховых аппаратов, кохлеарных имплантатов и интерфейсов мозг-машина.
Исследователи выяснили, что модели, обученные на аудиовводе с фоновым шумом, лучше имитируют активационные паттерны человеческого аудиторного кортекса. Ведущими авторами открытой статьи, опубликованной в PLOS Biology, являются аспирантка Массачусетского технологического института Грета Тукюте и доктор философии Дженелл Фезер.
Глубокие нейронные сети – это вычислительные модели, состоящие из множества слоев обрабатывающих информацию блоков, которые могут обучаться на огромных объемах данных для выполнения конкретных задач. Такой тип модели широко используется во многих приложениях, и нейроученые начали исследовать возможность использования этих систем для описания работы человеческого мозга.
В ходе исследования были проанализированы девять общедоступных моделей глубоких нейронных сетей и создано 14 собственных моделей, основанных на двух различных архитектурах. Большинство этих моделей обучались выполнению одной задачи – распознаванию слов, идентификации говорящего, распознаванию окружающих звуков и определению музыкального жанра. Модели, представления которых наиболее схожи с теми, что наблюдаются в мозгу, обучались выполнению нескольких задач и на аудиовводе, включающем фоновый шум.
Исследование также поддерживает идею о том, что человеческий аудиторный кортекс обладает некоторой степенью иерархической организации, в которой обработка делится на этапы, поддерживающие различные вычислительные функции. Модели, обученные разным задачам, лучше воспроизводили различные аспекты слухового восприятия. Например, модели, обученные задачам, связанным с речью, более точно воспроизводили речевые области.
Лаборатория МакДермотта теперь планирует использовать свои находки для разработки моделей, которые будут еще более успешны в воспроизведении реакций человеческого мозга. Эти модели могут помочь ученым лучше понять структуру мозга и способствовать разработке более совершенных слуховых аппаратов, кохлеарных имплантатов и интерфейсов мозг-машина. “Наша цель в этой области – создать компьютерную модель, которая может предсказывать реакции мозга и поведение. Мы думаем, что если нам удастся достичь этой цели, это откроет множество возможностей”, – говорит МакДермотт.
Исследование было финансировано Национальными институтами здравоохранения, стипендией от Amazon Science Hub, международной докторской стипендией от Американской ассоциации университетских женщин, стипендией друзей Института Макговерна в Массачусетском технологическом институте и стипендией Компьютерно-научной аспирантуры Департамента энергетики США.