Так, если ориентироваться на оригинальный текст работы, трек воспринимается как последовательность данных с отдельными составляющими, например, ударов барабанов и тарелок, аккордов гитары и так далее. Даже с искажениями определенную очередность звуков можно будет соотнести с конкретным треком или мелодией. По очень похожей логике работают улучшенные Shazam’ы, которые узнают сингл по напеву или насвистыванию. В целом такие данные нередко используют для распознавания речи, в особенности для расшифровки записей.
В рамках исследования ученые под руководством Дерека Ломаса из Делфтского технического университета проверили корреляцию активности мозга и последовательности входящих стимулов, то есть музыки. Для этого они использовали для сбора данных электоэнцефалографический шлем с 128 электродами — он был надет на двадцати добровольцах.
Эксперимент проходил следующим образом: каждый из них поочередно с перерывами слушал двенадцать песен с закрытыми глазами в комнате со слабым освещением — это необходимо для минимизации влияния других ощущений. Нейросеть обучили на этих данных и проверили результаты — точность обучения сети для конкретного человека оказалась равной 84,96 процента и упала до 7,73 процента по показаниям разных людей.