Каждый бар трека описывается набором характеристик: громкость, баланс частот, динамика. Эти характеристики формируют точку в многомерном пространстве. Теорема Такенса позволяет восстановить скрытую структуру (аттрактор) музыки из этих точек.
Бары из одной секции (дроп, интро, брейкдаун) группируются рядом в этом пространстве. Алгоритм находит ближайших соседей каждого бара и определяет, к какому типу секции он относится.
После начальной разметки по ближайшим соседям запускается фильтр Калмана — он проходит по барам последовательно и сглаживает переходы между секциями, опираясь на уверенность (дисперсию) каждой метки. Это как «демон Максвелла», который отсеивает шум и оставляет чёткую структуру.
BPM определяется через автокорреляцию огибающей атак (onset envelope) с использованием FFT. Алгоритм ищет самый громкий 30-секундный фрагмент (дроп) и анализирует периодичность ударов.
3D визуализация — это реальная проекция фазового пространства Такенса. Каждый бар — точка в 5-мерном пространстве признаков (энергия, бас, средние, верхние частоты, спектральный поток). PCA проецирует это пространство на 3 главные оси. Дропы группируются в области высокой энергии (красные), брейкдауны — в области спада (жёлтые), интро — отдельно (голубые). Линия показывает траекторию трека через фазовое пространство во времени.