src/avp/toolkit/visualizer.py


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91

"""Functions used to transform and manipulate audio for use by visualizers"""

from copy import copy
import numpy


def createSpectrumArray(
    component,
    completeAudioArray,
    sampleSize,
    smoothConstantDown,
    smoothConstantUp,
    scale,
    progressBarUpdate,
    progressBarSetText,
):
    lastProgress = 0
    lastSpectrum = None
    spectrumArray = {}
    for i in range(0, len(completeAudioArray), sampleSize):
        if component.canceled:
            break
        lastSpectrum = transformData(
            i,
            completeAudioArray,
            sampleSize,
            smoothConstantDown,
            smoothConstantUp,
            lastSpectrum,
            scale,
        )
        spectrumArray[i] = copy(lastSpectrum)

        progress = int(100 * (i / len(completeAudioArray)))
        if progress >= 100:
            progress = 100
        if progress == lastProgress:
            continue
        progressText = f"Analyzing audio: {str(progress)}%"
        progressBarSetText.emit(progressText)
        progressBarUpdate.emit(int(progress))
        lastProgress = progress
    return spectrumArray


def transformData(
    i,
    completeAudioArray,
    sampleSize,
    smoothConstantDown,
    smoothConstantUp,
    lastSpectrum,
    scale,
):
    if len(completeAudioArray) < (i + sampleSize):
        sampleSize = len(completeAudioArray) - i

    window = numpy.hanning(sampleSize)
    data = completeAudioArray[i : i + sampleSize][::1] * window
    paddedSampleSize = 2048
    paddedData = numpy.pad(data, (0, paddedSampleSize - sampleSize), "constant")
    spectrum = numpy.fft.fft(paddedData)
    sample_rate = 44100
    frequencies = numpy.fft.fftfreq(len(spectrum), 1.0 / sample_rate)

    y = abs(spectrum[0 : int(paddedSampleSize / 2) - 1])

    # filter the noise away
    # y[y<80] = 0

    with numpy.errstate(divide="ignore"):
        y = scale * numpy.log10(y)

    y[numpy.isinf(y)] = 0

    if lastSpectrum is not None:
        lastSpectrum[y < lastSpectrum] = y[
            y < lastSpectrum
        ] * smoothConstantDown + lastSpectrum[y < lastSpectrum] * (
            1 - smoothConstantDown
        )

        lastSpectrum[y >= lastSpectrum] = y[
            y >= lastSpectrum
        ] * smoothConstantUp + lastSpectrum[y >= lastSpectrum] * (1 - smoothConstantUp)
    else:
        lastSpectrum = y

    x = frequencies[0 : int(paddedSampleSize / 2) - 1]

    return lastSpectrum