Antes de calcular la FFT de la ventana de análisis las muestras son multiplicadas por una función que minimiza la distorsión espectral. Dicha distorsión está provocada por la duración no-infinita (por motivos prácticos) de la ventana de análisis.
Si analizamos desde el punto de vista de la frecuencia qué estamos haciendo cuando calculamos la FFT de la ventana de análisis, veremos que en realidad estamos calculando el espectro de la señal resultante de multiplicar las muestras por una función cuadrada que vale distinto de 0 justamente en el intervalo de tiempo que se toman las muestras.
Si aplicamos el teorema de convolución, el espectro resultante es la convolución en el dominio de la frecuencia de los espectros de la señal de audio y de la función cuadrada. Como el espectro de la función cuadrada es una Sinc (la función muestreo), el espectro de la señal de audio se presenta distorsionado por dicha Sinc.
Para minimizar esta distorsión podemos hacer dos cosas: