Python быстрое преобразование Фурье для очень шумных данных

У меня есть файл с данными о величине скорости и величине завихренности из симуляции жидкости.

Я хочу выяснить, какова частота этих двух наборов данных.

мой код:

# -*- coding: utf-8 -*-
"""
Spyder Editor

This is a temporary script file.
"""
import re
import math
import matplotlib.pyplot as plt

import numpy as np


probeU1 = []
probeV1 = []
# this creates an array containig all the timesteps, cutting of the first 180, because the system has to stabelize.
number = [ round(x * 0.1, 1) for x in range(180, 301)] 

# this function loops over the different time directories, and reads the velocity file.
for i in range(len(number)):
    filenamepath = "/Refinement/Vorticity4/probes/" +str(number[i]) + "/U"
    data= open(filenamepath,"r")
    temparray = []
    #removes all the formatting around the data
    for line in data:
        if line.startswith('#'):
            continue
    else:
        line = re.sub('[()]', "", line)
        values = line.split()
        #print values[1], values[2]
        xco = values[1::3]
        yco = values[2::3]        
        #here it extracts all the velocity data from all the different probes
        for i in range(len(xco)):

            floatx = float(xco[i])
            floaty = float(yco[i])
            temp1 = math.pow(floatx,2)
            temp2 = math.pow(floaty,2)
            #print temp2, temp1
            temp3 = temp1+temp2
            temp4 = math.sqrt(temp3)
            #takes the magnitude of the velocity
            #print temp4
            temparray.append(temp4)
        probeU1.append(temparray)

#        
#print probeU1[0]  
#print len(probeU1[0])     
#        

# this function loops over the different time directories, and reads the vorticity file.
for i in range(len(number)):
    filenamepath = "/Refinement/Vorticity4/probes/" +str(number[i]) + "/vorticity"
    data= open(filenamepath,"r")
#    print data.read()
    temparray1 = []

    for line in data:
        if line.startswith('#'):
            continue
    else:
        line = re.sub('[()]', "", line)
        values = line.split()
        zco = values[3::3]
        #because the 2 dimensionallity the z-component of the vorticity is already the magnitude
        for i in range(len(zco)):  
            abso = float(zco[i])
            add = np.abs(abso)

            temparray1.append(add)

    probeV1.append(temparray1)

#Old code block to display the data and check that it made a wave pattern(which it did) 
##Printing all probe data from 180-300 in one graph(unintelligible)
#for i in range(len(probeU1[1])):
#    B=[]
#    for l in probeU1:
#      B.append(l[i])
##    print 'B=', B
##    print i
#    plt.plot(number,B)
#
#
#plt.ylabel('magnitude of velocity')
#plt.show()  
#
##Printing all probe data from 180-300 in one graph(unintelligible)
#for i in range(len(probeV1[1])):
#    R=[]
#    for l in probeV1:
#      R.append(l[i])
##    print 'R=', R
##    print i
#    plt.plot(number,R)
#
#
#plt.ylabel('magnitude of vorticity')
#plt.show()  

#Here is where the magic happens, (i hope)
ans=[]
for i in range(len(probeU1[1])):
    b=[]
   #probeU1 is a nested list, because there are 117 different probes, wich all have the data from timestep 180-301
    for l in probeU1:
      b.append(l[i])
      #the freqeuncy was not oscillating around 0, so moved it there by substracting the mean
      B=b-np.mean(b)
      #here the fft happens
      u    = np.fft.fft(B)
      #This should calculate the frequencies?
      freq = np.fft.fftfreq(len(B), d= (number[1] - number[0]))
      # If im not mistakes this finds the peak frequency for 1 probe and passes it another list
      val = np.argmax(np.abs(u))
      ans.append(np.abs(freq[val]))    

      plt.plot(freq, np.abs(u))

#print np.mean(ans)
plt.xlabel('frequency?')
plt.savefig('velocitiy frequency')
plt.show()

# just duplicate to the one above it
ans1=[]
for i in range(len(probeV1[1])):
    c=[]

    for l in probeU1:
      c.append(l[i])
      C=c-np.mean(c)
      y    = np.fft.fft(C)
      freq1 = np.fft.fftfreq(len(C), d= (number[1] - number[0]))
      val = np.argmax(np.abs(y))
      ans1.append(np.abs(freq1[val]))    

      plt.plot(freq1, np.abs(y))

#print np.mean(ans1)
plt.ylabel('frequency?')
plt.savefig('vorticity frequency')
plt.show()     



data.close()

Мои данные содержат 117 датчиков, каждый из которых имеет свои собственные 121 данные о величине скорости.

Моя цель состоит в том, чтобы найти доминирующую частоту для каждого зонда, а затем собрать все и отобразить их в гистограмме.

Мой вопрос о той части, где говорится, что это происходит, когда происходит волшебство. Я считаю, что БПФ уже работает правильно

  y    = np.fft.fft(C)
          freq1 = np.fft.fftfreq(len(C), d= (number[1] - number[0]))

И если я не ошибаюсь, список freq1 должен содержать все частоты для данного зонда. Я проверил этот список визуально, и количество различных частот очень велико (20+), поэтому сигнал, вероятно, очень шумный.

# If im not mistakes this finds the peak frequency for 1 probe and passes it another list
      val = np.argmax(np.abs(u))
      ans.append(np.abs(freq1[val]))    

То, что эта часть теоретически должна принимать самый большой сигнал от одного зонда и затем помещаться в список "ans". Но я немного озадачен тем, как я не могу правильно определить правильную частоту. Как и должно быть, в теории должна быть одна основная частота. Как я могу правильно оценить "основную" частоту из всех этих данных из всех шумов

Для справки я моделирую вихревую улицу фон Карманна и ищу частоту появления вихрей. https://en.wikipedia.org/wiki/K%C3%A1rm%C3%A1n_vortex_street

Может кто-нибудь помочь мне, как решить эту проблему?

1 ответ

Линия

freq1 = np.fft.fftfreq(len(C), d= (number[1] - number[0]))

Только генерирует индекс, исходя из

freq1 = [0, 1, ...,   len(C)/2-1,     -len(C)/2, ..., -1] / (d*len(C))

Что полезно для вычисления вашего массива частот как

freq[i] = freq1[i]*alpha

куда alpha Ваш основной волновой номер рассчитывается как

alpha = 1/Ts

бытие Ts ваш период выборки. Я думаю, потому что freq1 Не масштабируемый вами массив частот настолько высок.

Обратите внимание, что если вы выбираете данные, используя разные временные интервалы, вам нужно будет интерполировать их в равномерном пространстве, используя numpy.interp (например).

Чтобы оценить основную частоту, просто найдите индекс, где преобразованная в FFT переменная выше, и свяжите этот индекс с freq[i],

Другие вопросы по тегам