Правильное использование лямбда-функции с пандами

Я хочу применить функцию к DataFrame для создания нового кадра данных со средними значениями с использованием лямбды, и я получаю эту ошибку:

TypeError: ("Аргумент 'real' имеет неправильный тип (ожидаемый numpy.ndarray, получил Series)", вы произошли с индексом 2018-01-02 00:00:00')

вот мои данные:

  AA        AAPL          FB         GOOG        TSLA  
Date                                                                     
2018-01-02  55.169998  168.987320  181.419998  1065.000000  320.529999   
2018-01-03  54.500000  168.957886  184.669998  1082.479980  317.250000   
2018-01-04  54.700001  169.742706  184.330002  1086.400024  314.619995   
2018-01-05  54.090000  171.675278  186.850006  1102.229980  316.579987   
2018-01-08  55.000000  171.037628  188.279999  1106.939941  336.410004   
2018-01-09  54.200001  171.018005  187.869995  1106.260010  333.690002  

и это то, что я пытаюсь до сих пор:

data = pd.read_csv('help.csv', parse_dates=True, index_col=0)
sma20 = data.apply(lambda x: ta.SMA(x, 20), axis=0)
print(sma20.tail())

1 ответ

Решение

В более поздних версиях панд вы можете предоставить raw=True аргумент, если вы хотите apply пройти ndarray к вашей функции.

# data.apply(lambda x: ta.SMA(x, 20), axis=0, raw=True)
# Same as,
data.apply(ta.SMA, axis=0, raw=True, args=(20, ))

PS: вам не нужно lambda,

Другие вопросы по тегам