Есть ли аккуратный способ проверить наличие в интервале всех значений в массиве, используя панд (или другой инструмент python)?
pandas.Interval может использоваться, чтобы определить, аккуратно ли значение попадает в интервал, например:
In [1]: import numpy as np
In [2]: import pandas as pd
In [3]: iv = pd.Interval(0, 5.5)
In [4]: 4.37 in iv
Out[4]: True
Можно ли проверить включение для всех элементов массива вместо одного значения? Результат будет таким же, как в:
In [5]: arr = np.array(((1,8),(-4,3.5)))
In [6]: arr
Out[6]:
array([[ 1. , 8. ],
[-4. , 3.5]])
In [7]: (arr > iv.left) & (arr <= iv.right)
Out[7]:
array([[ True, False],
[False, True]])
Но используя более простой синтаксис, который хорош в pd.Interval. Нечто подобное ниже, которое не работает:
In [8]: arr in iv
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-15-a118a68ee023> in <module>()
----> 1 arr in iv
pandas/_libs/interval.pyx in pandas._libs.interval.Interval.__contains__()
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all()
1 ответ
Проверить с vectorize
def youf(x,iv):
return x in iv
vfunc = np.vectorize(youf)
iv = pd.Interval(0, 5.5)
vfunc(arr, iv)
Out[27]:
array([[ True, False],
[False, True]])