Описание тега resampling
Передискретизация - это любой из множества методов оценки точности статистики выборки путем складывания ножей или бутстрэппинга. В нем также используется для проверки моделей с использованием случайных подмножеств (начальная загрузка, перекрестная проверка).
2
ответа
Вложенная повторная выборка + LASSO (regr.cvglment) с использованием млр
Я пытаюсь провести вложенную повторную выборку с 10 CV для внутреннего и 10 CV для внешнего цикла, используя regr.cvglment. Mlr предоставляет код с помощью функции-оболочки ( https://mlr-org.github.io/mlr/articles/tutorial/devel/nested_resampling.ht…
22 июн '18 в 21:00
1
ответ
'resample', чтобы иметь одинаковый размер сигналов
У меня есть 4 (2 тарифа и 2 раза) сигналов, и мне нужно выровнять их размеры. Я отрежу их в первую очередь, потому что мне это тоже нужно. Размер первого сигнала и скорости - 3901, другой - 830. Но не только для удаления элементов, я хочу сохранить …
17 авг '18 в 13:42
1
ответ
Генерировать n образцов, Отклонение выборки в R
Отбор проб Я работаю с выборкой отклонения с усеченным нормальным распределением, см. Код r ниже. Как я могу остановить выборку на определенном n? например 1000 наблюдений. Т.е. я хочу остановить выборку, когда число принятых выборок достигло n (100…
04 янв '18 в 13:51
3
ответа
Как проверить понижающую дискретизацию, как задумано
Как проверить правильность вывода с понижением частоты. Например, я сделал несколько примеров, однако я не уверен, что вывод правильный или нет? Любая идея по валидации Код import numpy as np import matplotlib.pyplot as plt # For ploting from scipy …
11 окт '18 в 04:54
1
ответ
Python PANDAS: пересчет многовариантных временных рядов с помощью группового
У меня есть данные в следующем общем формате, который я хотел бы изменить на 30-дневные окна временных рядов: 'customer_id','transaction_dt','product','price','units' 1,2004-01-02,thing1,25,47 1,2004-01-17,thing2,150,8 2,2004-01-29,thing2,150,25 3,2…
06 окт '17 в 18:10
1
ответ
Интерполировать немонотонно дискретизированный массив ND вдоль одного измерения
У меня есть 3D-объем (80x80x3 точек) измеренных значений ([646 2] значений и временных точек). Эти данные не упорядочены, и время между выборочными временными точками не равноудалено. Я хотел бы сделать повторную выборку / интерполяцию, чтобы иметь …
02 дек '13 в 12:55
0
ответов
Ресэмплирование аудио выхода для A2DP (из PCM WAV)
Как мне взять стерео PCM WAV 32,000Hz с потоком 1024 kbps (125 KB) на гарнитуру с Bluetooth 2.1 на смартфоне CM7 с DSPManager? Это возможно? SBC действительно плохая идея. Может быть, это возможно с профилем гарнитуры (HSP)? Я не знаю о поддерживаем…
13 сен '12 в 22:34
0
ответов
Присваивать наблюдения часам питона
У меня есть пандас dataframe: start end city 2010-08-08 20:05:00 2010-08-08 22:05:00 NY 2010-08-08 21:05:00 2010-08-08 21:35:00 NY 2010-08-09 08:05:00 2010-08-08 08:55:00 SF Мне нужно получить фрейм данных, который бы подсчитывал, по каждому городу,…
20 дек '18 в 15:06
2
ответа
Pandas resample и заполнить листья NaN в конце
Я хочу улучшить серию от еженедельной до ежедневной частоты, заполняя результаты. Если последнее наблюдение моей оригинальной серии NaNЯ ожидал, что это значение будет заменено предыдущим действительным значением, но вместо этого оно останется NaN, …
29 янв '19 в 10:10
2
ответа
Передискретизация данных в целевой сетке
Есть ли эффективный способ решить следующую проблему? Представьте, что у нас есть эти 2 списка. Они представляют неравномерно выбранные данные: MeasTimes = [0, 2, 4, 6, 8, 11, 12, 14, 18, 20, 22] MeasValues = [-1, 0, 1, 0, -1, 0.5, 1, 0, 0, 1, 0] Ка…
13 авг '15 в 12:54
0
ответов
Объяснение разницы в оригинальной и начальной загрузке
У меня есть следующая функция; (1) вычислить разницу отклонений для каждой имеющейся у меня переменной и (2) выполнить загрузку для разницы отклонений, которую я рассчитал на первом шаге set.seed(1001) xfunction <- function(d,i) { glm.snp1 <- …
24 фев '16 в 16:31
1
ответ
Вычисление процентилей с использованием фиксированного объема памяти
У меня есть поток значений int, поступающих с определенной скоростью. Каждые 5 минут я хотел бы вычислить некоторые процентили из значений и начать все сначала. Проблема: я не хочу тратить слишком много памяти, поэтому я хотел бы оставить только нес…
26 окт '13 в 00:52
2
ответа
Python: повышающая дискретизация с помощью операции обратного суммирования
Я хочу пересчитать столбец данных, а именно, чтобы пересчитать его наоборот sum() стиль работы, предполагая, что каждая точка четна. Меня не особо волнует значение финальной точки - для моего случая это не имеет значения. Вот упрощенная версия: Inpu…
26 фев '19 в 01:33
1
ответ
Не может импортировать имя 'NaT' при повторной выборке TimeSeries
У меня есть данные за несколько лет (как панды TimeSeries): 1997-04-02 0.0 1997-04-03 0.0 1997-04-04 2.0 1997-04-05 2.0 1997-04-06 0.0 1997-04-07 0.0 1997-04-08 0.0 Дата является индексом типа 'pandas.core.indexes.datetimes.DatetimeIndex' df.resampl…
04 фев '19 в 10:23
1
ответ
Наиболее частый случай в панде, индексируемом по дате и времени
У меня большой DataFrame который индексируется datetimeВ частности, по дням. Я ищу эффективную функцию, которая для каждого столбца проверяет самое распространенное ненулевое значение в каждую неделю и выводит фрейм данных, который индексируется по …
30 мар '17 в 14:07
1
ответ
Панды OHLCV в формате JSON
У меня есть данные в реальном времени, которые я делаю повторно с пандами, чтобы получить данные OHLCV: ohlcv = df.resample(_period).agg({'bid': 'ohlc', 'volume': 'sum'}) Фрейм данных выглядит так: volume bid volume open high low close timestamp 201…
28 авг '18 в 08:56
0
ответов
Репроекция изображения
У меня есть GridCoverage2D в EPSG:4054. Я хочу преобразовать его в EPSG:4326. Я попытался сделать это так: /** gc2d is an GridCoverage2D in EPSG:4054 */ CoordinateReferenceSystem targetCRS = crsAuthorityFactory.createCoordinateReferenceSystem("EPSG:…
31 янв '18 в 08:20
1
ответ
Pandas не сохраняет формат частоты при экспорте в Excel
У меня есть месячный фрейм данных, и после повторной выборки к годовым данным я использовал Pandas to_period('M'), чтобы индекс отображался в месячном формате. Это отлично работает. Когда я экспортирую в Excel, он находится в формате datetime. Как с…
03 окт '17 в 18:58
2
ответа
Повышение (дезагрегация) суммированных квартальных данных к ежемесячным данным
Я пытаюсь повысить данные с агрегированных квартальных до ежемесячных данных, но цифры, показанные ниже, не являются тем, что мне нужно. Мне нужно, чтобы эти точки данных были разбиты на месячные числа (которые добавляются к следующему кварталу). Та…
10 июл '18 в 13:04
1
ответ
Повторите выборку pandas dataframe и посчитайте количество экземпляров
Если у меня есть данные, такие как: index = pd.date_range(start='2014 01 01 00:00', end='2014 01 05 00:00', freq='12H') df = pd.DataFrame(pd.np.random.randn(9),index=index,columns=['A']) df Out[5]: A 2014-01-01 00:00:00 2.120577 2014-01-01 12:00:00 …
19 мар '14 в 13:38