Описание тега patsy
Библиотека Python для описания статистических моделей и построения матриц проектирования, призванная обеспечить удобство использования R-формул в Python.
1
ответ
Почему Пэтси возвращает дополнительные столбцы, когда я добавляю значение None?
Я использую Patsy для создания матриц. Но я получаю странное поведение, когда значения None или Nan находятся в наборе данных. Как показано ниже, вместо простого удаления строки None создаются дополнительные столбцы с 1 и 0. import numpy as np impor…
06 апр '16 в 04:40
1
ответ
Множественная линейная регрессия с Python statsmodel
В R возможно выполнить множественную линейную регрессию, например temp = lm(log(volume_1[11:62])~log(price_1[11:62])+log(volume_1[10:61])) В Python возможно выполнить множественную линейную регрессию с формулой стиля R, поэтому я подумал, что привед…
09 окт '18 в 06:01
0
ответов
statsmodels тестирование гипотезы
Не уверен, к чему это относится, поэтому спрашиваю об этом в перекрестной проверке. Я запускаю следующую регрессию: из patsy import dmatrices импортирует statsmodels.api как sm y, X = dmatrices('M ~ I(4.8*(Q**0.8)) ', data=DF, return_type='dataframe…
03 фев '17 в 14:40
1
ответ
Хватит падающей матрицей сбрасывать ряды NaN
Я хотел бы использовать Пэтси dmatrix функция для генерации проектной матрицы, в которой сохраняются строки со значениями NaN. Например, следующий код вернет матрицу дизайна с четырьмя строками, чего мы обычно хотим. Однако в этом случае я хотел бы …
01 авг '18 в 18:30
1
ответ
Как изменить линейную регрессию в Python 3.6?
Код выглядит так: import statsmodels.formula.api as smf df = pd.read_csv('reg_data.csv') f = 'inf ~ rh*temp*tl*Tt*C(location)' lm = smf.ols(formula = f, data=df).fit() Но это всегда дает мне ошибку: numbers besides '0' and '1' are only allowed with …
21 янв '18 в 21:10
2
ответа
Как определить субъекты в прогнозируемых результатах МЖС в Statsmodels?
Я делаю линейную регрессию, используя Statsmodels в блокноте Jupyter. Данные находятся в DataFrame, называемом train_base, где столбец id идентифицирует каждый уникальный предмет моей базы данных. Train_base выглядит так: id y x0 x1 x2 a123 20 8 1 3…
26 фев '19 в 22:22
1
ответ
Кластерные стандартные ошибки в statsmodels с категориальными переменными (Python)
Я хочу запустить регрессию в statsmodels, которая использует категориальные переменные и кластерные стандартные ошибки. У меня есть набор данных с колонками учреждение, лечение, год и зачисление. Лечение - это пустышка, учреждение - это строка, а ос…
24 янв '19 в 14:58
1
ответ
Преобразовать функцию стоимости в формулу statsmodels
Я хочу подогнать некоторые данные к кривой, используя это как функцию стоимости: def cost_func(x): return ((unknown_conc-x[1]*(x[0]*conc_A+ (1-x[0])*conc_B))**2).sum() Это работает при использовании scipy.optimize, но я хочу вместо этого использоват…
17 фев '18 в 12:13
1
ответ
Как подготовить большие наборы данных с помощью API Patsy?
Я провожу логистическую регрессию и испытываю проблемы с использованием API Пэтси для подготовки данных, когда они больше, чем небольшая выборка. С использованием dmatrices работать непосредственно на DataFrame, я остаюсь с этой внезапной ошибкой (о…
22 окт '14 в 06:37
0
ответов
Взвешенные наименьшие квадраты в Statsmodels vs. Numpy?
Я пытаюсь воспроизвести функциональность функции наименьших квадратов (WLS) Statsmodels с помощью функции обычных наименьших квадратов (OLS) Numpy (т.е. Numpy относится к OLS как к "наименьшим квадратам"). Другими словами, я хочу вычислить WLS в Num…
25 май '18 в 15:12
0
ответов
Python - Patsy явно установлен, но python не может его найти?
Так что моя установка для statsmodels была очень грязной - мне пришлось самому перемещать папку в папку site-packages Enthought. Но в любом случае сейчас, когда я решу import statsmodels.api as smapiЯ получаю следующий список сообщений об ошибках: I…
04 мар '16 в 04:26
1
ответ
Член перехвата Python в кубических сплайнах
Я пытаюсь понять генерацию кубического сплайна в библиотеку python. Насколько я могу видеть из вывода import numpy as np from patsy import dmatrix x = np.linspace(0., 1., 100) y1 = dmatrix("bs(x, df=6, degree=3, include_intercept=True)", {"x": x}) p…
16 июн '17 в 11:26
1
ответ
Немодифицированный индекс имени столбца в трусиках
Я использую patsy для подготовки категориальных данных к регрессии и хочу отобразить имя столбца на его индекс в DesignMatrix, Я пытался использовать column_name_indexes атрибут DesignInfo объект, но имена столбцов были изменены, чтобы отразить коди…
20 окт '17 в 08:47
1
ответ
Примерка для офсета в модной модели
Используя patsy, я понимаю, как включить или выключить перехват. Но мне не удалось получить горизонтальные смещения. Например, я хотел бы быть в состоянии соответствовать, по существу, y = alpha + beta * abs(x_opt - x_obs) с x_opt свободным в подгон…
25 окт '16 в 05:44
1
ответ
Использование функции ols с параметрами, содержащими цифры / пробелы
У меня много трудностей с использованием функции statsmodels.formula.api ols(formula,data).fit().rsquared_adj из-за характера имен моих предикторов. Предикторы имеют числа, пробелы и т. Д., Которые явно не нравятся. Я понимаю, что мне нужно использо…
01 июл '16 в 15:51
2
ответа
Горячее кодирование в трусиках
Для регрессий я обычно кодирую категориальные переменные, используя склеарны OneHotEncoder, Сейчас я изучаю использование patsy, но он не предлагает кодирование One-hot: http://patsy.readthedocs.io/en/latest/categorical-coding.html Можно ли указать …
19 окт '17 в 14:44
1
ответ
Python: Как оценить невязки в StatsModels?
Я хочу оценить остатки: (у-хет у). Я знаю, как это сделать: df = pd.read_csv('myFile', delim_whitespace = True, header = None) df.columns = ['column1', 'column2'] y, X = ps.dmatrices('column1 ~ column2',data = df, return_type = 'dataframe') model = …
15 фев '16 в 19:02
0
ответов
Является ли это ожидаемым поведением "патси" при построении матрицы проектирования двухуровневой категориальной переменной без перехвата?
(patsy v0.4.1, python 3.5.0) Я хотел бы использовать patsy (в идеале через statsmodels) для построения матрицы дизайна для регрессии. Формула в стиле "трусливый", которую я хотел бы подогнать, response ~ 0 + category где категория - это двухуровнева…
11 мар '16 в 16:07
2
ответа
Создать пользовательскую функцию в Patsy
import patsy from patsy import dmatrices, dmatrix, demo_data dt=pd.DataFrame({'F1':['a','b','c','d','e','a'],'F2':['X','X','Y','Y','Z','Z']}) я знаю, что я могу сделать это dmatrix("1+I(F1=='a')",dt) но могу ли я создать произвольную функцию patsy? …
12 июн '18 в 01:10
1
ответ
<Python + Patsy> Почему имя фиктивных переменных с / без T?
С помощью patsyЯ заметил, что он иногда называл фиктивные переменные T и без T в других случаях. И сегодня я понял, что T присоединяется, когда постоянный член присутствует в уравнении регрессии, и нет T без постоянного срока. Например, сравнить z[T…
05 янв '19 в 03:35