Описание тега revoscaler

вопросы, касающиеся пакета RevoScaleR для R от Microsoft.
0 ответов

Azure / R-сервер - голова вызывает зависание процесса

Я пытаюсь использовать head команда для набора данных hd fs в Azure с использованием R-сервера через RStudio. Это работало в прошлом, но в последние 2 дня кажется, что оно перестало работать. Когда я выполняю его, он говорит мне, что процесс запущен…
21 ноя '17 в 15:24
0 ответов

Получение весов из объекта rxGlm

Еще один вопрос rxGlm()... Установив GLM, используя эту функцию, MyGlm <- rxGlm(Response.Variable ~ 1 + F1 + F2 + F3, family = gaussian, data = my.df, dropFirst = TRUE, pweights = "myWeights" ) Я знаю, как извлечь определенную информацию из объек…
17 дек '18 в 22:43
0 ответов

RevoscalePY на SQL Server 2017 не работает должным образом

Кто-нибудь имеет опыт использования функций RevoscalePY на SQL Server 2017. Я пишу простой rx_data_step, и он не работает для меня. Вот код: execute sp_execute_external_script @language = N'Python', @script = N' import revoscalepy as rp file= rp.RxX…
13 июн '18 в 17:34
0 ответов

Веса в rxLogit игнорируются

Я оцениваю модель, используя rxLogit из пакета RevoScaleR. Я хочу включить веса для учета несбалансированности данных, используя опцию pweights. Это прекрасно работает, когда я явно указываю формулу внутри команды rxLogit. Однако когда я задаю форму…
07 мар '18 в 16:57
2 ответа

Группировать по файлу XDF?

Скажем, у меня есть огромный исходный XDF-файл, созданный с помощью RevoScaleR. Я хочу создать новый целевой XDF, сгруппировав исходные записи в столбцах A, B, C и вычислив сумму, min, max, avg, std отклонение в столбце D. Давайте предположим, что ц…
13 июн '18 в 14:27
1 ответ

Сокращение длины вызовов функций в R - revoScaleR rxGLM()

Я использую R для создания некоторых моделей GLM на большом наборе данных в данный момент. Из-за своего размера я использую функцию rxGlm() в пакете revoScaleR - она ​​работает намного быстрее, чем базовая функция glm(). Я сохраняю все вызовы функци…
16 дек '18 в 08:56
0 ответов

rxDForest в файле xdf

У меня есть.xdf файл "Поезд" и "Тест". Я пытаюсь смоделировать деревья регрессии с помощью функции rxDForest, однако, когда я включаю категориальную переменную country_id который имеет 49 уровней, как предиктор, функция просто не завершается, и мне …
09 окт '18 в 02:53
0 ответов

Клиент Microsoft R: ​​RevoScaleR: "Соединение не открыто" SQL Server

Я сейчас пытался подключиться к SQL Server из R в течение некоторого времени. #sConnString <- "Driver={SQL Server};Server=(local);Database=GEO_CORE_LAS;Trusted_Connection=True" sConnString <- "Driver={SQL Server};Server=(local);Database=xxx;Ui…
19 янв '18 в 16:29
1 ответ

Как использовать RevoScaleR для чтения данных SAS по частям и вывода в формат, отличный от xdf?

Я пытаюсь разработать код с помощью RevoScaleR и заметил, что у него есть такие параметры, как rowsPerRead и может выводить файлы xdf в виде фрагментов, используя метод rxImport. Однако в моих случаях использования я хочу применить некоторые пользов…
15 ноя '17 в 01:56
0 ответов

Как я могу разделить данные на обучить и проверить с помощью команды rxExec?

Когда я использовал rxSplit разделить данные на обучать и тестировать в setcomputecontextЯ получаю сообщение об ошибке ниже, пожалуйста, используйте rxExec обрабатывать вызов в распределенном контексте. КОД: data_split<-rxSplit(inData = localDS ,…
22 мар '18 в 13:57
0 ответов

R в SQL Server не использует доступный процессор (используется только 5%)

Я использую сервер SQL в качестве контекста моего компьютера для RevoScaleR, при работе в локальном параллельном контексте мой процессор (8 ядер) в течение нескольких часов достигает 100%, но при использовании контекста SQL сервер (20 ядер) остается…
21 дек '17 в 17:26
1 ответ

Azure / R-сервер - rxK означает запись файла без заголовка

Я делаю кластеризацию kmeans в Azure / R-сервере, и мне нужно иметь возможность написать файл, который не имеет заголовка. Пока что я пробовал: k1 <- rxKmeans(formula = ~ var1 + var2 + var3, data = df, seed = 10, numClusters = 5 , outFile = dfOut…
09 ноя '17 в 18:50
0 ответов

Сервер Azure / R - как сохранить объект модели GBM

Я пытаюсь сохранить объект модели gbm в экосистеме Azure. Я извлекаю данные из файла данных в Rstudio (HDInsight / Rserver) в виде data.frame. Затем я обучаю модель с использованием пакета gbm (традиционная версия R - не RevoScaleR). Однако я не уве…
14 дек '17 в 15:54
1 ответ

RStudio - RevoScaleR (Windows)

Может ли этот пакет использоваться для (1) RStudio Desktop/Open; и / или (2) RStudio Server (также использующий SQL Server 2017 Enterprise)? В первую очередь я заинтересован в RStudio Desktop, но не могу найти что-либо онлайн после примерно одного ч…
09 окт '18 в 18:57
0 ответов

Ошибка с rxPredict при использовании обученной модели для прогнозирования другого подмножества данных с одинаковыми атрибутами

Я тренирую свою модель, используя rxNaivebayes на data1. model <- rxNaiveBayes(formula = modelFormula, data = data1, covCoef = TRUE, importance = TRUE) Но когда я пытаюсь предсказать из одной и той же обученной модели разные данные, которые имеют…
1 ответ

rxDataStep не удалось загрузить данные в таблицу SQL Server

Я пытаюсь загрузить результат SQL-запроса в новую таблицу после некоторого преобразования. Но даже самый простой сценарий не работает. DECLARE @inquery nvarchar(max) = N' SELECT TOP 2000000 * from SQL Table' DECLARE @Rscript nvarchar(max) = N' sqlCo…
1 ответ

RxCrossTable: преобразование не работает

Я делаю это упражнение и не могу найти ошибку. Данные являются подвыборкой набора данных такси Нью-Йорка (mht_lab2.zip на Github). В этом текущем упражнении я должен составить таблицу поездок на короткие и длинные расстояния против поездок на коротк…
14 сен '18 в 11:16
0 ответов

Revoscaler rxBtree / rxDForest - Как построить классификатор

Я использую пакет Revoscaler в Azure на R-сервере и пытаюсь определить, как создать двоичный классификатор. Данные, которые я помещаю в модель для целевой переменной, являются целыми числами (1 или 0). Это нормально, или мне нужно использовать строк…
07 дек '17 в 18:10
0 ответов

Значение по умолчанию для строк при отсутствии в импорте Revoscalepy?

RevoscalePy-х rx_import функция не имеет missingValueString Значение параметра, вопреки RevoscaleR. В документации не упоминается, что происходит с пропущенными строками. Они настроены на None? Что произойдет, если strings_as_factors опция установле…
03 июл '18 в 13:33
1 ответ

RevoScaleR rxDataStep выбор строки не удается при использовании переменной

Я пытаюсь выполнить выбор в xdf-файл с помощью rxDataStep. Я использую rowSelection, и он работает, когда я использую явные значения, но не когда я использую переменную, например: это работает: tmp <- rxDataStep(alias.Xdf, transforms = list(TT_AM…
23 ноя '17 в 17:22