Описание тега reproducible-research

Воспроизводимое исследование - это идея о том, что результат научного исследования должен публиковаться с данными и кодом, чтобы другие исследователи могли проверить результаты.
10 ответов

Модульные тесты для функций в ноутбуке Jupyter?

У меня есть блокнот Jupyter, который я планирую запустить несколько раз. В нем есть функции, структура кода такова: def construct_url(data): ... return url def scrape_url(url): ... # fetch url, extract data return parsed_data for i in mylist: url = …
0 ответов

Настройка структуры данных R для воспроизводимых исследований

Фон Я получаю почасовые интервальные отчеты об оборудовании в зданиях, большом количестве зданий и большом количестве оборудования. Каждый параметр на оборудовании называется точкой, и у них уже есть имя, я не могу выбрать название точки. Каждое имя…
23 фев '18 в 20:49
0 ответов

Возможен ли воспроизводимый сравнительный анализ?

Мне нужно протестировать некоторые каркасы узлов или, по крайней мере, их часть маршрутизации. Это означает, что запрос поступает в процесс узла для обработки до тех пор, пока не будет определен маршрут и не будет вызвана функция / класс с бизнес-ло…
0 ответов

Маркировка переменных в результатах регрессии (воспроизводимые исследования)

Я добился того, чтобы получить правильно отформатированные результаты регрессии, используя функцию glm(), а затем построил таблицу (myTable). > myTable <- cbind("Estimate" = coef(FulMod), "Std. Error" = summary(FulMod)$coefficients[,2], ,"p va…
06 янв '14 в 14:41
1 ответ

Пакет для форматирования числовых значений в воспроизводимых исследованиях

Существует ли стандартный способ преобразования числовых значений в символы с применением определенного типа форматирования. Я думаю о чем-то вроде: formatR(32390,"dollars") # returns "$32,390" formatR(1.25,"percent") # returns "125%" Очевидно, не т…
13 май '13 в 17:45
0 ответов

install_bitbucket или install_github и установить конкретные версии зависимостей

У меня есть пакет, размещенный в частном репозитории bitbucket, и я хотел бы установить мой пакет вместе с конкретными версиями его зависимостей, указанными в разделе Depends файла DESCRIPTION: Depends: R (>= 2.15.0), foo (== 1.17-12) Есть ли спо…
30 янв '15 в 00:12
0 ответов

Альтернативный подход к воспроизводимым исследованиям, где исходный код является основной средой

TL;DR: Подход общего динамического документа (стиль записной книжки IPython) к воспроизводимым исследованиям обычно не приводит к многократному использованию модулей исходного кода. Существуют ли инструменты / подходы, которые используют исходный ко…
0 ответов

Как я могу получить данные для выполнения таких операций, как ANOVA для исследовательских работ?

Как получить данные для анализа для исследовательских работ, так как я не могу довести свой аппарат до 100 пациентов и измерить необходимые параметры. Есть ли доступный банк данных?
1 ответ

Выборка графика в R

Я хочу сделать ориентированный граф в R, создав 2 фрейма данных: один для вершин и один для ребер. Кроме того, мой график должен иметь следующие атрибуты: Нет круга (следовательно, нет A -> A) Существует максимум 1 ребро между 2 узлами. Я пришел с к…
26 май '16 в 13:21
3 ответа

Безопасность формата архива xz

Ища хороший вариант для хранения больших объемов данных (в основном из численных расчетов) в долгосрочной перспективе, я пришел к использованию xz формат архива (tar.xz). Сжатие по умолчанию LZMA обеспечивает значительно лучший размер архива (для мо…
0 ответов

Повышение градиента и его использование

Я попытался найти несколько примеров применения "повышения градиента", но не смог найти реального понимания. Может ли кто-нибудь помочь в обеспечении лучшего понимания "повышения градиента" с некоторыми примерами из реальной жизни, которые решаются …
08 июн '18 в 05:17
2 ответа

Млр: почему воспроизводимость настройки гиперпараметра не удается при распараллеливании?

Я использую код на основе примера быстрого запуска в mlr шпаргалка Я добавил распараллеливание и попытался настроить параметры несколько раз. Вопрос: Почему воспроизводимость не работает (почему результаты не идентичны), даже если я установил set.se…
1 ответ

Используя систему сборки для воспроизводимых исследований?

Я делаю исследовательский проект, который включает в себя конвейер программ, каждый из которых генерирует выходной файл, который становится входом для следующей программы. Я хотел бы упростить повторение серии команд, которые я использовал для созда…
11 авг '10 в 09:01
2 ответа

Как импортировать / расширять ссылки noweb в оцененных (экспортируемых) исходных блоках в org-babel?

Я пытаюсь сделать что-то вроде этого: * Define some functions #+begin_src python :noweb_ref defs def f1(a,b,c): return True def f2(d,e,f): return False #+end_src * Use them in a results-exported block later #+begin_src python :results output :export…
1 ответ

Использование knitr для создания сложных динамических документов

Минимальный воспроизводимый пример (RE) ниже - моя попытка выяснить, как я могу использовать knitr для генерации сложных динамических документов, где "сложный" здесь относится не к элементам документа и их разметке, а к нелинейной логике базовых фра…
1 ответ

Проблема с установкой Pandoc на Ubuntu 14.04LTS для использования с R Markdown

Этот вопрос является следствием моих попыток получить некоторый опыт в создании воспроизводимых отчетов из R Markdown документы через knitr а также rmarkdown Р. пакеты. Пока кажется что .Rmd => HTML преобразование автоматизировано изнутри RStudio…
21 июл '14 в 10:42
1 ответ

Блок кода с использованием repmis::dropboxData работает в одном проекте Rstudio, но не в другом

У меня есть два R проекта, связанных с репозиториями GitHub. Я использую функцию repmis source_DropboxData для загрузки файла, а затем tbl_df в dplyr В обоих проектах код: require(repmis) require(plyr) require(dplyr) require(tidyr) require(ggplot2) …
12 фев '15 в 14:46
1 ответ

Scrapy: Как воспроизвести результаты, не загружая HTML снова?

Загрузив HTML-код на мой жесткий диск с помощью Scrapy (например, используя встроенный Экспортер элементов с полем HTMLили сохраняя все файлы HTML в папке), как я могу использовать Scrapy, чтобы снова прочитать данные с моего жесткого диска и выполн…
1 ответ

Воспроизвести линейный график в matplotlib или R

Я наткнулся на замечательную фигуру, которая суммирует (научное) сотрудничество авторов за годы. Фигура наклеена ниже. Каждая вертикальная линия относится к одному автору. Начало каждой вертикальной линии соответствует году, в течение которого соотв…
2 ответа

Регистрация входа и выхода в консоли Spyder

Я научился манипулировать данными и анализировать их через Stata и использовал команду log для записи всех написанных команд и сгенерированного вывода. При этом я мог воспроизвести свои результаты, проверить предыдущие результаты и поделиться ими с …