Описание тега sample-size

1 ответ

Оптимизация для глобального минимума

Я пытаюсь использовать optimize() найти минимальное значение n для следующей функции (нижняя граница Клоппера-Пирсона): f <- function (n, p=0.5) (1 + (n - p*n + 1) / (p*n*qf(p= .025, df1= 2*p, df2= 2*(n - p + 1))))^-1 И вот как я попытался его оп…
1 ответ

Минимальное количество наблюдений при выполнении Random Forest

Можно ли применить RandomForests к очень маленьким наборам данных? У меня есть набор данных со многими переменными, но по 25 наблюдений. Случайные леса дают разумные результаты с низкими ошибками OOB (10-25%). Есть ли эмпирическое правило относитель…
09 июл '13 в 09:19
0 ответов

Регрессия или классификация? Как определить размер выборки?

У меня есть группа экземпляров с n функций (числовые) каждый. Я пересэмплирую свои функции каждые X временных шагов, поэтому у каждого экземпляра есть набор функций в момент времени t1:tn. Переменная ответа продолжения (например, в диапазоне 50:100)…
1 ответ

SMOTE in r значительно уменьшает размер выборки

У меня есть набор данных около 130000 записей. Записи делятся на два класса целевой переменной,0 и 1. 1 содержит только 0,09% от общей доли. Я выполняю анализ в R-3.5.1 в Windows 10. Я использовал алгоритм SMOTE для работы с этим несбалансированным …
11 фев '19 в 06:36
0 ответов

Мощность графика в зависимости от размера выборки в соответствии с нечетным соотношением

Извините, если это общий вопрос, но я немного наивен в этой теме. Мне нужно оценить размер выборки для логистической многопараметрической регрессии, построив график зависимости размера выборки от статистической мощности с различными нечетными соотно…
0 ответов

Расчет размера выборки с F-распределением в R-программе

Мне нужно рассчитать требуемый размер выборки населения в нецентральном F. Определил пилотные выборки и мощность. Я не уверен, что код правильный и хорошо представлен для этого. Дайте мне знать, если что-то не так или требуется какая-либо модификаци…
29 ноя '17 в 15:56
1 ответ

Исключить категории в боксплоте в соответствии с размером / частотой выборки

У меня есть большая база данных, из которой я хотел бы создать коробочный график: данные: test.hospital y: результаты испытаний (%): всего 1500 образцов х1: разные годы (2011-2017) х2: разные больницы (30 разных названий больниц) Размер выборки силь…
31 июл '17 в 09:36
0 ответов

Нужны справочные статьи для определения размера выборки в клинических испытаниях

Я работаю с некоторыми клиническими испытаниями. Поэтому мне нужны статьи для определения размера выборки в различных типах клинических исследований. Я уже гуглил это. Если кто-то опыт в этой области может предложить мне некоторые артикулы, которые …
07 сен '16 в 04:45
0 ответов

Выбор размера выборки для несбалансированных данных для случайного леса в r

У меня большой набор данных (около 10000 строк), и я пытаюсь запустить классификационный случайный лес, который я намерен использовать для прогнозирования. Мои данные несбалансированы. Для исходной переменной я пытаюсь предсказать, что около 89% стр…
01 авг '17 в 11:38
1 ответ

Достаточно ли этого набора данных для обучения и тестирования модели классификации?

Мой учебный набор данных содержит всего 2 класса с 40 функциями. В случае 1 класс 1 имеет 35 образцов, а класс 2 имеет 700 образцов. В случае 2 класс 1 имеет 65 образцов, а класс 2 имеет то же значение, что и выше. Достаточно ли моего учебного набор…
1 ответ

Образец образца в R, понимая параметры

Небольшой отказ от ответственности: я подумал о том, чтобы опубликовать это на перекрестной проверке, но я чувствую, что это больше связано с программной реализацией. Вопрос может быть перенесен, если вы не согласны. Я пробую размеры пакета. Я пытаю…
09 ноя '15 в 15:51
1 ответ

Размер выборки и расчет мощности в r как жизнеспособная альтернатива мощности в SAS?

Поэтому я пытаюсь увидеть, насколько близки вычисления размера выборки (для двух независимых пропорций выборки с неравными размерами выборки) между мощностью процессора в SAS и некоторыми функциями размера выборки в r. Я использую данные, найденные …
13 мар '13 в 20:24
0 ответов

Эквивалент PROC POWER SAMPLEFREQ в R

Я хочу провести расчет мощности (тест эквивалентности: 2-стороннее биномиальное соотношение) в R. Я нашел аналогичный код в SAS (для справки показан ниже). proc power; onesamplefreq test = equiv_exact alpha = 0.05 proportion = 0.30 lower = 0.2 upper…
07 июн '16 в 12:53
0 ответов

MANOVA с переменными из разных наборов данных

Этот вопрос уже задавался на stats.stackexchange, но никто не ответил. Поскольку я не уверен, какой форум является подходящим, я публикую это здесь снова с некоторыми данными. Я провел эксперименты с различными характеристиками коры дерева и теперь …
09 дек '18 в 12:54
1 ответ

Объем обучающей выборки с переносом тензорного потока

Я хочу провести трансферное обучение на модели классификации предварительно подготовленных изображений только для двух классов, независимо от того, произошло событие А или нет. Я знаю, что переподготовка сама по себе очень эффективна. Как насчет раз…
11 апр '17 в 21:41
0 ответов

Размер выборки

У меня есть вопрос о размере выборки. Предположим, у вас есть база данных: ID - размер - цвет - и т. Д. x1... x2... ... x40000... Есть тридцать разных цветов. Например, синий цвет встречается 10.000 раз. Но зеленый цвет встречается только 20 раз. По…
13 апр '18 в 09:14
0 ответов

В Excel, как найти предел погрешности и доверительные интервалы для опросов с различными размерами выборки и размерами населения?

Я рассчитываю NPS (Net Promoter Scores) для 50 различных сессий на недавнем мероприятии. Каждое занятие посетили около 50-500 человек, а количество ответов на опрос для каждого сеанса колеблется в пределах 15-400. Если бы я знал: Количество респонде…
4 ответа

Как вы находите размеры выборки, используемые в расчетах по r?

Я использую корреляции между переменными, некоторые из которых содержат недостающие данные, поэтому размер выборки для каждой корреляции, вероятно, различен. Я пробовал печатать и резюмировать, но ни один из них не показывает, насколько велик мой n …
01 янв '13 в 20:30
2 ответа

Размер выборки для корпуса золотого стандарта Named Entity Recognition

У меня есть корпус из 170 голландских литературных романов, в которых я буду применять Признание именованных лиц. Для оценки существующих тегов NER для голландского языка я хочу вручную аннотировать именованные объекты в случайной выборке этого корп…
1 ответ

Иерархическая кластеризация с разным размером выборки на Python

Я хотел бы знать, возможно ли делать иерархическую кластеризацию с разным размером выборки на Python? Точнее, с помощью метода минимальной дисперсии Уорда. Например, у меня есть 5 списков целых чисел, A, B, C, D, E различной длины. Я хочу сгруппиров…
04 сен '17 в 15:19