Описание тега frequency-distribution

Частотное распределение - это набор значений, которые одна или несколько переменных принимают в выборке.
1 ответ

Эффективный алгоритм подсчета частоты чисел в интервалах

Мне нужно построить столбчатую диаграмму, иллюстрирующую распределение псевдослучайных чисел, определяемое линейным конгруэнтным методом. Xn+1 = (a * Xn + c) mod m U = X/m на интервале [0,1] Например: Interval Frequency [0;0,1] 0,05 [0,1;0,2] 0,15 […
2 ответа

Частота элемента r и имя столбца

У меня есть фрейм данных, который имеет четыре столбца A, B, C и D: A B C D a a b c b c x e c d y a d z e f Я хотел бы получить частоту всех элементов и списки столбцов, которые они отображают, упорядоченные по частоте ранжирования. Вывод будет прим…
26 мар '15 в 22:45
4 ответа

Как вычислить частоту букв в строке, используя встроенную карту питонов и сократить функции

Я хотел бы вычислить частоту букв в строке, используя карту питонов, и сократить встроенные функции. Может ли кто-нибудь рассказать о том, как я могу это сделать? Что у меня так далеко: s = "the quick brown fox jumped over the lazy dog" # Map functi…
05 ноя '12 в 23:31
0 ответов

Представление строк индекса в виде диапазона значений в "сводной таблице" "Python Pandas"

Пример данных: exdata = {'year':[1 ,2 ,5 ,7 ,2 ,3 ,2 ,4 ,8 ,9], 'price':[120 ,99 ,55 ,23 ,87 ,31 ,149 ,45 ,32 ,55], 'dist':[999 ,3741 ,8893 ,5321 ,1987 ,9299 ,573 ,4732 ,4536 ,4032], 'loca':['a' ,'b' ,'a' ,'c' ,'d' ,'d' ,'a' ,'e' ,'c' ,'a']} Использ…
1 ответ

Python чертит условные частотные распределения

Я довольно новичок в Python, поэтому я работаю над книгой nltk. Я также пытаюсь познакомиться с манипулированием графиками и графиками. Я построил условное распределение частот и хотел бы начать с удаления верхнего и левого позвоночника. Вот что у м…
19 май '14 в 21:48
4 ответа

Как преобразовать распределение частот в распределение вероятностей в R

У меня есть матрица с n рядами наблюдений. Наблюдения - это частотные распределения характеристик. Я хотел бы преобразовать частотные распределения в вероятностные распределения, где сумма каждой строки равна 1. Поэтому каждый элемент в матрице долж…
0 ответов

Получить количество образцов в nltk FreqDist

Я использую NLTK для распределения частот части речевых тегов по всему корпусу. Я сделал этот fdist, теперь я хотел бы получить количество различных частей речевых тегов, которые появились в fdist - как я могу это сделать? Возникли проблемы с поиско…
11 ноя '17 в 02:52
2 ответа

Подгоните 1000 образцов к нормальному распределению, используя Максимальное правдоподобие в C++

У меня есть образец 5000 парных как образец = {1,23, -4,67, 0,17, 1,25, 6,89, -2,03, ...} и хотим подогнать данные к параметрическим распределениям, таким как N(mu, sigma) или обобщенный студент t(loc, scale, DoF)... У меня уже есть PDF-файлы этих р…
1 ответ

Расчет индекса колокейшн для большого набора данных R

У меня сложный вопрос, состоящий из нескольких частей. Мои извинения, если я не проясняю себя. Я также довольно начинающий пользователь R, так что простите, если это кажется рудиментарным. Я хочу рассчитать индекс колокейшн для данных о китах и ​​ра…
21 июн '13 в 21:48
2 ответа

Вычислить вероятность для двух дискретных переменных в R

Итак, у меня есть что-то вроде: V1 V2 X B Y A X A Y B X B X B И мне нужно: A B X 0.17 0.5 Y 0.17 0.17 * Примечание: они не суммируют до 1, потому что я округляю 1.666 в 1.7.*
27 янв '14 в 15:37
2 ответа

Определить частоту общего шаблона из числа целых чисел

У меня есть много строк целых чисел с 7 столбцами в каждой, это некоторые биологические точки, записанные из эксперимента. Числа только от 1 до 7, и я хотел бы определить общий шаблон этих целых чисел. first few rows of df: [,1] [,2] [,3] [,4] [,5] …
2 ответа

Перевести "вероятность X в каждом периоде" в "следующий случай в F(случайный, X) секундах"

Для замены существующего алгоритма "каждый период N сравнивает случайное число с вероятностью X", что является правильной функцией F вместо этого вычислить случайную задержку до следующего вхождения? Я хочу переписать существующую функцию. псевдокод…
0 ответов

Как я могу изменить нерегулярную волну в ряд Фурье

Я сделал неправильную волну, состоящую из 16 регулярных волн со случайной разностью фаз. Кроме того, я попытался разделить нерегулярную волну на несколько волн, которые являются формами рядов Фурье. Поэтому я сделал код ниже строки 11. Но когда я за…
06 окт '16 в 05:50
1 ответ

Эффективный способ получить частотное распределение значений в большой таблице MySql

У меня есть две таблицы, а именно. Total_Data и Distinct_S1. Total_Data имеет 3,5 миллиона строк. Поля: "S1", "S2", "S3", "S4" Distinct_S1 имеет 1 миллион строк. Поля: "S1", "частота". "S1" Distinct_S1 состоит из всех различных значений, которые вст…
1 ответ

DAX - Показать счетчик 1 верх в рассчитанном столбце

У меня есть столбец [Company], у меня есть столбец [Billing day] в листе PowerPivot. Компания может иметь несколько разных расчетных дней. Я хочу показать в сводной таблице рядом с названием компании день выставления счетов с наибольшим числом вхожд…
0 ответов

R - Как определить диапазон бинов для таблицы частот

Я относительно новичок в R и хочу определить пользовательский диапазон бинов для моих данных, чтобы сгенерировать таблицу частот. Data: 0,1,0,0,0,1,5,1,3,0,9,12,0,18,0 Bins: 0 / 0-1 / 1-3 / 3-9 / 10-15 / >15 Я нашел функции для последовательного …
29 май '18 в 17:35
1 ответ

Используйте R для вычисления медианы без репликации элементов

У меня распределение частот с огромными числами. Я хочу вычислить медиану и квартили, но R жалуется. Вот что работает для небольших номеров: > TABLE <- data.frame(DATA = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19), F = c(48,0,192,1152,5…
29 мар '18 в 16:13
2 ответа

Мне нужно найти распределение данных из сети розничной сети. Распределение данных не соответствует

Мне нужно найти распределение данных, которые поступают из сети розничной сети (спрос на продукцию во всех магазинах). Я попытался приспособить дистрибутив, используя EasyFit (который имеет 82 дистрибутива, чтобы проверить лучшие дистрибутивы), но н…
1 ответ

R получить распределение частоты по категориальному или факторному столбцу

У меня есть данные, как показано ниже. Если я хочу найти распределение частоты, то я могу использовать команду Hist, как показано ниже, и используя histz$breaks а также histz$counts найти количество наблюдений, которые попадают в каждый диапазон. Я …
1 ответ

FreqDist с nltk: ValueError: слишком много значений для распаковки

Я пытался найти распределение частот существительных в данном предложении. Если я сделаю это: text = "This ball is blue, small and extraordinary. Like no other ball." text=text.lower() token_text= nltk.word_tokenize(text) tagged_sent = nltk.pos_tag(…
14 ноя '13 в 10:31