Описание тега zipf
Закон Ципфа (/ ˈzɪf/) - это эмпирический закон, сформулированный с использованием математической статистики, который относится к тому факту, что многие типы данных, изучаемые в физических и социальных науках, могут быть аппроксимированы распределением Ципфа, одним из семейства связанных дискретных степенных вероятностей. раздачи.
1
ответ
Что означают параметры в scipy.stats.zipf?
Из документов Массовая функция вероятности для zipf: zipf.pmf (k, a) = 1 / (дзета (a) * k**a) для k >= 1. Zipf берет a в качестве параметра формы. Вышеуказанная функция массы вероятности определяется в "стандартизированной" форме. Для смещения распр…
22 мар '17 в 09:45
1
ответ
Распределение Zipf: Как измерить Распределение Zipf, используя Python / Numpy
У меня есть файл (скажем, corpus.txt) около 700 строк, каждая строка содержит числа, разделенные -, Например: 86-55-267-99-121-72-336-89-211 59-127-245-343-75-245-245 Сначала мне нужно прочитать данные из файла, найти частоту каждого числа, измерить…
25 апр '17 в 03:27
0
ответов
TypeError в pdf-функции powerlaw
Это мои оригинальные данные: Firms IndustrySsize 1 3598185 0-4 2 998953 5-9 3 608502 10-19 4 5205640 0-19 5 513179 20-99 6 87563 100-499 7 5806382 0-499 8 19076 500 Я перевел колонкуIndustrySsize"как показано ниже, просто чтобы увидеть, предотвратит…
03 июн '18 в 20:04
1
ответ
Как выбрать точки интерполяции, чтобы уменьшить максимальную ошибку для обратного поиска CDF
ВОПРОС: Как выбрать точки интерполяции, которые сохраняют максимальную ошибку для любой точки в каждом интерполированном сегменте в пределах указанной границы? Цель состоит в том, чтобы сформировать случайное распределение в соответствии с законом Ц…
18 июл '17 в 20:24
1
ответ
Построение "идеального" дистрибутива Zipf из данных на gnuplot
Моя цель - создать простой файл.dat и построить из него как фактические данные, так и теоретические точки идеального распределения Zipf, то есть распределения, где каждый элемент имеет значение, равное 1/(rank). Например, мои данные для большинства …
11 май '17 в 17:43
0
ответов
Генерация номеров на основе Zipf Distribution
Я хочу создать популярный дистрибутив для небольшого набора данных, который должен следовать Zipf закон. Доступные параметры:Общее количество зрителей: 1 миллионВсего видео: 36 Я хочу связать общее количество зрителей с каждым видео в соответствии с…
03 янв '17 в 08:12
1
ответ
Zipf_plot(): Как сравнить два объекта в одном графике?
Я пытаюсь использовать функцию Zipf_plot из пакета tm для сравнения двух разных терминов-матриц документа - и я не эксперт по R. Может быть, вы могли бы мне сказать, есть ли способ совместить обе функции в этой функции? Zipf_plot(x, type = "l", ... …
10 май '17 в 11:07
1
ответ
Распределение Zipf: Как измерить Распределение Zipf
Как мне измерить или найти распределение Zipf? Например, у меня есть корпус английских слов. Как мне найти дистрибутив Zipf? Мне нужно найти распределение Zipf, а затем построить его график. Но я застрял в первом шаге, который должен найти распредел…
28 апр '17 в 02:54
1
ответ
Построение распределения Zipf с помощью matplotlib, FITTED-LINE
У меня есть список абзацев, где я хочу запустить распределение zipf по их комбинации. Мой код ниже: from itertools import * from pylab import * from collections import Counter import matplotlib.pyplot as plt paragraphs = " ".join(targeted_paragraphs…
24 авг '16 в 04:23
2
ответа
Tidy text: вычислить закон Ципфа из следующей матрицы терминов
Я попробовал код с http://tidytextmining.com/tfidf.html. Мой результат можно увидеть на этом изображении. Мой вопрос: как я могу переписать код, чтобы получить отрицательную связь между термином частота и рейтинг? Ниже приведена матрица термина-доку…
05 авг '17 в 02:19
0
ответов
Питон, как проверить, соответствует ли корпус закону Зипфа?
Как говорит титул, я хочу измерить, ведет ли Распределение слов Zipf в моем корпусе как истощенный. Я уже смотрел подобные вопросы здесь на stackru и на других страницах. Мне больше всего понравился ответ: Распределение Zipf: Как измерить Распределе…
11 мар '19 в 19:56
1
ответ
Как рассчитать оптимальное распределение частот слов в тексте по zipf
Для выполнения домашнего задания я должен нанести частоту слов текста и сравнить ее с оптимальной zipf распределение. Построение подсчитанных частот слов текста в соответствии с их рангом в журнале журнала, кажется, работает нормально. Но я спорю с …
04 апр '19 в 14:49
0
ответов
Как нарисовать график распределения Zipf по приведенным данным?
Мне нужно нарисовать распределение zipf для моего корпуса. Однако я не понимаю, как это нарисовать. Я очень много нового в этой теме. Я нашел несколько ответов Stackru, но графики не выглядят так, как я хотел. У меня есть следующие данные (слово-час…
18 июн '19 в 22:08
1
ответ
Генерация недостающих значений в наборе данных на основе распределения ZIPF
В настоящее время я хочу наблюдать, как пропущенные значения влияют на мой набор данных. Я заменяю точку данных (10, 20, 90 %) на отсутствующие значения и наблюдаю за влиянием. Эта функция ниже предназначена для замены определенного процента данных …
15 окт '19 в 03:39
1
ответ
Как правильно использовать ZipfDistribution из математической библиотеки Apache Commons в Java?
Я хочу создать источник данных (на Java) на основе слов (из словаря), которые соответствуют дистрибутиву Zipf. Итак, я перехожу к ZipfDistribution и NormalDistribution библиотеки Apache Commons. К сожалению, информации о том, как пользоваться этими …
28 окт '19 в 14:45
1
ответ
Почему я получаю ошибку TypeError в этой программе Python?
# I'm trying to make a Zipf's Law observation using a dictionary that stores every word, and a counter for it. I will later sort this from ascending to descending to prove Zipf's Law in a particular text. I'm taking most of this code from Automate t…
16 ноя '19 в 14:12
1
ответ
Невозможно построить график распределения Ципфа
Я новичок в Python и машинном обучении. Я хочу построить график распределения Zipf для текстового файла. Но мой код дает ошибку. Ниже мой код Python import re from itertools import islice #Get our corpus of medical words frequency = {} list(frequenc…
22 ноя '19 в 01:35
0
ответов
Как использовать закон Ципфа, чтобы вычислить, что термины появляются только один раз?
Учитывая набор из 20 миллиардов терминов, я хотел бы найти количество уникальных терминов и количество терминов, которые появляются только один раз. ПрименяяHeaps Law я могу получить (n) = × ^, assume = 0.25, = 0.5 ➔ () = 0.25 × (20)^0.5 ≅ 35M Тепер…
26 мар '20 в 15:35
0
ответов
Создание данных фиксированного размера из заданного набора с использованием распределения вероятностей Ципфа
Мне нужно сгенерировать наборы данных из заданного набора, используя дискретные распределения вероятностей, такие как zipf, геометрические и т. Д. Например, скажем, нам дан набор элементов A=(1,2,3,4,5), мне нужно сгенерировать набор данных размером…
06 янв '20 в 16:38
0
ответов
Как использовать распределение zipf в распределении запросов между узлами
У меня сеть со 100 узлами. Использую симулятор Omnet++. В сети выдается 20 запросов в секунду, количество запросов, направленных на каждый узел, определяется распределением Zipf с параметром, равным 0,9. Не могу понять, как можно применить Zipf в ра…
07 июн '20 в 20:15