Отличие случайных графиков gnp от групповых предпочтительных вложений с использованием пакета powerlaw python
Моя цель - найти точку, где безмасштабные сети становятся неотличимыми от случайных (безмасштабных) сетей с помощью пакета python powerlaw
Как указано в их статье, следует всегда определять добротность степенного соответствия, сравнивая его с соответствием другому распределению.
Я ожидаю, что будет реализовано что-то вроде биномиального распределения для сравнения качества соответствия, но это не так.
Например, я попробовал следующий код, чтобы различить сеть без масштаба и сеть без масштаба (с одинаковым количеством узлов / ребер):
non_sf_graph = nx.gnp_random_graph(10000, 0.002)
sf_graph = nx.barabasi_albert_graph(10000, 10)
fitpl = powerlaw.Fit(list(sf_graph.degree().values()))
fitnpl = powerlaw.Fit(list(non_sf_graph.degree().values()))
for dist in fitpl.supported_distributions.keys():
print(dist)
fitpl.distribution_compare('power_law', dist)
fitnpl.distribution_compare('power_law', dist)
Выходные данные показали, что ни одно из реализованных распределений не предоставило инструмент для разграничения между моделью предпочтительного вложения и случайным графом gnp:
lognormal
(-0.23698971255249646, 0.089194415705275421)
(-20.320811335334504, 3.9097599268295484e-92)
exponential
(511.41420648854108, 7.3934851812182895e-23)
(24.215231521373582, 3.7251410948652104e-08)
truncated_power_law
(3.3213949937049847e-06, 0.99794356568650555)
(3.1510369047360598e-07, 0.99936659460444144)
stretched_exponential
(16.756797270053454, 1.6505119872120265e-05)
(8.7110005915424153, 8.7224098659112012e-05)
lognormal_positive
(30.428201968820289, 1.7275238929002278e-07)
(6.7992592335974233, 5.4945477823229749e-06)
(знак первого значения указывает, является ли первое (положительное) или второе (отрицательное) распределение более подходящим, второе значение - это p-значение для значимости этого решения)
Я иду на эту проблему с неправильной точки зрения, или я должен реализовать биномиальное распределение самостоятельно?
Я спрашиваю, поскольку я не эксперт по статистике, и я не вижу значимости всех доступных дистрибутивов. Но они, похоже, не справились с этим основным примером.