Установить / импортировать пакеты R в python с помощью rpy2, импортировать / игнорировать рассматриваемый пакет
Вот что я пытаюсь сделать:
- Я хочу использовать дискретный критерий пригодности по Колмогорову-Смирову, который в настоящее время доступен только в R. Кроме того, R также имеет нормальный тест KS - я не хочу использовать этот тест.
- Я пользователь Python, поэтому нужно перенести дискретный тест KS на Python, для этого я пытаюсь использовать
rpy2
,
Проблема, с которой я сталкиваюсь, как подробно описано здесь более подробно, заключается в том, что rpy2
кажется, заменить импортированный дискретный тест стандартной версией. Я знаю это, потому что он не дает правильного ответа при тестировании.
Попытки пока
import rpy2.robjects.packages as r
utils = r.importr("utils")
package_name = "dgof"
utils.install_packages(package_name)
результаты в
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: The downloaded source packages are in
‘/tmp/RtmpTBas6a/downloaded_packages’
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Updating HTML index of packages in '.Library'
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Making 'packages.html' ...
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: done
warnings.warn(x, RRuntimeWarning)
rpy2.rinterface.NULL
Хорошо, пока все хорошо, что должен был установить его. Итак, давайте импортируем это:
# Import Discrete goodness-of-fit package which includes KS and CVM tests.
dgof = rpackages.importr('dgof')
Это действительно импортировало это? Посмотрим:
env = r.wherefrom('dgof')
возвращается
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In addition:
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Warning message:
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: In (function (x, y, ..., alternative = c("two.sided", "less", "greater"), :
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning:
warnings.warn(x, RRuntimeWarning)
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: cannot compute correct p-values with ties
warnings.warn(x, RRuntimeWarning)
warnings.warn(x, RRuntimeWarning)
Хорошо, это странно, но, может быть, это все равно работает, давайте посмотрим ( это точно такой же пример, который используется на стороне R и должен вернуть D = 0.66667, p-value = 0.07407
):
import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np
a = np.array([1,1,1])
b = np.arange(1,3)
dgof.ks_test(a,b)
возвращается
D = 0.5, p-value = 0.925086
Если для вас это ничего не значит, это нормально, вам нужно знать, что это неправильно. Кажется, это неправильно, потому что, так или иначе, стандарт ks_test
загружается вместо дискретного (о котором мы говорим в пункте 2 в приведенном выше списке). Давайте проверим, загрузив стандартную библиотеку и тест KS:
from rpy2.robjects.packages import importr
base = importr('base')
stats = importr('stats')
import rpy2.robjects.numpy2ri
rpy2.robjects.numpy2ri.activate()
import numpy as np
a = np.array([1,1,1])
b = np.arange(1,3)
stats.ks_test(a,b)
возвращается
D = 0.5, p-value = 0.925086
Так что это круто - кто-нибудь знает, почему это может происходить?
ПРИМЕЧАНИЕ: этот вопрос связан с другим моим вопросом, но с большим количеством подробностей о Python.
1 ответ
Это действительно импортировало это? Посмотрим:
env = r.wherefrom('dgof')
возвращается
/home/usr/anaconda3/lib/python3.6/site-packages/rpy2/rinterface/__init__.py:146: RRuntimeWarning: Error: object 'dgof' not found
RRuntimeWarning
происходит от самого R, и это то, что можно ожидать. Там нет объекта dgof
потому что пространства имен пакетов R не являются объектами.
То, что вы хотите, скорее всего wherefrom('ks.test')
(см. https://rpy2.github.io/doc/v2.9.x/html/robjects_rpackages.html).
Между ними может происходить много вещей, в зависимости от того, что делает пакет 'dgof' (если вы пришли из Python, R может позволить разработчикам пакетов делать действительно странные вещи).
Вы пытались положиться на механизмы перегрузки и перегрузки функций R? После загрузки пакета R dgof
, вызов ks.test
без указания пространства имен.
dgof = rpackages.importr('dgof')
import rpy2.robjects
# "generic" function ks.test
ks_test = rpy2.robjects.r('ks.test')
# Use it
ks_test(a, b)