R-уравнение (уравнение Никольского-Эйзенмана) к данным

Раньше я использовал SigmaPlot, чтобы соответствовать модифицированной версии уравнения Никольского-Эйзенмана в форме

y = P1 + P2 * log(10^(-x) + P3)

используя функцию подбора глобальной кривой. Детали параметров можно найти в отчете Sigmaplot ниже. Я хочу сделать это сейчас в R.

Некоторые данные:

pNO3 <- c(1.1203, 2.0410, 3.0155, 4.0048, 4.3045, 5.0, 6.0)
mV <- c(45.2, 100.9, 160.9, 215.7, 231.5, 244.5, 257.4)
data <- data.frame(pNO3, mV)
plot(data$pNO3, data$mV)

График и отчет, сгенерированный sigmaplot для вышеуказанных данных, показан ниже. Может кто-нибудь указать мне в правильном направлении, как создать нечто подобное в R?

NonLinear Regression - Global Curve Fitting     Wednesday, May 01, 2013, 13:04:55
Data Source: Data 1 in Notebook1
Equation: User-Defined, Nicolsky Eisenman
f=P1+P2*log(10^(-x)+P3)
Data Set Specifications:
Data Set    Independent Variable    Dependent Variable
1           Column 3        Column 7
Global Parameters:
A Global Parameter is shared across all data sets.
Global Goodness of Fit:
R   Rsqr    Adj Rsqr    Standard Error of Estimate
0.9997  0.9994  0.9991      2.4421  
Analysis of Variance: 
Analysis of Variance: 
    DF  SS  MS  
Regression    3 264242.5551 88080.8517
Residual    4   23.8549 5.9637  
Total   7   264266.4100 37752.3443  
Corrected for the mean of the observations:
    DF  SS  MS  F   P   
Regression  2   38844.3822  19422.1911  3256.7192   <0.0001 
Residual    4   23.8549 5.9637  
Total   6   38868.2371  6478.0395   
Statistical Tests:
Normality Test (Shapiro-Wilk)           Passed  (P = 0.4003)
W Statistic= 0.9106 Significance Level = 0.0500
Constant Variance Test      Passed  (P = 0.1209)
Number of Observations =  7 
Rsqr  = 0.9994 
Residual Sum of Squares = 23.8549 
Parameter Estimates:
    Coefficient Std. Error  t   P
P1  -24.3265      3.3330    -7.2987 0.0019
P2  -61.7088      1.2861    -47.9796    <0.0001
P3  2.8351E-005   4.6040E-006   6.1579  0.0035
Fit Equation Description:
[Variables]
f0_x = col(3)
f0_y = col(7)
[Parameters]
f0_P1 = 0 ' {{previous: -24.3265}}
f0_P2 = -5 ' {{previous: -61.7088}}
f0_P3 = 0 ' {{previous: 2.8351e-005}}
[Equation]
f0 = f0_P1+f0_P2*log(10^(-f0_x)+f0_P3)
fit f0 to f0_y
[Constraints]
[Options]
tolerance=0.000100
stepsize=100
iterations=100
Number of Iterations Performed = 4

2 ответа

Решение

Предполагая, что ваш критерий подгонки сводит к минимуму сумму квадратов ошибок, вы можете использовать nls, но вам нужна справедливая стартовая стоимость. Я понятия не имею, что является разумным для ваших параметров, поэтому я потратил некоторое время, пока скопировал параметры из вашего примера sigmaplot, что, я думаю, было разумно для этого набора данных, который может быть похож на этот набор данных. В любом случае, если вы знаете, что означают параметры, вы, вероятно, сможете угадать разумные начальные значения.

> start=list(P1=-24,P2=-61,P3=2.8e-5)
> m = nls(formula= mV ~ P1 + P2 * log(10^(-pNO3) + P3),data=data,start=start)
> summary(m)

Formula: mV ~ P1 + P2 * log(10^(-pNO3) + P3)

Parameters:
     Estimate Std. Error t value Pr(>|t|)    
P1 -1.420e+01  4.642e+00  -3.059    0.055 .  
P2 -2.732e+01  9.257e-01 -29.514 8.54e-05 ***
P3  8.417e-05  1.818e-05   4.630    0.019 *  

Вы можете нанести данные и подгонку плавной кривой, создав новый набор pNO3 меры:

 plot(data$pNO3,data$mV)
 newdata = data.frame(pNO3=seq(1,6,len=100))
 lines(newdata$pNO3,predict(m, newdata=newdata))

Обратите внимание, что "log" - это натуральный логарифм в R, если вы хотите записать в основание 10, используйте log10 - это немного меняет P2, примерно до -62 вместо -27, как указано выше...

С вашими новыми данными и с "log10" вместо "log" в выражении формулы я получаю:

> m10 = nls(formula= mV ~ P1 + P2 * log10(10^(-pNO3) + P3),data=data,start=start)
> summary(m10)

Formula: mV ~ P1 + P2 * log10(10^(-pNO3) + P3)

Parameters:
     Estimate Std. Error t value Pr(>|t|)    
P1 -2.433e+01  3.334e+00  -7.298  0.00187 ** 
P2 -6.171e+01  1.286e+00 -47.972 1.13e-06 ***
P3  2.835e-05  4.605e-06   6.157  0.00353 ** 

Как выглядит ваш вывод Sigmaplot:

Parameter Estimates:
    Coefficient Std. Error  t   P
P1  -24.3265      3.3330    -7.2987 0.0019
P2  -61.7088      1.2861    -47.9796    <0.0001
P3  2.8351E-005   4.6040E-006   6.1579  0.0035

С "plinear" алгоритм nls только параметры, которые вводятся нелинейно, требуют начальных значений. Обратите внимание, что plinear требует изменения формулы, как показано для представления этой модели:

fo <- mV ~ cbind(log10(10^(-pNO3) + P3), 1)
fm <- nls(fo, data, start = c(P3 = 0), alg = "plinear")
summary(fm)

давая:

Formula: mV ~ cbind(log10(10^(-pNO3) + P3), 1)

Parameters:
       Estimate Std. Error t value Pr(>|t|)    
P3     2.84e-05   4.60e-06    6.16   0.0035 ** 
.lin1 -6.17e+01   1.29e+00  -47.97  1.1e-06 ***
.lin2 -2.43e+01   3.33e+00   -7.30   0.0019 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.44 on 4 degrees of freedom

Number of iterations to convergence: 7 
Achieved convergence tolerance: 2.94e-06

И мы можем построить это так:

plot(data)
lines(fitted(fm) ~ pNO3, data, col = "red")

Скриншот

Другие вопросы по тегам