Regression

zoiX

Administrator
Mitglied seit
07.04.2002
Beiträge
22.550
Reaktionen
9.754
Wer hätte gedacht, dass ich mich als organischer Chemiker damit nochmal auseinandersetzen muss, aber im PostDoc will man plötzlich von mir, dass ich Reaktionskinetiken messe und jetzt sitze ich hier und frage mich, wie man mit so 'nem Datensatz umzugehen hat.

Also, sagen wir, ich hab hier Daten, die zu 'nem exponentiellen Zerfall passen (chem. Reaktion erster Ordnung, Konzentration gegen Zeit) und ich will die Geschwindigkeitskonstante für den Zerfall haben. Im Zeitalter computergestützter Regression liegt es jetzt nahe, die Daten einfach mit 'ner Exponentialfunktion anzunähern und fertig. So weit so gut.

Jetzt Gegenstand der Diskussion heute im AK: Mache ich einen Fehler, wenn ich die Daten stattdessen linearisiere und eine lineare Regression mache?
 
Mitglied seit
14.07.2003
Beiträge
3.128
Reaktionen
0
Du kannst den natürlichen Logarithmus auf deine Daten anwenden und dann eine Gerade fitten.
Wenn dein Modell irgendwie Ae^(bx) ist fittest du dann ln(A) + bx.

Ich meine, dass mal so oder so ähnlich gemacht zu haben vor zig Jahren.
PS: Ich hoffe hier seht kein Mist :D
 

zoiX

Administrator
Mitglied seit
07.04.2002
Beiträge
22.550
Reaktionen
9.754
Es steht nicht zur Debatte, dass man es machen kann. Natürlich krieg ich 'ne Gerade, wenn ich ne Exponentialfunktion logarithmisch auftrage.
Hier wird steif und fest behauptet, dass das Linearisieren eine Fehlerquelle darstellt, was ich nicht verstehe und nicht glaube. Außer natürlich, man verrechnet sich beim Linearisieren.
 
Mitglied seit
14.07.2003
Beiträge
3.128
Reaktionen
0
achso, vielleicht hilft dir das:

Some nonlinear regression problems can be moved to a linear domain by a suitable transformation of the model formulation.
For example, consider the nonlinear regression problem
y = a e^{b x}U \,\!
with parameters a and b and with multiplicative error term U. If we take the logarithm of both sides, this becomes
\ln{(y)} = \ln{(a)} + b x + u, \,\!
where u = ln(U), suggesting estimation of the unknown parameters by a linear regression of ln(y) on x, a computation that does not require iterative optimization. However, use of a nonlinear transformation requires caution. The influences of the data values will change, as will the error structure of the model and the interpretation of any inferential results. These may not be desired effects. On the other hand, depending on what the largest source of error is, a nonlinear transformation may distribute your errors in a normal fashion, so the choice to perform a nonlinear transformation must be informed by modeling considerations.
von wikipedia (https://en.wikipedia.org/wiki/Nonlinear_regression)
 
Mitglied seit
28.09.2001
Beiträge
2.268
Reaktionen
0
Also in dem Bereich bin ich kein Experte, aber ich würde sagen:
Erstens wird die Annäherung eines exponentiellen Zerfalls mit einer Exponentialfunktion wohl für die bereits existierenden Datenpunkte genauer sein.
Zweitens ist es ja auch eine Modellannahme und wenn dein Modell falsch ist (linear statt exponentiell) wird das vermutlich nicht gut sein.
 

zoiX

Administrator
Mitglied seit
07.04.2002
Beiträge
22.550
Reaktionen
9.754
Versteh mich nicht falsch, ich wollte nie die Ursprungsdaten linear annähern, sondern linearisierte Daten. Also x gegen log(y) aufgetragen.
Damit bleibt das Modell doch exponentiell?
 

mfb

Mitglied seit
18.07.2003
Beiträge
791
Reaktionen
0
Website
diablo3.ingame.de
Wie in dem Zitat schon steht: Hängt davon ab, wie dein Fit aussieht. Haben die Datenpunkte wohldefinierte Unsicherheiten? Wenn ja, und wenn du die richtig transformierst, sind beide Fits äquivalent. Wenn nein, wird das Fitprogram irgendeine Annahme über diese Unsicherheiten machen, und diese Annahme wird im Allgemeinen in den beiden Fällen unterschiedlich ausfallen. Welche Seite besser ist, hängt von den Daten und deinem Umgang mit den Fitparametern ab.
 
Mitglied seit
28.09.2001
Beiträge
2.268
Reaktionen
0
Achso sry, hatte es wirklich falsch verstanden. Linearisieren ist aber auch ein total überstrapazierter Begriff, das hat in 100 Kontexten 100 verschiedene Bedeutungen :)
Dann würde ich sagen, es ist richtig. Aber wie gesagt, bin kein Experte in Regression.
 
Oben