Um was es geht...
Im Beitrag Differentialrechnung – ein Überblick ging es um die Ableitung von Funktionen, die nur von einer Variablen abhängen: y(x) oder f(t). Es gibt aber viele Anwendungen, in denen Funktionen zweier oder mehr Variablen vorkommen: f(x,y) oder f(x,y,z,…). Beispiele: Die Arbeit A, die man beim Heben einer Masse m um die Höhe h gegen die Schwerkraft aufwenden muss, beträgt \(A=m\cdot g\cdot h\), ist also eine Funktion von m und h. Oder ein wenig komplizierter mit viel, viel mehr Variablen: Die Produktionskosten PK eines Autos hängen von den Herstellkosten HK aller verbauten Teile ab: \(PK=f(HK_1, HK_2, … , HK_n)\)
Im Folgenden werden wir uns auf die Differentialrechnung von Funktionen zweier Variablen beschränken und nur gelegendlich darauf hinweisen, wie die Ergebnisse auf Funktionen mit mehr als zwei Variablen übertragen werden können.
Anmerkung:
Zum Verständnis dieses Beitrags sind Grundkenntnisse der Differentialrechnung von Funktionen einer Variablen notwendig.
Erinnerung: Differentialrechnung von Funktionen einer Veränderlichen
Ergebnis der Differentiation (Ableitung) einer Funktion f(x) ist die Steigung der Funktion an der Stelle x. In einem Funktionsgraph entspricht das der Steigung einer Tangente an der Funktionskurve.
Abb.1 zeigt die Tangente der Funktionskurve f(x) an der Stelle x1 (im Punkt P1). Ihre Steigung m ist der Differentialquotient in diesem Punkt:\[m=\frac{df(x_1)}{dx}\]
Funktionen zweier Variablen: f(x,y)
Schon mal voraus: Die Eigenschaften von Funktionen mehrerer Veränderlicher (mehrwertige Funktionen) können an dieser Stelle nicht erschöpfend dargestellt werden. Wir beschränken uns auf Aspekte, die für die Differentiation solcher Funktionen wichtig sind.
Hängt eine Funktion nicht von einer, sondern von zwei Variablen ab, wird es etwas komplizierter als bei einwertigen Funktionen – obwohl viele Eigenschaften ähnlich sind. Im Falle zweiwertiger Funktionen wird jedem Wertepaar (x,y) ein Funktionswert f(x,y) zugeordnet. Solche Funktionen können nicht mehr durch eine zwei-dimensionale Funktionskurve anschaulich gemacht werden. Sie werden durch eine Fläche in einem kartesischen Koordinatensystem mit drei Achsen dargestellt (üblicherweise als x-, y- und z-Achse bezeichnet). Das Wertepaar (x,y) ist ein Punkt in der xy-Ebene, die z-Achse entspricht dem Funktionswert f(x,y).
Kleine Anmerkung: Funktionen mit mehr als zwei Variablen entziehen sich einer anschaulichen Darstellung, da man dazu mindestens ein vier-dimensionales Bild brauchte. Doch zurück zu Funktionen zweier Variablen:
Auf der z-Achse werden die Funktionswerte f(x,y) aufgetragen. Sie spannen eine Fläche im Raum auf (blau dargestellt). In Abb.2 ist die Funktion \(f(x,y)=x^2+y^2\) (eine dreidimensionale Parabel), in Abb.3 die Funktion \(g(x,y)=ln(x^2+y^2)\) als zwei Beispiele gezeigt:
Man kann sich auch anschauen, wie ein Schnitt durch die Funktionskurve bei einem festen y-Wert aussieht. Dann wird aus der Variable y ein festgehaltener Parameter.
Abb.4 zeigt solche Schnittbilder für die 3D-Funktion aus Abb.2 bei den y-Werten 0, 1, 2 und 3. f(x,y) hängt nur noch von x ab; die Funktionswerte werden gegen x aufgetragen. Es handelt sich im Endeffekt um eine Projektion von f(x,y) bei festgehaltenem y-Wert auf die xz-Ebene.
Ein analoges Bild ergibt sich bei festen x-Werten; dann werden die x-Werte als Parameter aufgefasst und die Funktionswerte gegen y aufgetragen. Es resultiert eine Projektion von f(x,y) auf die yz-Ebene.
Neben den 3D-Bildern werden auch Höhenlinien zur Veranschaulichung einer zweiwertigen Funktion benutzt. Der Name rührt von der Darstellung der Landschaftshöhe H in Landkarten her. Hier ist H eine Funktion von Längen- und Breitengrad. Es werden Linien gleicher Höhe in die Karte eingezeichnet, anhand derer man mit ein wenig Übung die Topographie der Landschaft rekonstruieren kann (Abb.5).
Übertragen auf die Darstellung einer zweiwertigen Funktion heißt das: es werden Linien ausgewählter, konstanter Funktionswerte f(x,y) in ein xy-Koordinatensystem als Linie eingezeichnet. f(x,y) entspricht der Landschaftshöhe, x und y den Längen- und Breitengraden. Höhenlinien sind eine Projektion ausgewählter Werte der Funktion f(x,y) auf die xy-Ebene.
Zunehmend wird auch auf eine farbige Darstellung der Funktionswerte statt auf Höhenlinien zurückgegriffen. (Abb.6)
Die beiden folgenden Anschauungsvideos demonstrieren für die Funktion \(f(x,y)=x^2+y^2\) die Entstehung der Schnittkurven bei verschiedenen y-Werten in Video 1 und der Höhenlinien in Video 2.
Video 1: Änderung Funktionskurve für verschiedene y-Werte
Video 2: Entstehung der Höhenlinien als Projektion auf xy-Ebene
Viele Begriffe, die bei einwertigen Funktionen eine Rolle spielen, sind auch für mehrwertige Funktionen von Bedeutung. Insbesondere ist die Stetigkeit Voraussetzung für die Differenzierbarkeit einer Funktion. Allerdings ist Stetigkeit etwas anders definiert als bei Funktionen nur einer Variablen.
Zur Eininnerung: Anschaulich ist eine einwertige Funktion f(x) im Punkt \(x_0\) stetig, wenn man einen Zeichenstift nicht abheben muss, um auf der Funktionskurve zur Stelle \(x_0\) zu kommen (keine „Sprünge“). Das gilt auch für Funktionen zweier Variabler. Dann muss man aber aus allen Richtungen auf der Funktionsfläche ohne Abheben zum fraglichen Punkt \((x_0,y_0)\) kommen.
Bei Funktionen mit drei und mehr Variablen funktioniert deise Anschauung nicht mehr; höherdimensionale „Flächen“ können wir uns nicht vorstellen. Man muss dann auf die analytische Defnition von Stetigkeit zurückgreifen. Da wir uns in diesem Beitrag eigentlich mit der Differentiation mehrwertiger Funktionen beschäftigen wollen, soll es hier mit der anschaulichen Definition von Stetigkeit genug sein.
Differentiation von Funktionen zweier Variablen
Mit diesen Vorbereitungen sind wir soweit, uns der Differentialrechnung zweiwertiger Funktionen zuwenden zu können. Es stellt sich die Frage, was das überhaupt ist. Bei Funktionen einer Variablen f(x) entspricht die erste Ableitung an der Stelle \(x_0\) der Steigung der Tangente an der Funktionskurve im Punkt \(P_1=(f(x_0),x_0)\).
Partielle Differentialquotienten
Wir versuchen, dies irgendwie auf zweiwertige Funktionen zu übertragen und erinnern uns an Abb.4 bzw. Video 1. Dort waren Funktionskurven von \(f(x,y)=x^2+y^2\) bei ein paar konstanten y-Werten gezeigt worden, die in x-Richtung zeigen. Hält man y konstant – wir nennen den konstanten Wert \(y_0\) und die Funktion \(f_{y_0}\) – ist \(f_{y_0}\) nur noch von der Variablen x abhängig (ein y-Wert spielt jetzt die Rolle eines Parameters). Man kann nach der Steigung von \(f_{y_0}\) an der Stelle \(x=x_0\) fragen.
Doch das entspricht einer Ableitung nach x, wenn y den konstanten Wert \(y_0\) annimmt. Unsere Beispielfunktion wird zu \(f_{y_0}=x^2+y_0^2\). Differenziert man diese Funktion nach x, fällt \(y_0^2\) als konstanter Summand weg und aus \(x^2\) wird \(2x\):\[\frac{df_{y_0}}{dx}=2x\]Das entspricht der Steigung der Tangente an die Funktion \(f(x,y)=x^2+y^2\) in x-Richtung, wenn \(y=y_0\).
Um uns daran zu erinnern, dass wir es in Wirklichkeit mit einer Funktion zweier Variablen zu tun haben und uns nur die Steigung einer speziellen Kurve auf der Funktionsfläche anschauen, schreibt man den Differentialquotienten etwas anders, nämlich mit einer Art geschweiften „d“:\[\frac{\partial f(x,y)}{\partial x}=2x\]Man sagt: „f partiell nach x (differenziert)“; denn wir haben ja nur die Steigung in x-Richtung betrachtet. Eine alternative (und kürzere) Schreibweise für die partielle Ableitung nach x ist \(f_x=2x\).
Zum Gesamtbild gehört auch die Steigung in y-Richtung, die wir erhalten, wenn wir für x einen festen Wert \(x_0\) wählen und y variabel halten. Dann ist f(x,y) nur noch eine Funktion \(f_{x_0}\)von y, die wir partiell nach y differenzieren können:\[\frac{\partial f(x,y)}{\partial y}=2y\]bzw. \(f_y=2y\).
In manchen Anwendungen – z.B. in der Thermodynamik – wird in der Schreibweise betont, welche Variable konstant gehalten wird, obwohl das eigentlich überflüssig ist:\[\frac{\partial f(x,y)}{\partial x}\bigg|_y=2x\qquad\qquad\frac{\partial f(x,y)}{\partial y}\bigg|_x=2y\]Das ist insbesondere bei Funktionen von mehr als zwei Variablen wichtig, um die Übersicht zu behalten, welche Variablen konstant gehalten werden.
Tangentialebene
Was haben wir bis jetzt erreicht? Es gibt in jedem Punkt (\(x_0,y_0\)) der Funktionsfläche eine partielle Ableitung nach x und nach y (Differenzierbarkeit nach x und y vorausgesetzt). Die Ableitungen beschreiben zwei Tangenten, von denen sich eine in x- und die andere in y-Richtung erstreckt. Beide Tangenten schneiden sich im Punkt (\(x_0,y_0\)).
Zwei sich schneidende Geraden spannen generell eine ebene Fläche auf; also auch die beiden Tangenten. Diese Fläche wird Tangentialfläche genannt, da sie in der Umgebung von (\(x_0,y_0\)) die Funktionsfläche nicht mehr berührt (Stetigkeit der zweiwertigen Funktion vorausgesetzt).
Video 3: Tangenten der partiellen Ableitungen und Tangentialebene
In Video 3 ist diese Situation dargestellt. Im Punkt A der Funktionsfläche \(f(x,y)=x^2+y^2\) schneiden sich die Tangenten der Ableitungen nach x (hellrot) und nach y (hellgrün). Sie spannen eine Tangentialebene auf, die am Ende des Videos eingeblendet wird. In der Ansicht von oben sieht man, dass die Tangenten der partiellen Ableitungen nach x und y keine Komponente in Richtung der jeweils anderen Variablen haben.
Die Tangentialebene spielt also bei der Differentiation zweiwertiger Funktionen die gleiche Rolle wie die Tangente bei den einwertigen. Wichtig ist, dass die Tangentialebene durch die beiden partiellen Ableitungen festgelegt wird. Bei höherwertigen Funktionen versagt allerdings die Anschauung, da man dazu mindestens einen 3-dimensionalen Raum in vier Dimensionen brauchen würde…
Beispiele für Ableitungen zweiwertiger Funktionen
Es ist an der Zeit, ein paar Beispiele für die Differentiation mehrwertiger Funktionen zu zeigen.
\(f(x,y)=x^2\cdot y\)
f ist eine Funktion der beiden Variablen x und y. Ableitung nach x (y wird als Konstante behandelt):
\(\frac{\partial f}{\partial x}=2xy\)
Ableitung nach y (x wird als Konstante behandelt):
\(\frac{\partial f}{\partial y}=x^2\)
\(g(z,x)=\sin(2z)\cdot x^2\)
g ist eine Funktion der Variablen x und z. Ableitung nach x (z wird als Konstante behandelt):
\(\frac{\partial g}{\partial x}=2x\cdot \sin(2z)\)
Ableitung nach z (x wird als Konstante behandelt):
\(\frac{\partial g}{\partial z}=x^2\cdot 2\cos(2z)\)
\(h(x,y,z)=sin(x^2)\cdot z\cdot e^{-y}\)
h ist eine Funktion dreier Variablen: x, y und z. Ableitung nach x (y und z werden als Konstante behandelt):
\(\frac{\partial h}{\partial x}=2x\cos(x^2)\cdot z\cdot e^{-y}\)
Ableitung nach y (x und z werden als Konstante behandelt):
\(\frac{\partial h}{\partial y}=-sin(x^2)\cdot z\cdot e^{-y}\)
Ableitung nach z (x und y werden als Konstante behandelt):
\(\frac{\partial h}{\partial z}=sin(x^2)\cdot e^{-y}\)
Das totale Differential
Wir haben gesehen, dass die partielle Ableitung \(f_x\) die Steigung der Funktion \(f(x,y_0)\) an der Stelle x darstellt, wenn \(y=y_0\) konstant gehalten wird. Das enspricht der Tangetensteigung in der Ebene \(y=y_0\) (Video 4). Entsprechendes gilt für \(f_y\)
Wie bei Funktionen einer Variablen kann die Tangente (die partielle Ableitung) im Punkt \(x_0,y_0\) dazu dienen, Änderungen des Funktionswertes in der Umgebung des Punkts abzuschätzen.
Das macht man getrennt für die x- und y-Richtung mit Hilfe der beiden partiellen Ableitungen \(f_x\) und \(f_y\).
Video 4: Tangente der partiellen Ableitung nach x in Ebene \(y=y_0\)
Eine kurze Erinnerung wie man bei einwertigen Funktionen f(x) die Änderung des Funktionswerts \(\Delta f=f(x_2)-f(x_1)\) zwischen zwei x-Werten \(\Delta x=x_2-x_1\) mit Hilfe der Ableitung abschätzen kann (Abb.8):
Die Steigung der Tangente \(f_{tan}\) im Punkt \(x_1\) ist der Wert der Ableitung von f(x) an der Stelle \(x_1\). Bis zum Punkt \(x_2=x_1+dx\) ändert sich der Wert der Tangente um \(df_{tan}=f'(x_1)\cdot dx\). Es bleibt eine Differenz – ein Fehler – zwischen dem Wert der Tangente bei \(x_2\) und dem wirklichen Funktionswert \(f(x_2)\):\[\Delta f(x)=f'(x)\cdot dx+\text{„Fehler“}\]
Je näher \(x_2\) an \(x_1\) liegt, je kleiner also dx ist, desto geringer ist der Fehler. Beim Grenzübergang \(x_2 \rightarrow x_1\) wird aus der Differenz \(\Delta f\) das Differenzial df:\[df=f'(x_1)\cdot dx\]Das übertragen wir jetzt auf die partielle Ableitung nach x (\(f_x\)) einer Funktion \(f(x,y)\).
Bei einer Funktion mit zwei Veränderlichen f(x,y) soll die Differenz \(\Delta f=f(x_2,y_2)-f(x_1,y_1)\) zwischen den beiden Funktionswerten \(f(x_1,y_1)\) und \(f(x_2,y_2)\) aus den partiellen Ableitungen geschätzt werden. Dann gilt analog zu oben:
Definfition von\(\Delta f\): \[\Delta f=f(x_1+dx,y_1+dy)-f(x_1,y_1)\]Ergänzung ohne Änderung der Gleichheit:\[\Delta f=f(x_1+dx,y_1+dy)\color{red}{+f(x_1,y_1+dy)\newline -f(x_1,y_1+dy)}-f(x_1,y_1)\]Umordnen und Klammer setzen\[\Delta f=(f(x_1+dx,y_1+dy)-f(x_1,y_1+dy))\newline +(f(x_1,y_1+dy)-f(x_1,y_1))\]Die erste Klammer ist die Funktionsänderung bei konstantem y-Wert \(y_1+dy\), die zweite bei konstantem x-Wert \(x_1\). Erweiterung des ersten Summanden mit dx und des zweiten mit dy\[\Delta f=\frac{(f(x_1+dx,y_1+dy)-f(x_1,y_1+dy))}{dx}dx\newline +\frac{(f(x_1,y_1+dx)-f(x_1,y_1))}{dy}dy\]Grenzübergang \(x_2 \rightarrow x_1\) und \(y_2 \rightarrow y_1\)\[df=\frac{\partial f}{\partial x}\bigg|_y dx+\frac{\partial f}{\partial y}\bigg|_x dy\]
Je kleiner dx und dy, desto mehr nähert sich df der tatsächlichen Änderung des Funktionswertes an der Stelle \((x_1,y_1)\). Diese Formel ist von größter Bedeutung für die Differentialrechnung von Funktionen mehrerer Veränderlicher. Ist \(f\) von 3 oder mehr Variablen abhängig, gilt analog\[df(x,y,z)=\frac{\partial f}{\partial x}\bigg|_{y,z}dx+\frac{\partial f}{\partial y}\bigg|_{x,z}dy+\frac{\partial f}{\partial z}\bigg|_{x,y}dz\]df wird „totales Differential“ genannt; denn es setzt sich aus den partiellen Ableitungen nach den Variablen von f zusammen.
Die Formel besagt, dass sich eine (kleine) Änderung von f sich zusammensetzt aus den (kleinen) Änderungen der Variablen, gewichtet mit der jeweiligen partiellen Ableitung. Oder anders gesagt: je größer die partielle Ableitung nach einer Variablen, desto mehr trägt sie zu einer Änderung des Funktionswerts bei.
Ein paar Anwendungen des totalen Differentials
Mehrdimensionale Kettenregel
Gegeben sei eine Funktion f(x,y), bei der sowohl x als auch y ihrerseits von einer Variablen t abhängen: \(f(x(t),y(t))=g(t)\). Gesucht ist die Ableitung von f nach t: \(\frac{df}{dt}\). Hätte man nur eine Variable, die von t abhängt, müsste man die einfache Kettenregel anwenden:\[\frac{df(x(t))}{dt}=\frac{df}{dx}\cdot \frac{dx}{dt}\]Oder aufgelöst nach dem Differential der Funktion\[df=\frac{df}{dx}\cdot \frac{dx}{dt}\cdot dt\]Bei einer partiellen Ableitung – z.B. nach x – wird die andere Variable konstant gehalten und die Ableitung nach den Ableitungsregeln einer einwertigen Funktion durchgeführt. Es gilt die normale Kettenregel für beide partielle Ableitungen und das totale Differential wird zu:\[df=\frac{\partial f}{\partial x}\frac{dx}{dt}dt+\frac{\partial f}{\partial y}\frac{dy}{dt}dt\]Oder als Ableitung von f nach t ausgedrückt (Division durch dt auf beiden Seiten)\[\frac{df}{dt}=\frac{\partial f}{\partial x}\frac{dx}{dt}+\frac{\partial f}{\partial y}\frac{dy}{dt}\]Für Funktionen von mehr als zwei Variablen, die alle von derselben Variablen t abhängen, gilt entsprechendes.
Beispiel: \(f(x,y)=x^2\cdot\sin(y)\) mit \(x(t)=e^{2t}\) und \(y(t)=t^2\)
Partielle Ableitungen nach x und y:\[\frac{\partial f}{\partial x}=2x\sin(y)\qquad\qquad \frac{\partial f}{\partial y}=x^2\cos(y)\]Ableitungen von x bzw. y nach t:\[\frac{dx}{dt}=2e^{2t}\qquad\qquad \frac{dy}{dt}=2t\]Einsetzen der vier Ableitungen in die mehrdimensionale Kettenregel:\[\frac{df}{dt}=2x\sin(y)\cdot 2e^{2t}+x^2\cos(y)\cdot 2t\]Einsetzen der Funktionsgleichungen für x und y:\[\frac{df}{dt}=2e^{2t}\sin(t^2)\cdot 2e^{2t}+(e^{2t})^2\cos(t^2)\cdot 2t\]Von der Richtigkeit des Ergebnisses kann man sich überzeugen, wenn man in die Funktion f(x,y) die jeweiligen Funktionsgleichungen für die Variablen einsetzt und dann nach t differenziert.
Fehlerrechnung
Eine rechteckige Tischplatte habe die Länge \(x\) und die Breite \(y\); ihre Fläche ist dann \(F(x,y)=x\cdot y\). Ich möchte den Wert der Fläche durch Messung der Länge und Breite ermitteln. Welchen Fehler \(dF\) mache ich bei der Flächenberechnung, wenn die gemessene Länge \(x+dx\) und die gemessene Breite \(y+dy\) beträgt (Bedingung: \(dx<<x\) und \(dy<<y\))? dx bzw. dy sind die Messfehler der Länge bzw. der Breite.
Wir wissen, dass sich unter diesen Bedingungen dF aus dx und dy errechnen lässt, indem man das totale Differential von F bildet\[dF=\frac{\partial F}{\partial x}\bigg|_y dx+\frac{\partial F}{\partial y}\bigg|_x dy\]In unserem Fall lauten die partiellen Ableitungen\[\frac{\partial F}{\partial x}=y\qquad\qquad \frac{\partial F}{\partial y}=x\]Der Fehler beträgt also\[dF=y\cdot dx + x\cdot dy\]Wenn die Messfehler dx und dy gleiches Vorzeichen haben, ist der absolute Fehler df umso größer, je länger und breiter die Tischplatte ist.
Dividiert man die Gleichung auf beiden Seiten durch die Fläche \(F=x\cdot y\), erhält man\[\frac{dF}{F}=\frac{dx}{x}+\frac{dy}{y}\]Dies ist der relative Fehler der Flächenberechnung. Im Gegensatz zum absoluten Fehler sinkt er mit steigender Größe der Tischplatte.
Was beleiben soll...
- Funktionen mehrerer Variablen (mehrwertige Funktionen) beschreiben die Abhängigkeit einer abhängigen von mehreren unabhängigen Variablen.
- Zweiwertige Funktionen f(x,y) ordnen jedem Wertepaar \((x,y)\) einen Wert f(x,y) zu. Sie können durch eine Fläche im Raum veranschaulicht werden.
- Viele Eigenschaften einwertiger Funktionen können modifiziert auf mehrwertige übertragen werden. Dies gilt insbsondere für die Stetigkeit, die Voraussetzung für die Differenzierbarkeit ist.
- Bei der Differentiation einer mehrwertigen Funktion f(x,y) nach einer Variablen wird die andere konstant gehalten; die Ableitung nach x oder y wird partielle Ableitung genannt.
- Das totale Differential ist die lineare Näherung an die Änderung des Funktionswertes in Abhängigkeit von der Änderung der Funktionsvariablen:\[df(x,y)=\frac{\partial f}{\partial x}dx+\frac{\partial f}{\partial y}dy\]
Quiz
\(\frac{\partial f}{\partial x}=y^3\cdot 4x\cdot e^{2x^2}\)
\(\frac{\partial f}{\partial y}=3y^2\cdot e^{2x^2}\)
\(\frac{\partial g}{\partial z}=4e^{4z}\cdot \sin(\phi)\)
\(\frac{\partial g}{\partial \phi}=e^{4z}\cdot \cos(\phi)\)
Anwendung der mehrdimensionalen Kettenregel:
Partielle Ableitungen:
\(\frac{\partial f}{\partial x}=2x\cdot e^y\)
\(\frac{\partial f}{\partial y}=x^2\cdot e^y\)
Ableitungen von x und y nach t:
\(\frac{dx}{dt}=2t\)
\(\frac{dy}{dt}=\cos(t)\)
Einsetzen in Kettenregel:
\(\frac{df}{dt}=2x\cdot e^y\cdot 2t+x^2\cdot e^y\cdot \cos(t)\)
Einsetzen der Funktionsgleichungen von x(t) und y(t):
\(\frac{df}{dt}=2t^2\cdot e^{\sin(t)}\cdot 2t+t^4\cdot e^{\sin(t)}\cdot \cos(t)\)