diff --git a/multivariate-normalverteilung.ipynb b/multivariate-normalverteilung.ipynb
index 82c888ebaa1cfca3d515a120bd4104927c56a33a..8396aaea02b905a4925db8454b73964c99471c42 100644
--- a/multivariate-normalverteilung.ipynb
+++ b/multivariate-normalverteilung.ipynb
@@ -15,13 +15,13 @@
    "source": [
     "## Dichten von multivariaten Verteilungen\n",
     "\n",
-    "Wir erinnern uns: Bei einer Dichtefunktion $f \\colon \\mathbb{R} \\to \\mathbb{R}$ für eine Verteilung $P$ einer reellen Zufallsvariable $X$ ist $P(X < c) = \\int_{-\\infty}^c f(x)dx$.\n",
+    "Wir erinnern uns: Bei einer Dichtefunktion $f \\colon \\mathbb{R} \\to [0,\\infty)$ für eine Verteilung $P$ einer reellen Zufallsvariable $X$ ist $P(X < c) = \\int_{-\\infty}^c f(x)dx$.\n",
     "\n",
     "Wenn wir das auf zwei Dimensionen verallgemeinern wollen, also eine Zufallsvariable $(X,Y)$ mit Werten in $\\mathbb{R}^2$, dann ist $P(X < c, Y < d) = \\int_{-\\infty}^c \\int_{-\\infty}^d f(x,y)dx dy$.\n",
     "\n",
-    "Daran sehen wir: die Dichtefunktion muss die Signatur $f \\colon \\mathbb{R}^2 \\to \\mathbb{R}$ haben. Sie kodiert für jeden möglichen Wert von $(X,Y)$ die Wahrscheinlichkeitsdichte.\n",
+    "Daran sehen wir: die Dichtefunktion muss die Signatur $f \\colon \\mathbb{R}^2 \\to [0,\\infty)$ haben. Sie kodiert für jeden möglichen Wert von $(X,Y)$ die Wahrscheinlichkeitsdichte.\n",
     "\n",
-    "Allgemeiner definiert eine Funktion $f \\colon \\mathbb{R}^n \\to \\mathbb{R}$ mit $\\int_{\\mathbb{R}^n} f(x)dx = 1$ ein Wahrscheinlichkeitsmaß $P$ mit $P(A) = \\int_A f(x)dx$ und man nennt $f$ eine Dichte für die Verteilung $P$."
+    "Allgemeiner definiert eine Funktion $f \\colon \\mathbb{R}^n \\to [0,\\infty)$ mit $\\int_{\\mathbb{R}^n} f(x)dx = 1$ ein Wahrscheinlichkeitsmaß $P$ mit $P(A) = \\int_A f(x)dx$ und man nennt $f$ eine Dichte für die Verteilung $P$."
    ]
   },
   {
@@ -181,7 +181,7 @@
    "source": [
     "Wir sehen also, die Marginalverteilungen sehen exakt gleich aus - man kann die Korrelation nur in der gemeinsamen Verteilung sehen (da aber deutlich im zweidimensionalen Histogramm (wird auch Heatmap genannt) und im Konturplot (den Ellipsen)).\n",
     "\n",
-    "Die Kovarianzmatrix hat eine direkte geometrische Interpretation, denn jede positiv definite symmetrische Matrix $A$ definiert ein Skalarprodukt $\\langle v, w \\rangle_A := \\langle Av, w\\rangle = vAv^T$ und damit eine sogenannte quadratische Form $v \\mapsto \\langle v, v \\rangle_A$. Die Levelsets der quadratischen Form sind Ellipsen entlang der gleichen Achsen wie die Konturlinien der entsprechenden Normalverteilung.\n",
+    "Die Kovarianzmatrix hat eine direkte geometrische Interpretation, denn jede positiv definite symmetrische Matrix $A$ definiert ein Skalarprodukt $\\langle v, w \\rangle_A := \\langle Av, w\\rangle = (Av)^Tw = v^TA^Tw = v^TAw = \\langle v, Aw\\rangle$ und damit eine sogenannte quadratische Form $v \\mapsto \\langle v, v \\rangle_A$. Die Konturlinien (Levelsets) der quadratischen Form sind Ellipsen entlang der gleichen Achsen wie die Konturlinien der entsprechenden Normalverteilung.\n",
     "\n",
     "In der Formel, die die Dichte der multivariaten Normalverteilung definiert, taucht für den Vektor $v = x - \\mu$ die Formel $v^T \\Sigma^{-1} v$ auf, das ist genau das Skalarprodukt, welches durch die Matrix $\\Sigma^{-1}$ definiert wird.\n",
     "\n",