math-speech-a515.tex 3.8 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596
  1. \documentclass[a4paper]{scrartcl}
  2. \usepackage{amssymb, amsmath} % needed for math
  3. \usepackage[utf8]{inputenc} % this is needed for umlauts
  4. \usepackage[ngerman]{babel} % this is needed for umlauts
  5. \usepackage[T1]{fontenc} % this is needed for correct output of umlauts in pdf
  6. \usepackage[margin=2.5cm]{geometry} %layout
  7. \usepackage{hyperref} % links im text
  8. \usepackage{parskip}
  9. \title{Praktikum Spracherkennung}
  10. \author{Martin Thoma}
  11. \hypersetup{
  12. pdfauthor = {Martin Thoma},
  13. pdfkeywords = {},
  14. pdftitle = {Praktikum Spracherkennung}
  15. }
  16. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  17. % Begin document %
  18. %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
  19. \begin{document}
  20. \section{Aufgabe}
  21. Berechnen Sie den Logarithmus der Wahrscheinlichkeit des Musters $m$, wenn die
  22. eben definierte Gauß-Mixtur gegeben ist (d.h. die HMM
  23. Emissionswahrscheinlichkeit).
  24. \section{Gegeben}
  25. \begin{align}
  26. m &= \begin{pmatrix}2\\2\end{pmatrix} \in \mathbb{R}^d & \Sigma_{s,i} &= \begin{pmatrix}1 & 0 \\0 & 1\end{pmatrix} \in \mathbb{R}^{d \times d}\\
  27. c_{s,1} &= 0.3 \in [0,1] & c_{s,2} &= 0.7 \in [0,1]\\
  28. \mu_{s,1} &= \begin{pmatrix}1\\3\end{pmatrix} \in \mathbb{R}^d & \mu_{s,2} &= \begin{pmatrix}2\\4\end{pmatrix} \in \mathbb{R}^d
  29. \end{align}
  30. \[p(x|s) = \sum_{i=1}^{n_s} c_{s, i} \frac{1}{\sqrt{(2 \pi)^d |\Sigma_{s,i}|}} e^{-\frac{1}{2} {(x-\mu_{s,i})}^T \Sigma_{s,i}^{-1}(x-\mu_{s,i})}\]
  31. mit
  32. \begin{itemize}
  33. \item $s$ (für \textit{senone}) ist die kleinste Einheit die der
  34. automatische Spracherkenner zu erkennen in der lage sein soll.
  35. \item $m$ ist das zu klassifizierende Muster.
  36. \item $c_{s,i}$ sind die Gewichte der Gauss-Verteilungen. Ihre Summe muss
  37. 1 ergeben, damit das Ergebnis wieder eine
  38. Wahrscheinlichkeitsdichtefunktion ist.
  39. \item $\Sigma_{s,i}$ ist die Kovarianzmatrix. Sie ist invertierbar und
  40. ihre Determinate $|\Sigma_{s,i}| \neq 0$.
  41. \item $d$ ist die Dimension der Feature-Vektoren.
  42. \item $n_s$ ist die Anzahl der Gauss-Verteilungen
  43. \item $p(x|s)$ ist die Wahrscheinlichkeitsdichtefunktion, gegeben das
  44. Senone $s$ für das Muster $x$.
  45. \end{itemize}
  46. \section{Erklärung}
  47. Eine Gauss-Verteilung hat die Wahrscheinlichkeitsdichte $f:\mathbb{R} \rightarrow [0,1]$
  48. \[f(x) := \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{1}{2}(\frac{x - \mu}{\sigma})^2}\]
  49. wobei $\mu$ der Erwartungswert und $\sigma^2$ die Varianz ist.
  50. Man schreibt
  51. \[X \sim \mathcal{N}(\mu, \sigma^2)\]
  52. Eine multivariate Gauss-Verteilung ist eine Verallgemeinerung auf mehrdimensionale
  53. Zufallsvariablen. Sie hat die Wahrscheinlichkeitsdichte $f: \mathbb{R}^n \rightarrow [0,1]$
  54. \[f(x) := \frac{1}{\sqrt{(2\pi)^n|\Sigma|}} e^{-\tfrac{1}{2}(x-\mu)^{T}\Sigma^{-1}(x-\mu)}\]
  55. wobei $\mu$ der Erwartungswert und $\Sigma$ die Kovarianz-Matrix ist.
  56. Man schreibt
  57. \[X \sim \mathcal{N}_n(\mu, \Sigma)\]
  58. Eine Multinomialverteilung ist eine diskrete Wahrscheinlichkeitsverteilung.
  59. \section{Einsetzen}
  60. \begin{align}
  61. p(m|s) &= \sum_{i=1}^{2} c_{s, i} \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} {(m_1 - \mu_{1,s,i})^2+(m_2 - \mu_{2,s,i})^2}}\\
  62. &= 0.3 \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} ({1^2+ (-1)^2})} + 0.7 \frac{1}{\sqrt{(2 \pi)^2}} e^{-\frac{1}{2} ({0^2+ (-2)^2}})\\
  63. &= \frac{1}{2 \pi} (0.3 e^{-1} + 0.7 e^{-2})\\
  64. &\approx 0.0326\\
  65. \log(p(m|s)) &\approx -3.4234
  66. \end{align}
  67. \section{Fragen}
  68. $p(m|s)$ ist nicht die Wahrscheinlichkeit von $m$. Die Wahrscheinlichkeit
  69. eines einzelnen Wertes einer kontinuierlichen Zufallsvariable ist immer $0$,
  70. da sonst die Summe der Wahrscheinlichkeiten unendlich wäre. Ist das
  71. dennoch der gewünschte Wert?
  72. Was hat das mit den HMMs zu tun? Sollte da eventuell GMM stehen?
  73. Was ist eine multinominale multivariate Gauss-Verteilung? Wo ist der
  74. Unterschied zur multivariaten Gauss-Verteilung?
  75. \end{document}