Vokabular.tex 953 B

12345678910111213141516171819202122232425262728
  1. \subsection{Vokabular}
  2. \begin{frame}{Vokabular}
  3. \begin{itemize}
  4. \item<1-> Viele Texte $\Rightarrow$ Komplette Textanalyse nicht möglich
  5. \item<2-> Füllwörter: und, oder, im, in, \dots
  6. \item[$\Rightarrow$]<3-> Beschränkung des Vokabulars sinnvoll
  7. \end{itemize}
  8. \uncover<4->{
  9. \textbf{Idee}:
  10. \begin{itemize}
  11. \item<5-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten
  12. \item<6-> Gini-Koeffizient nutzen
  13. \end{itemize}
  14. }
  15. \end{frame}
  16. \begin{frame}{Gini-Koeffizient}
  17. \begin{itemize}
  18. \item<1-> statistisches Maß für Ungleichverteilung
  19. \item<2-> $g = \sum_i p_i^2$ mit $p_i$ als relative Häufigkeit
  20. \item<3-> $g \in (0, 1]$
  21. \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort ist stark ungleich verteilt
  22. \item[$\Rightarrow$]<5-> Nehme Top-$m$ Wörter mit höchstem
  23. Gini-Koeffizient
  24. \end{itemize}
  25. \end{frame}