Martin Thoma 11 years ago
parent
commit
0a2920fbb6

+ 1 - 1
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -42,7 +42,7 @@ Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
 genannt.
 Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$
 verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph}
-zeigt beispielhaft den so entstehenden, bipartiten Graphen.
+zeigt beispielhaft den so entstehenden, semi-bipartiten Graphen.
 Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten 
 zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen 
 wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird 

BIN
documents/DYCOS/DYCOS.pdf


BIN
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf


+ 1 - 1
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex

@@ -1,5 +1,5 @@
+\subsection{Sprungtypen}
 \framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf}
-
 \begin{frame}{Inhaltlicher Mehrfachsprung}
     \begin{itemize}
         \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$

+ 1 - 1
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex

@@ -75,4 +75,4 @@
     \end{itemize}
 \end{frame}
 
-\framedgraphic{Erweiterter, bipartiter Graph}{../images/graph-content-and-structure.pdf}
+\framedgraphic{Erweiterter, semi-bipartiter Graph}{../images/graph-content-and-structure.pdf}

+ 3 - 3
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex

@@ -9,8 +9,8 @@
     \uncover<4->{
     \textbf{Idee}:
     \begin{itemize}
-        \item<5-> Gini-Koeffizient nutzen
-        \item<6-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten
+        \item<5-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten
+        \item<6-> Gini-Koeffizient nutzen
     \end{itemize}
     }
 \end{frame}
@@ -20,7 +20,7 @@
         \item<1-> statistisches Maß für Ungleichverteilung
         \item<2-> $g = \sum_i p_i^2$ mit $p_i$ als relative Häufigkeit
         \item<3-> $g \in (0, 1]$
-        \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort kommt selten vor
+        \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort ist stark ungleich verteilt
         \item[$\Rightarrow$]<5-> Nehme Top-$m$ Wörter mit höchstem
                   Gini-Koeffizient
     \end{itemize}