Pārlūkot izejas kodu

Hauptpräsentation ist im Entstehen

Martin Thoma 11 gadi atpakaļ
vecāks
revīzija
edde9da25b

+ 10 - 4
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.tex

@@ -18,11 +18,17 @@
 %    \setcounter{tocdepth}{2}
 %}
 
-\section{Grundlagen}
-\input{Grundlagen}
+\section{Szenario}
+\input{Szenario}
 
-\section{DYCOS}
-\input{DYCOS}
+\section{Überblick}
+\input{Ueberblick}
+
+\section{Vokabular}
+\input{Vokabular}
+
+\section{Sprungtypen}
+\input{Sprungtypen}
 
 \section{Ende}
 \input{Ende}

+ 8 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex

@@ -0,0 +1,8 @@
+\framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf}
+
+\begin{frame}{Inhaltlicher Mehrfachsprung}
+    \begin{itemize}
+        \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$
+        \item<2-> \textbf{Inhaltlicher Mehrfachsprung}: von Strukturknoten $v$ über Wortknoten zu Strukturknoten $v'$
+    \end{itemize}
+\end{frame}

presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Grundlagen.tex → presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Szenario.tex


+ 78 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Ueberblick.tex

@@ -0,0 +1,78 @@
+\subsection{Überblick}
+\pgfdeclarelayer{background}
+\pgfsetlayers{background,main}
+
+\tikzstyle{vertex}=[circle,fill=black!25,minimum size=20pt,inner sep=0pt]
+\tikzstyle{selected vertex} = [vertex, fill=red!24]
+\tikzstyle{blue vertex} = [vertex, fill=blue!24]
+\tikzstyle{edge} = [draw,thick,-]
+\tikzstyle{weight} = [font=\small]
+\tikzstyle{selected edge} = [draw,line width=5pt,-,red!50]
+\tikzstyle{ignored edge} = [draw,line width=5pt,-,black!20]
+
+\begin{frame}{Random Walk}
+    \begin{figure}
+        \begin{tikzpicture}[->,scale=1.8, auto,swap]
+            % Draw the vertices. First you define a list.
+            \foreach \pos/\name/\ltext in {{(0,0)/a/}, {(0,2)/b/b}, {(1,2)/c/},
+                                    {(1,0)/d/}, {(2,1)/e/e}, {(3,1)/f/b}, 
+                                    {(4,2)/g/a}, {(5,2)/h/a}, {(4,0)/i/a},
+                                    {(5,0)/j/}}
+                \node[draw,circle,fill=white] (\name) at \pos {$\ltext$};
+
+            \node[draw,circle,red,fill=red] (e) at (2,1) {$e$};
+
+            % Connect vertices with edges and draw weights
+            \foreach \source/ \dest /\pos in {a/b/, b/c/, c/d/, d/a/,
+                                        c/e/bend left, d/e/, e/c/,
+                                        e/f/, f/g/, f/i/,
+                                        g/f/bend right, i/f/bend left,
+                                        g/h/, h/j/, j/i/, i/g/}
+                \path (\source) edge [\pos] node {} (\dest);
+
+            \foreach \fr / \number in {1/,
+                2/b=1,
+                3/b=1\, a=1,
+                4/b=1\, a=2,
+                5/b=2\, a=2,
+                6/b=2\, a=3,
+                7/b=2\, a=4
+                }
+                \node<\fr->[fill=white] (Tlabel) at (2,0) {$\number$};
+
+            % Start animating the edge selection. 
+            % For convenience we use a background layer to 
+            % highlight edges. This way we don't have to worry about 
+            % the highlighting covering weight labels. 
+            \begin{pgfonlayer}{background}
+                \foreach \source / \dest / \fr / \colorf /\pos in {e/f/2/red/,f/g/3/red/,g/h/4/red/, e/f/5/blue/, f/i/6/blue/, i/g/7/blue/,e/c/8/green/,c/d/9/green/, d/a/10/green/}
+                    \path<\fr->[selected edge, \colorf!20] (\source.center) edge 
+                                        [\pos] node {} (\dest.center);
+            \end{pgfonlayer}
+        \end{tikzpicture}
+    \end{figure}
+
+    Klassifizieren des roten Knotens:
+    \begin{itemize}
+        \item Zählen von Knotenbeschriftungen in Random Walks
+        \item 4 Random Walks
+        \item 3 Sprünge pro Random Walk
+        \item<11> $4 \cdot a$, $2 \cdot b \Rightarrow$ Rot mit $a$ klassifizieren
+    \end{itemize}
+\end{frame}
+
+\begin{frame}{Wortknoten}
+    \begin{itemize}
+        \item<1-> Neben Struktur können Texte genutzt werden
+        \item<2-> Einschränkung: Effizienz!
+        \item<3-> Wünschenswert: Wenig weiterer Programmieraufwand
+        \item<4-> Idee: Graph erweitern
+        \begin{itemize}
+            \item<5-> Texte als Wortmengen
+            \item<6-> Strukturknoten verweisen auf Wortknoten
+            \item<7-> vice versa
+        \end{itemize}
+    \end{itemize}
+\end{frame}
+
+\framedgraphic{Erweiterter, bipartiter Graph}{../images/graph-content-and-structure.pdf}

+ 27 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Vokabular.tex

@@ -0,0 +1,27 @@
+\subsection{Vokabular}
+\begin{frame}{Vokabular}
+    \begin{itemize}
+        \item<1-> Viele Texte $\Rightarrow$ Komplette Textanalyse nicht möglich
+        \item<2-> Füllwörter: und, oder, im, in, \dots
+        \item[$\Rightarrow$]<3-> Beschränkung des Vokabulars sinnvoll
+    \end{itemize}
+
+    \uncover<4->{
+    \textbf{Idee}:
+    \begin{itemize}
+        \item<5-> Gini-Koeffizient nutzen
+        \item<6-> Zufällige Beispielmenge von Texten für Vokabularbildung betrachten
+    \end{itemize}
+    }
+\end{frame}
+
+\begin{frame}{Gini-Koeffizient}
+    \begin{itemize}
+        \item<1-> statistisches Maß für Ungleichverteilung
+        \item<2-> $g = \sum_i p_i^2$ mit $p_i$ als relative Häufigkeit
+        \item<3-> $g \in (0, 1]$
+        \item<4-> $g$ nahe bei $1$ $\Rightarrow$ Wort kommt selten vor
+        \item[$\Rightarrow$]<5-> Nehme Top-$m$ Wörter mit höchstem
+                  Gini-Koeffizient
+    \end{itemize}
+\end{frame}