Parcourir la source

Inhaltlicher Mehrfachsprung -> Inhaltlicher Zweifachsprung

Martin Thoma il y a 11 ans
Parent
commit
32aedc66cc

+ 1 - 1
documents/DYCOS/Ausblick.tex

@@ -19,7 +19,7 @@ In diesem Fall macht es jedoch einen wichtigen Unterschied, ob jemand
 Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit 
 mehreren Beschriftungen.
 
-DYCOS beschränkt sich bei inhaltlichen Mehrfachsprüngen
+DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen
 auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
 gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
 untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die 

+ 9 - 9
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -58,7 +58,7 @@ jedes Wortes berücksichtigt.
 \end{figure}
 
 Entsprechend werden zwei unterschiedliche Sprungtypen unterschieden,
-die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
+die strukturellen Sprünge und inhaltliche Zweifachsprünge:
 
 \begin{definition}[struktureller Sprung]
     Sei $G_{E,t} = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
@@ -69,27 +69,27 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
     ein \textit{struktureller Sprung}.
 \end{definition}
 \goodbreak
-Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge
+Im Gegensatz dazu benutzten inhaltliche Zweifachsprünge
 tatsächlich die Grapherweiterung:
-\begin{definition}[inhaltlicher Mehrfachsprung]
+\begin{definition}[inhaltlicher Zweifachsprung]
     Sei $G_t = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
     um die Wortknoten $W_{t}$ erweiterte Graph.
 
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
     und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
-    ein inhaltlicher Mehrfachsprung.
+    ein inhaltlicher Zweifachsprung.
 \end{definition}
 
-Jeder inhaltliche Mehrfachsprung beginnt und endet also in einem Strukturknoten,
+Jeder inhaltliche Zweifachsprung beginnt und endet also in einem Strukturknoten,
 springt über einen Wortknoten und ist ein Pfad der Länge~2.
 
 Ob in einem Sprung der Random Walks ein struktureller Sprung oder
-ein inhaltlicher Mehrfachsprung gemacht wird, wird jedes mal zufällig
+ein inhaltlicher Zweifachsprung gemacht wird, wird jedes mal zufällig
 neu entschieden. Dafür wird der Parameter $0 \leq p_S \leq 1$ für den Algorithmus 
 gewählt. Mit einer Wahrscheinlichkeit von $p_S$ wird ein struktureller
 Sprung durchgeführt und mit einer Wahrscheinlichkeit
-von $(1-p_S)$ ein modifizierter inhaltlicher Mehrfachsprung, wie er in
+von $(1-p_S)$ ein modifizierter inhaltlicher Zweifachsprung, wie er in
 \cref{sec:sprungtypen} erklärt wird, gemacht. Der 
 Parameter $p_S$ gibt an, wie wichtig die Struktur des Graphen im Verhältnis
 zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
@@ -132,7 +132,7 @@ struktureller Sprung durchgeführt wird.
                     \If{$sprungTyp \leq p_S$}
                         \State $w \gets$ \Call{SturkturellerSprung}{$w$}
                     \Else
-                        \State $w \gets$ \Call{InhaltlicherMehrfachsprung}{$w$}
+                        \State $w \gets$ \Call{InhaltlicherZweifachsprung}{$w$}
                     \EndIf
                     \State $beschriftung \gets w.\Call{GetLabel}{ }$
                     \If{$!d.\Call{hasKey}{beschriftung}$}
@@ -173,7 +173,7 @@ verwaltet der DYCOS-Algorithmus zwei weitere Datenstrukturen:
           $w$ in den Texten von $v$.
     \item Für jedes Wort des Vokabulars $W_t$ wird eine Liste von 
           Knoten verwaltet, in deren Texten das Wort vorkommt.
-          Diese Liste wird bei den inhaltlichen Mehrfachsprung,
+          Diese Liste wird bei den inhaltlichen Zweifachsprung,
           der in \cref{sec:sprungtypen} erklärt wird,
           verwendet.
 \end{itemize}

BIN
documents/DYCOS/DYCOS.pdf


+ 7 - 7
documents/DYCOS/Sprungtypen.tex

@@ -1,6 +1,6 @@
 \subsection{Sprungtypen}\label{sec:sprungtypen}
 Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
-sowie der inhaltliche Mehrfachsprung werden im folgenden erklärt.
+sowie der inhaltliche Zweifachsprung werden im folgenden erklärt.
 \goodbreak
 Der strukturelle Sprung entspricht einer zufälligen Wahl eines 
 Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
@@ -18,7 +18,7 @@ gezeigt wird.
 \label{alg:DYCOS-structural-hop}
 \end{algorithm}
 
-Bei inhaltlichen Mehrfachsprüngen ist jedoch nicht sinnvoll so strikt
+Bei inhaltlichen Zweifachsprüngen ist jedoch nicht sinnvoll so strikt
 nach der Definition vorzugehen,  also
 direkt von einem strukturellem Knoten 
 $v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
@@ -30,7 +30,7 @@ Gemeint sein können z.~B. das Bauwerk, das Entwurfsmuster der
 objektorientierten Programmierung oder ein Teil des Gehirns.
 
 Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
-Mehrfachsprung machen will folgende Textanalyse durchgeführt:
+Zweifachsprung machen will folgende Textanalyse durchgeführt:
 \begin{enumerate}[label=C\arabic*,ref=C\arabic*]
     \item \label{step:c1} Gehe alle in $v$ startenden Random Walks der Länge $2$ durch
           und erstelle eine Liste $L$ der erreichbaren Knoten $v'$. Speichere
@@ -42,10 +42,10 @@ CORA-Datensatz wurde in \cite[S. 364]{aggarwal2011} $q=10$ gewählt.}
           Diese Knotenmenge heiße im Folgenden $T(v)$ und $p(v, v')$
           sei die Anzahl der Pfade von $v$ über einen Wortknoten nach $v'$.
     \item \label{step:c3} Wähle mit Wahrscheinlichkeit $\frac{p(v, v')}{\sum_{w \in T(v)} p(v, w)}$
-          den Knoten $v' \in T(v)$ als Ziel des Mehrfachsprungs.
+          den Knoten $v' \in T(v)$ als Ziel des Zweifachsprungs.
 \end{enumerate}
 
-Konkret könnte also ein inhaltlicher Mehrfachsprung sowie wie in
+Konkret könnte also ein inhaltlicher Zweifachsprung sowie wie in
 \cref{alg:DYCOS-content-multihop} beschrieben umgesetzt werden.
 Der Algorithmus bekommt einen Startknoten $v \in V_T$ und
 einen $q \in \mathbb{N}$ als Parameter. $q$ ist ein Parameter der
@@ -76,10 +76,10 @@ der Pfaden der Länge 2 von $v$ nach $v'$ über einen beliebigen
 Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
 
 \begin{algorithm}
-  \caption{Inhaltlicher Mehrfachsprung}
+  \caption{Inhaltlicher Zweifachsprung}
   \label{alg:DYCOS-content-multihop}
     \begin{algorithmic}[1]
-        \Procedure{InhaltlicherMehrfachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
+        \Procedure{InhaltlicherZweifachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
             \State $erreichbareKnoten \gets$ leeres assoziatives Array\label{alg:l2}
             \ForAll{Wortknoten $w$ in $v.\Call{getWordNodes}{ }$}
                 \ForAll{Strukturknoten $x$ in $w.\Call{getStructuralNodes}{ }$}

BIN
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf


+ 3 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.tex

@@ -30,6 +30,9 @@
 \section{Sprungtypen}
 \input{Sprungtypen}
 
+\section{Zusammenfassung}
+\input{Zusammenfassung}
+
 \section{Ende}
 \input{Ende}
 

+ 2 - 2
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex

@@ -1,9 +1,9 @@
 \subsection{Sprungtypen}
 \framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf}
-\begin{frame}{Inhaltlicher Mehrfachsprung}
+\begin{frame}{Inhaltlicher Zweifachsprung}
     \begin{itemize}
         \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$
-        \item<2-> \textbf{Inhaltlicher Mehrfachsprung}: von Strukturknoten $v$ über Wortknoten zu Strukturknoten $v'$
+        \item<2-> \textbf{Inhaltlicher Zweifachsprung}: von Strukturknoten $v$ über Wortknoten zu Strukturknoten $v'$
         \begin{itemize}
             \item<3-> Finde alle Knoten $v'$, die über Wortknoten erreichbar sind (Pfadlänge 2)
             \item<4-> Nehme Top-$q$-Knoten (Anzahl der Pfade)

+ 8 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Zusammenfassung.tex

@@ -0,0 +1,8 @@
+\subsection{Zusammenfassung}
+\begin{frame}{Wichtige Ideen}
+    \begin{itemize}
+        \item<1-> Random Walk
+        \item<2-> Gini-Koeffizient
+        \item<3-> Inhaltlicher Zweifachsprung
+    \end{itemize}
+\end{frame}