Explorar o código

Inhaltlicher Mehrfachsprung -> Inhaltlicher Zweifachsprung

Martin Thoma %!s(int64=11) %!d(string=hai) anos
pai
achega
32aedc66cc

+ 1 - 1
documents/DYCOS/Ausblick.tex

@@ -19,7 +19,7 @@ In diesem Fall macht es jedoch einen wichtigen Unterschied, ob jemand
 Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit 
 Eine einfache Erweiterung des DYCOS-Algorithmus wäre der Umgang mit 
 mehreren Beschriftungen.
 mehreren Beschriftungen.
 
 
-DYCOS beschränkt sich bei inhaltlichen Mehrfachsprüngen
+DYCOS beschränkt sich bei inhaltlichen Zweifachsprüngen
 auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
 auf die Top-$q$-Wortknoten, also die $q$ ähnlichsten Knoten
 gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
 gemessen mit der Aggregatanalyse, allerdings wurde bisher noch nicht
 untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die 
 untersucht, wie der Einfluss von $q \in \mathbb{N}$ auf die 

+ 9 - 9
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -58,7 +58,7 @@ jedes Wortes berücksichtigt.
 \end{figure}
 \end{figure}
 
 
 Entsprechend werden zwei unterschiedliche Sprungtypen unterschieden,
 Entsprechend werden zwei unterschiedliche Sprungtypen unterschieden,
-die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
+die strukturellen Sprünge und inhaltliche Zweifachsprünge:
 
 
 \begin{definition}[struktureller Sprung]
 \begin{definition}[struktureller Sprung]
     Sei $G_{E,t} = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
     Sei $G_{E,t} = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
@@ -69,27 +69,27 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
     ein \textit{struktureller Sprung}.
     ein \textit{struktureller Sprung}.
 \end{definition}
 \end{definition}
 \goodbreak
 \goodbreak
-Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge
+Im Gegensatz dazu benutzten inhaltliche Zweifachsprünge
 tatsächlich die Grapherweiterung:
 tatsächlich die Grapherweiterung:
-\begin{definition}[inhaltlicher Mehrfachsprung]
+\begin{definition}[inhaltlicher Zweifachsprung]
     Sei $G_t = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
     Sei $G_t = (V_t, E_{S,t} \cup E_{W,t}, V_{L,t}, W_{t})$ der
     um die Wortknoten $W_{t}$ erweiterte Graph.
     um die Wortknoten $W_{t}$ erweiterte Graph.
 
 
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
     und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
     und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
-    ein inhaltlicher Mehrfachsprung.
+    ein inhaltlicher Zweifachsprung.
 \end{definition}
 \end{definition}
 
 
-Jeder inhaltliche Mehrfachsprung beginnt und endet also in einem Strukturknoten,
+Jeder inhaltliche Zweifachsprung beginnt und endet also in einem Strukturknoten,
 springt über einen Wortknoten und ist ein Pfad der Länge~2.
 springt über einen Wortknoten und ist ein Pfad der Länge~2.
 
 
 Ob in einem Sprung der Random Walks ein struktureller Sprung oder
 Ob in einem Sprung der Random Walks ein struktureller Sprung oder
-ein inhaltlicher Mehrfachsprung gemacht wird, wird jedes mal zufällig
+ein inhaltlicher Zweifachsprung gemacht wird, wird jedes mal zufällig
 neu entschieden. Dafür wird der Parameter $0 \leq p_S \leq 1$ für den Algorithmus 
 neu entschieden. Dafür wird der Parameter $0 \leq p_S \leq 1$ für den Algorithmus 
 gewählt. Mit einer Wahrscheinlichkeit von $p_S$ wird ein struktureller
 gewählt. Mit einer Wahrscheinlichkeit von $p_S$ wird ein struktureller
 Sprung durchgeführt und mit einer Wahrscheinlichkeit
 Sprung durchgeführt und mit einer Wahrscheinlichkeit
-von $(1-p_S)$ ein modifizierter inhaltlicher Mehrfachsprung, wie er in
+von $(1-p_S)$ ein modifizierter inhaltlicher Zweifachsprung, wie er in
 \cref{sec:sprungtypen} erklärt wird, gemacht. Der 
 \cref{sec:sprungtypen} erklärt wird, gemacht. Der 
 Parameter $p_S$ gibt an, wie wichtig die Struktur des Graphen im Verhältnis
 Parameter $p_S$ gibt an, wie wichtig die Struktur des Graphen im Verhältnis
 zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
 zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
@@ -132,7 +132,7 @@ struktureller Sprung durchgeführt wird.
                     \If{$sprungTyp \leq p_S$}
                     \If{$sprungTyp \leq p_S$}
                         \State $w \gets$ \Call{SturkturellerSprung}{$w$}
                         \State $w \gets$ \Call{SturkturellerSprung}{$w$}
                     \Else
                     \Else
-                        \State $w \gets$ \Call{InhaltlicherMehrfachsprung}{$w$}
+                        \State $w \gets$ \Call{InhaltlicherZweifachsprung}{$w$}
                     \EndIf
                     \EndIf
                     \State $beschriftung \gets w.\Call{GetLabel}{ }$
                     \State $beschriftung \gets w.\Call{GetLabel}{ }$
                     \If{$!d.\Call{hasKey}{beschriftung}$}
                     \If{$!d.\Call{hasKey}{beschriftung}$}
@@ -173,7 +173,7 @@ verwaltet der DYCOS-Algorithmus zwei weitere Datenstrukturen:
           $w$ in den Texten von $v$.
           $w$ in den Texten von $v$.
     \item Für jedes Wort des Vokabulars $W_t$ wird eine Liste von 
     \item Für jedes Wort des Vokabulars $W_t$ wird eine Liste von 
           Knoten verwaltet, in deren Texten das Wort vorkommt.
           Knoten verwaltet, in deren Texten das Wort vorkommt.
-          Diese Liste wird bei den inhaltlichen Mehrfachsprung,
+          Diese Liste wird bei den inhaltlichen Zweifachsprung,
           der in \cref{sec:sprungtypen} erklärt wird,
           der in \cref{sec:sprungtypen} erklärt wird,
           verwendet.
           verwendet.
 \end{itemize}
 \end{itemize}

BIN=BIN
documents/DYCOS/DYCOS.pdf


+ 7 - 7
documents/DYCOS/Sprungtypen.tex

@@ -1,6 +1,6 @@
 \subsection{Sprungtypen}\label{sec:sprungtypen}
 \subsection{Sprungtypen}\label{sec:sprungtypen}
 Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
 Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
-sowie der inhaltliche Mehrfachsprung werden im folgenden erklärt.
+sowie der inhaltliche Zweifachsprung werden im folgenden erklärt.
 \goodbreak
 \goodbreak
 Der strukturelle Sprung entspricht einer zufälligen Wahl eines 
 Der strukturelle Sprung entspricht einer zufälligen Wahl eines 
 Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
 Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
@@ -18,7 +18,7 @@ gezeigt wird.
 \label{alg:DYCOS-structural-hop}
 \label{alg:DYCOS-structural-hop}
 \end{algorithm}
 \end{algorithm}
 
 
-Bei inhaltlichen Mehrfachsprüngen ist jedoch nicht sinnvoll so strikt
+Bei inhaltlichen Zweifachsprüngen ist jedoch nicht sinnvoll so strikt
 nach der Definition vorzugehen,  also
 nach der Definition vorzugehen,  also
 direkt von einem strukturellem Knoten 
 direkt von einem strukturellem Knoten 
 $v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
 $v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
@@ -30,7 +30,7 @@ Gemeint sein können z.~B. das Bauwerk, das Entwurfsmuster der
 objektorientierten Programmierung oder ein Teil des Gehirns.
 objektorientierten Programmierung oder ein Teil des Gehirns.
 
 
 Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
 Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
-Mehrfachsprung machen will folgende Textanalyse durchgeführt:
+Zweifachsprung machen will folgende Textanalyse durchgeführt:
 \begin{enumerate}[label=C\arabic*,ref=C\arabic*]
 \begin{enumerate}[label=C\arabic*,ref=C\arabic*]
     \item \label{step:c1} Gehe alle in $v$ startenden Random Walks der Länge $2$ durch
     \item \label{step:c1} Gehe alle in $v$ startenden Random Walks der Länge $2$ durch
           und erstelle eine Liste $L$ der erreichbaren Knoten $v'$. Speichere
           und erstelle eine Liste $L$ der erreichbaren Knoten $v'$. Speichere
@@ -42,10 +42,10 @@ CORA-Datensatz wurde in \cite[S. 364]{aggarwal2011} $q=10$ gewählt.}
           Diese Knotenmenge heiße im Folgenden $T(v)$ und $p(v, v')$
           Diese Knotenmenge heiße im Folgenden $T(v)$ und $p(v, v')$
           sei die Anzahl der Pfade von $v$ über einen Wortknoten nach $v'$.
           sei die Anzahl der Pfade von $v$ über einen Wortknoten nach $v'$.
     \item \label{step:c3} Wähle mit Wahrscheinlichkeit $\frac{p(v, v')}{\sum_{w \in T(v)} p(v, w)}$
     \item \label{step:c3} Wähle mit Wahrscheinlichkeit $\frac{p(v, v')}{\sum_{w \in T(v)} p(v, w)}$
-          den Knoten $v' \in T(v)$ als Ziel des Mehrfachsprungs.
+          den Knoten $v' \in T(v)$ als Ziel des Zweifachsprungs.
 \end{enumerate}
 \end{enumerate}
 
 
-Konkret könnte also ein inhaltlicher Mehrfachsprung sowie wie in
+Konkret könnte also ein inhaltlicher Zweifachsprung sowie wie in
 \cref{alg:DYCOS-content-multihop} beschrieben umgesetzt werden.
 \cref{alg:DYCOS-content-multihop} beschrieben umgesetzt werden.
 Der Algorithmus bekommt einen Startknoten $v \in V_T$ und
 Der Algorithmus bekommt einen Startknoten $v \in V_T$ und
 einen $q \in \mathbb{N}$ als Parameter. $q$ ist ein Parameter der
 einen $q \in \mathbb{N}$ als Parameter. $q$ ist ein Parameter der
@@ -76,10 +76,10 @@ der Pfaden der Länge 2 von $v$ nach $v'$ über einen beliebigen
 Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
 Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
 
 
 \begin{algorithm}
 \begin{algorithm}
-  \caption{Inhaltlicher Mehrfachsprung}
+  \caption{Inhaltlicher Zweifachsprung}
   \label{alg:DYCOS-content-multihop}
   \label{alg:DYCOS-content-multihop}
     \begin{algorithmic}[1]
     \begin{algorithmic}[1]
-        \Procedure{InhaltlicherMehrfachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
+        \Procedure{InhaltlicherZweifachsprung}{Knoten $v \in V_T$, $q \in \mathbb{N}$}
             \State $erreichbareKnoten \gets$ leeres assoziatives Array\label{alg:l2}
             \State $erreichbareKnoten \gets$ leeres assoziatives Array\label{alg:l2}
             \ForAll{Wortknoten $w$ in $v.\Call{getWordNodes}{ }$}
             \ForAll{Wortknoten $w$ in $v.\Call{getWordNodes}{ }$}
                 \ForAll{Strukturknoten $x$ in $w.\Call{getStructuralNodes}{ }$}
                 \ForAll{Strukturknoten $x$ in $w.\Call{getStructuralNodes}{ }$}

BIN=BIN
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.pdf


+ 3 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Datamining-Proseminar-Hauptpresentation.tex

@@ -30,6 +30,9 @@
 \section{Sprungtypen}
 \section{Sprungtypen}
 \input{Sprungtypen}
 \input{Sprungtypen}
 
 
+\section{Zusammenfassung}
+\input{Zusammenfassung}
+
 \section{Ende}
 \section{Ende}
 \input{Ende}
 \input{Ende}
 
 

+ 2 - 2
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Sprungtypen.tex

@@ -1,9 +1,9 @@
 \subsection{Sprungtypen}
 \subsection{Sprungtypen}
 \framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf}
 \framedgraphic{Sprungtypen}{../images/graph-content-and-structure.pdf}
-\begin{frame}{Inhaltlicher Mehrfachsprung}
+\begin{frame}{Inhaltlicher Zweifachsprung}
     \begin{itemize}
     \begin{itemize}
         \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$
         \item<1-> \textbf{Struktursprung}: von Strukturknoten $v$ zu Strukturknoten $v'$
-        \item<2-> \textbf{Inhaltlicher Mehrfachsprung}: von Strukturknoten $v$ über Wortknoten zu Strukturknoten $v'$
+        \item<2-> \textbf{Inhaltlicher Zweifachsprung}: von Strukturknoten $v$ über Wortknoten zu Strukturknoten $v'$
         \begin{itemize}
         \begin{itemize}
             \item<3-> Finde alle Knoten $v'$, die über Wortknoten erreichbar sind (Pfadlänge 2)
             \item<3-> Finde alle Knoten $v'$, die über Wortknoten erreichbar sind (Pfadlänge 2)
             \item<4-> Nehme Top-$q$-Knoten (Anzahl der Pfade)
             \item<4-> Nehme Top-$q$-Knoten (Anzahl der Pfade)

+ 8 - 0
presentations/Datamining-Proseminar/Hauptpresentation/LaTeX/Zusammenfassung.tex

@@ -0,0 +1,8 @@
+\subsection{Zusammenfassung}
+\begin{frame}{Wichtige Ideen}
+    \begin{itemize}
+        \item<1-> Random Walk
+        \item<2-> Gini-Koeffizient
+        \item<3-> Inhaltlicher Zweifachsprung
+    \end{itemize}
+\end{frame}