Ver código fonte

Einige Probleme beseitigt

Martin Thoma 11 anos atrás
pai
commit
bc73a5a948

+ 3 - 2
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -41,7 +41,8 @@ jedes Wort im Vokabular ein Wortknoten zum Graphen hinzugefügt. Alle
 Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
 genannt.
 Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$
-verbunden, wenn $w$ in einem Text von $v$ vorkommt.
+verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph}
+zeigt beispielhaft den so entstehenden, bipartiten Graphen.
 Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten 
 zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen 
 wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird 
@@ -65,7 +66,7 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
 
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in V_t$
-    ein struktureller Sprung.
+    ein \textit{struktureller Sprung}.
 \end{definition}
 \goodbreak
 Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge

BIN
documents/DYCOS/DYCOS.pdf


+ 3 - 3
documents/DYCOS/Einleitung.tex

@@ -22,7 +22,7 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
 \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
     Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
     wobei $V_t$ die Menge aller Knoten,
-    $E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der 
+    $E_t \subseteq V_t \times V_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der 
     beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
     Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
     Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
@@ -32,8 +32,8 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
     Textmenge $T(v)$ gegeben.
 
     Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
-    $\tilde{f}: V_t \rightarrow L_t$ mit 
-    $\tilde{f}|_{V_{L,t}} = f$.
+    $\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe,
+    zu $G_t$ die Funktion $\tilde{f}$ zu finden heißt \textit{Knotenklassifierungsproblem}.
 \end{definition}
 
 \subsection{Herausforderungen}\label{sec:Herausforderungen}

+ 0 - 3
documents/DYCOS/README.md

@@ -6,10 +6,7 @@ Die Ausarbeitung soll 10-12 Seiten haben und die Präsentation
 TODO
 -----
 
-* label -> Beschriftung
 * Abschnitt "Problemstellung" überarbeiten
-* Abbildung verlinken
 * Algorithmen erklären
 * Warum sind Stellenangaben überflüssig?
-* Map erklären
 * Algorithmus 4, S. 9

+ 10 - 4
documents/DYCOS/Sprungtypen.tex

@@ -53,10 +53,16 @@ für den DYCOS-Algorithmus zu wählen ist. Dieser Parameter beschränkt
 die Anzahl der möglichen Zielknoten $v' \in V_T$ auf diejenigen
 $q$ Knoten, die $v$ bzgl. der Textanalyse am ähnlichsten sind.
 
-In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt.
+In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt
+und alle erreichbaren Knoten in $reachableNodes$ mit der Anzahl
+der Pfade, durch die sie erreicht werden können, gespeichert.
 
-In \cref{alg:l6} wird \cref{step:c2} durchgeführt. Bei der
-Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
+In \cref{alg:l6} wird \cref{step:c2} durchgeführt. 
+Ab hier gilt
+\[ |T| = \begin{cases}q               &\text{falls } |reachableNodes|\geq q\\
+                     |reachableNodes| &\text{sonst }\end{cases}\]
+
+Bei der Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
 \cref{alg:21} über Indizes auf Elemente aus $T$ zugreifen können muss.
 
 In \cref{alg:l8} bis \cref{alg:l13} wird ein Wörterbuch erstellt,
@@ -80,7 +86,7 @@ Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
                     \State $reachableNodes[x] \gets reachableNodes[x] + 1$
                 \EndFor
             \EndFor\label{alg:l5}
-            \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$ \Comment{Also: $|T| = q$, falls $|reachableNodes|\geq q$}
+            \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$
             \\
             \State \label{alg:l8} $s \gets 0$
             \ForAll{Knoten $x \in T$}