浏览代码

Einige Probleme beseitigt

Martin Thoma 12 年之前
父节点
当前提交
bc73a5a948

+ 3 - 2
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -41,7 +41,8 @@ jedes Wort im Vokabular ein Wortknoten zum Graphen hinzugefügt. Alle
 Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
 Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
 genannt.
 genannt.
 Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$
 Ein Strukturknoten $v$ wird genau dann mit einem Wortknoten $w \in W_t$
-verbunden, wenn $w$ in einem Text von $v$ vorkommt.
+verbunden, wenn $w$ in einem Text von $v$ vorkommt. \Cref{fig:erweiterter-graph}
+zeigt beispielhaft den so entstehenden, bipartiten Graphen.
 Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten 
 Der DYCOS-Algorithmus betrachtet also die Texte, die einem Knoten 
 zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen 
 zugeordnet sind, als eine Multimenge von Wörtern. Das heißt, zum einen 
 wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird 
 wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird 
@@ -65,7 +66,7 @@ die strukturellen Sprünge und inhaltliche Mehrfachsprünge:
 
 
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Dann heißt das zufällige wechseln des aktuell betrachteten
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in V_t$
     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in V_t$
-    ein struktureller Sprung.
+    ein \textit{struktureller Sprung}.
 \end{definition}
 \end{definition}
 \goodbreak
 \goodbreak
 Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge
 Im Gegensatz dazu benutzten inhaltliche Mehrfachsprünge

二进制
documents/DYCOS/DYCOS.pdf


+ 3 - 3
documents/DYCOS/Einleitung.tex

@@ -22,7 +22,7 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
 \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
 \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
     Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
     Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
     wobei $V_t$ die Menge aller Knoten,
     wobei $V_t$ die Menge aller Knoten,
-    $E_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der 
+    $E_t \subseteq V_t \times V_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der 
     beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
     beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
     Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
     Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
     Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
     Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
@@ -32,8 +32,8 @@ für alle Knoten, die bisher noch nicht beschriftet sind.\\
     Textmenge $T(v)$ gegeben.
     Textmenge $T(v)$ gegeben.
 
 
     Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
     Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
-    $\tilde{f}: V_t \rightarrow L_t$ mit 
-    $\tilde{f}|_{V_{L,t}} = f$.
+    $\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe,
+    zu $G_t$ die Funktion $\tilde{f}$ zu finden heißt \textit{Knotenklassifierungsproblem}.
 \end{definition}
 \end{definition}
 
 
 \subsection{Herausforderungen}\label{sec:Herausforderungen}
 \subsection{Herausforderungen}\label{sec:Herausforderungen}

+ 0 - 3
documents/DYCOS/README.md

@@ -6,10 +6,7 @@ Die Ausarbeitung soll 10-12 Seiten haben und die Präsentation
 TODO
 TODO
 -----
 -----
 
 
-* label -> Beschriftung
 * Abschnitt "Problemstellung" überarbeiten
 * Abschnitt "Problemstellung" überarbeiten
-* Abbildung verlinken
 * Algorithmen erklären
 * Algorithmen erklären
 * Warum sind Stellenangaben überflüssig?
 * Warum sind Stellenangaben überflüssig?
-* Map erklären
 * Algorithmus 4, S. 9
 * Algorithmus 4, S. 9

+ 10 - 4
documents/DYCOS/Sprungtypen.tex

@@ -53,10 +53,16 @@ für den DYCOS-Algorithmus zu wählen ist. Dieser Parameter beschränkt
 die Anzahl der möglichen Zielknoten $v' \in V_T$ auf diejenigen
 die Anzahl der möglichen Zielknoten $v' \in V_T$ auf diejenigen
 $q$ Knoten, die $v$ bzgl. der Textanalyse am ähnlichsten sind.
 $q$ Knoten, die $v$ bzgl. der Textanalyse am ähnlichsten sind.
 
 
-In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt.
+In \cref{alg:l2} bis \cref{alg:l5} wird \cref{step:c1} durchgeführt
+und alle erreichbaren Knoten in $reachableNodes$ mit der Anzahl
+der Pfade, durch die sie erreicht werden können, gespeichert.
 
 
-In \cref{alg:l6} wird \cref{step:c2} durchgeführt. Bei der
-Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
+In \cref{alg:l6} wird \cref{step:c2} durchgeführt. 
+Ab hier gilt
+\[ |T| = \begin{cases}q               &\text{falls } |reachableNodes|\geq q\\
+                     |reachableNodes| &\text{sonst }\end{cases}\]
+
+Bei der Wahl der Datenstruktur von $T$ ist zu beachten, dass man in
 \cref{alg:21} über Indizes auf Elemente aus $T$ zugreifen können muss.
 \cref{alg:21} über Indizes auf Elemente aus $T$ zugreifen können muss.
 
 
 In \cref{alg:l8} bis \cref{alg:l13} wird ein Wörterbuch erstellt,
 In \cref{alg:l8} bis \cref{alg:l13} wird ein Wörterbuch erstellt,
@@ -80,7 +86,7 @@ Wortknoten entspricht ausgewählt und schließlich zurückgegeben.
                     \State $reachableNodes[x] \gets reachableNodes[x] + 1$
                     \State $reachableNodes[x] \gets reachableNodes[x] + 1$
                 \EndFor
                 \EndFor
             \EndFor\label{alg:l5}
             \EndFor\label{alg:l5}
-            \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$ \Comment{Also: $|T| = q$, falls $|reachableNodes|\geq q$}
+            \State \label{alg:l6} $T \gets \Call{max}{reachableNodes, q}$
             \\
             \\
             \State \label{alg:l8} $s \gets 0$
             \State \label{alg:l8} $s \gets 0$
             \ForAll{Knoten $x \in T$}
             \ForAll{Knoten $x \in T$}