Einleitung.tex 2.7 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849
  1. Im Folgenden werden in \cref{sec:Motivation} einge Beispiele, in denen
  2. der DYCOS-Algorithmus anwendung finden könnte, dargelegt. In
  3. \cref{sec:Problemstellung} wird die Problemstellung formal definiert
  4. und in \cref{sec:Herausforderungen} wird auf besondere Herausforderungen
  5. der Aufgabenstellung hingewiesen.
  6. \subsection{Motivation}\label{sec:Motivation}
  7. Teilweise beschriftete Graphen sind allgegenwärtig. Publikationsdatenbanken
  8. mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
  9. sowie von Nutzern vergebene Beschriftungen (sog. {\it Tags}) oder Kategorien als Knotenbeschriftungen;
  10. Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
  11. als Knotenbeschriftungen sowie soziale Netzwerke mit Eigenschaften der Benutzer
  12. als Knotenbeschriftungen sind drei Beispiele dafür.
  13. Häufig sind Knotenbeschriftungen nur teilweise vorhanden und es ist wünschenswert die
  14. fehlenden Knotenbeschriftungen automatisiert zu ergänzen.
  15. \subsection{Problemstellung}\label{sec:Problemstellung}
  16. Gegeben ist ein Graph, dessen Knoten teilweise beschriftet sind. Zusätzlich stehen
  17. zu einer Teilmenge der Knoten Texte bereit. Gesucht sind nun Knotenbeschriftungen
  18. für alle Knoten, die bisher noch nicht beschriftet sind.\\
  19. \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
  20. Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph,
  21. wobei $V_t$ die Menge aller Knoten,
  22. $E_t \subseteq V_t \times V_t$ die Kantenmenge und $V_{L,t} \subseteq V_t$ die Menge der
  23. beschrifteten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
  24. Außerdem sei $L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
  25. Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die Funktion, die einen
  26. Knoten auf seine Beschriftung abbildet.
  27. Weiter sei für jeden Knoten $v \in V$ eine (eventuell leere)
  28. Textmenge $T(v)$ gegeben.
  29. Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
  30. $\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe,
  31. zu $G_t$ die Funktion $\tilde{f}$ zu finden heißt \textit{Knotenklassifierungsproblem}.
  32. \end{definition}
  33. \subsection{Herausforderungen}\label{sec:Herausforderungen}
  34. Die Graphen, für die dieser Algorithmus konzipiert wurde,
  35. sind viele $\num{10000}$~Knoten groß und dynamisch. \enquote{Dynamisch}
  36. bedeutet in diesem Kontext, dass neue Knoten und eventuell auch neue
  37. Kanten hinzu kommen bzw. Kanten oder Knoten werden entfernt werden.
  38. Außerdem stehen textuelle Inhalte zu den
  39. Knoten bereit, die bei der Klassifikation genutzt werden können.
  40. Bei kleinen Änderungen sollte nicht alles nochmals berechnen
  41. werden müssen, sondern basierend auf zuvor
  42. berechneten Knotenbeschriftungen sollte die Klassifizierung angepasst werden.