Einleitung.tex 2.7 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748
  1. Im Folgenden werden in \cref{sec:Motivation} einige Beispiele, in denen
  2. der DYCOS-Algorithmus Anwendung finden könnte, dargelegt. In
  3. \cref{sec:Problemstellung} wird die Problemstellung formal definiert
  4. und in \cref{sec:Herausforderungen} wird auf besondere Herausforderungen der
  5. Aufgabenstellung hingewiesen.
  6. \subsection{Motivation}\label{sec:Motivation}
  7. Teilweise beschriftete Graphen sind allgegenwärtig. Publikationsdatenbanken mit
  8. Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten sowie von
  9. Nutzern vergebene Beschriftungen (sog. {\it Tags}) oder Kategorien als
  10. Knotenbeschriftungen; Wikipedia mit Artikeln als Knoten, Links als Kanten und
  11. Kategorien als Knotenbeschriftungen sowie soziale Netzwerke mit Eigenschaften
  12. der Benutzer als Knotenbeschriftungen sind drei Beispiele dafür. Häufig sind
  13. Knotenbeschriftungen nur teilweise vorhanden und es ist wünschenswert die
  14. fehlenden Knotenbeschriftungen automatisiert zu ergänzen.
  15. \subsection{Problemstellung}\label{sec:Problemstellung}
  16. Gegeben ist ein Graph, dessen Knoten teilweise beschriftet sind. Zusätzlich
  17. stehen zu einer Teilmenge der Knoten Texte bereit. Gesucht sind nun
  18. Knotenbeschriftungen für alle Knoten, die bisher noch nicht beschriftet sind.\\
  19. \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
  20. Sei $G_t = (V_t, E_t, V_{L,t})$ ein gerichteter Graph, wobei $V_t$ die
  21. Menge aller Knoten, $E_t \subseteq V_t \times V_t$ die Kantenmenge und
  22. $V_{L,t} \subseteq V_t$ die Menge der beschrifteten Knoten jeweils zum
  23. Zeitpunkt $t$ bezeichne. Außerdem sei $L_t$ die Menge aller zum Zeitpunkt
  24. $t$ vergebenen Knotenbeschriftungen und $f:V_{L,t} \rightarrow L_t$ die
  25. Funktion, die einen Knoten auf seine Beschriftung abbildet.
  26. Weiter sei für jeden Knoten $v \in V$ eine (eventuell leere) Textmenge
  27. $T(v)$ gegeben.
  28. Gesucht sind nun Beschriftungen für $V_t \setminus V_{L,t}$, also
  29. $\tilde{f}: V_t \setminus V_{L,t} \rightarrow L_t$. Die Aufgabe, zu $G_t$
  30. die Funktion $\tilde{f}$ zu finden heißt
  31. \textit{Knotenklassifierungsproblem}.
  32. \end{definition}
  33. \subsection{Herausforderungen}\label{sec:Herausforderungen}
  34. Die Graphen, für die dieser Algorithmus konzipiert wurde, sind viele
  35. $\num{10000}$~Knoten groß und dynamisch. \enquote{Dynamisch} bedeutet in diesem
  36. Kontext, dass neue Knoten und eventuell auch neue Kanten hinzu kommen bzw.
  37. Kanten oder Knoten werden entfernt werden. Außerdem stehen textuelle Inhalte zu
  38. den Knoten bereit, die bei der Klassifikation genutzt werden können. Bei
  39. kleinen Änderungen sollte nicht alles nochmals berechnen werden müssen, sondern
  40. basierend auf zuvor berechneten Knotenbeschriftungen sollte die Klassifizierung
  41. angepasst werden.