Einleitung.tex 2.0 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748
  1. \subsection{Motivation}
  2. Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
  3. mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
  4. sowie Tags oder Kategorien als Labels;
  5. Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
  6. als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
  7. sind drei Beispiele dafür.
  8. Da Labels nur teilweise vorhanden sind, ist es wünschenswert die
  9. fehlenden Labels zu ergänzen.
  10. \subsection{Problemstellung}
  11. Das Knotenklassifierungsproblem sei wie folgt definiert:\\
  12. \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
  13. Sei $\G_t = (\N_t, \A_t, \T_t)$ ein Netzwerk,
  14. wobei $\N_t$ die Menge aller Knoten,
  15. $\A_t$ die Kantenmenge und $\T_t \subseteq \N_t$ die Menge Knoten mit Labels
  16. jeweils zum Zeitpunkt $t$ bezeichne.
  17. Außerdem sei $\L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
  18. Labels und $f:\T_t \rightarrow \L_t$ die Funktion, die einen
  19. Knoten auf sein Label abbildet.
  20. Gesucht sind nun Labels für $\N_t \setminus \T_t$, also
  21. $\tilde{f}:\N_t \rightarrow \L_t$ mit
  22. $\tilde{f}|_{\T_t} = f$.
  23. \end{definition}
  24. Wir haben häufig zusätzlich zu dem Graphen $\G_t$ und der Label-Funktion
  25. $f$ aus Definition~\ref{def:Knotenklassifizierungsproblem} noch
  26. textuelle Inhalte, die Knoten zugeornet werden.
  27. \subsection{Herausforderungen}
  28. Die beispielhaft aufgeführen Netzwerke sind viele
  29. $\num{10000}$~Knoten groß und dynamisch. Das bedeutet, es kommen
  30. neue Knoten und eventuell auch neue Kanten hinzu bzw. Kanten oder
  31. Knoten werden entfernt.Außerdem stehen
  32. textuelle Inhalte zu den Knoten bereit, die bei der Klassifikation
  33. genutzt werden können.
  34. Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
  35. Netzwerken angewandt werden.
  36. Der DYCOS-Algorithmus nutzt Random Walks im Graphen, startend
  37. von dem zu klassifizierenden Knoten $n$. Dabei wird pro Random Walk
  38. gezählt, welche Klasse $K$ am häufigsten gesehen wird. Der Knoten $n$
  39. wird dann als zu $K$ zugehörig klassifiziert.