Einleitung.tex 2.0 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647
  1. \subsection{Motivation}
  2. Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
  3. mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
  4. sowie Tags oder Kategorien als Labels;
  5. Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
  6. als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
  7. sind drei Beispiele dafür.
  8. Da Labels nur teilweise vorhanden sind, ist es wünschenswert die
  9. fehlenden Labels zu ergänzen.
  10. \subsection{Problemstellung}
  11. Das Knotenklassifierungsproblem sei wie folgt definiert:\\
  12. \begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
  13. Sei $\G_t = (\N_t, \A_t, \T_t)$ ein Netzwerk,
  14. wobei $\N_t$ die Menge aller Knoten,
  15. $\A_t$ die Kantenmenge und $\T_t \subseteq \N_t$ die Menge der
  16. gelabelten Knoten jeweils zum Zeitpunkt $t$ bezeichne.
  17. Außerdem sei $\L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
  18. Labels und $f:\T_t \rightarrow \L_t$ die Funktion, die einen
  19. Knoten auf sein Label abbildet.
  20. Gesucht sind nun Labels für $\N_t \setminus \T_t$, also
  21. $\tilde{f}:\N_t \rightarrow \L_t$ mit
  22. $\tilde{f}|_{\T_t} = f$.
  23. \end{definition}
  24. Wir haben häufig zusätzlich zu dem Graphen $\G_t$ und der Label-Funktion
  25. $f$ aus Definition~\ref{def:Knotenklassifizierungsproblem} noch
  26. textuelle Inhalte, die Knoten zugeornet werden.
  27. \subsection{Herausforderungen}
  28. Die beispielhaft aufgeführen Netzwerke sind viele
  29. $\num{10000}$~Knoten groß und dynamisch. Das bedeutet, es kommen
  30. neue Knoten und eventuell auch neue Kanten hinzu bzw. Kanten oder
  31. Knoten werden entfernt. Außerdem stehen textuelle Inhalte zu den
  32. Knoten bereit, die bei der Klassifikation genutzt werden können.
  33. Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
  34. Netzwerken angewandt werden.
  35. Der DYCOS-Algorithmus nutzt Random Walks im Graphen, startend
  36. von dem zu klassifizierenden Knoten $n$. Dabei wird pro Random Walk
  37. gezählt, welche Klasse $K$ am häufigsten gesehen wird. Der Knoten $n$
  38. wird dann als zu $K$ zugehörig klassifiziert.