Bläddra i källkod

added first literature entry; modified introduction

Martin Thoma 11 år sedan
förälder
incheckning
1efccc09d9

+ 5 - 0
documents/DYCOS/Abgrenzung.tex

@@ -0,0 +1,5 @@
+Es gibt viele Knotenklassifizierungsalgorithmen. Im folgenden
+werden einige von Ihnen mit dem DYCOS-Algorithmus verglichen und
+unterschiedliche Eigenschaften der Algorithmen hervorgehoben.
+
+Der MUCCA-Algorithmus aus \cite{zappella} sei der erste.

+ 0 - 0
documents/DYCOS/Ausblick.tex


+ 5 - 0
documents/DYCOS/DYCOS-Algorithmus.tex

@@ -0,0 +1,5 @@
+\subsection{Notation}
+\input{Notation}
+
+\subsection{Inhalte}
+\input{Inhalte}

+ 15 - 8
documents/DYCOS/DYCOS.tex

@@ -17,13 +17,16 @@
 \usepackage{listings}
 \usepackage{subfigure}
 \usepackage{hyperref}
+\usepackage{cite}
+\usepackage{parskip}
+\usepackage[framed,amsmath,thmmarks,hyperref]{ntheorem}
 \usepackage{mystyle}
 
 \setcounter{tocdepth}{3}
 \setcounter{secnumdepth}{3}
 
 \hypersetup{ 
-  pdftitle    = {Über die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt},
+  pdftitle    = {"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt},
   pdfauthor   = {Martin Thoma}, 
   pdfkeywords = {DYCOS}
 }
@@ -31,10 +34,10 @@
 \begin{document}
 
 \mainmatter
-\title{\"Uber die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt}
-\titlerunning{Titel der Seminararbeit}
+\title{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt}
+\titlerunning{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt}
 \author{Martin Thoma}
-\authorrunning{Titel des Seminars}
+\authorrunning{Proseminar Netzwerkanalyse}
 \institute{Betreuer: Christopher O\ss{}ner}
 \date{17.01.2014}
 \maketitle
@@ -42,15 +45,19 @@
 \begin{abstract}%
 \input{abstract}
 \end{abstract}
+\clearpage
 
 \section{Einleitung}
 \input{Einleitung}
 
-\section{Notation}
-\input{Notation}
+\section{Abgrenzung}
+\input{Abgrenzung}
 
-\section{Inhalte}
-\input{Inhalte}
+\section{DYCOS}
+\input{DYCOS-Algorithmus}
+
+\section{Ausblick}
+\input{Ausblick}
 
 % Normaler LNCS Zitierstil
 %\bibliographystyle{splncs}

+ 43 - 0
documents/DYCOS/Einleitung.tex

@@ -1,3 +1,46 @@
+\subsection{Motivation}
+Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
+mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
+sowie Tags oder Kategorien als Labels;
+Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
+als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
+sind drei Beispiele dafür.
+Da Labels nur teilweise vorhanden sind, ist es wünschenswert die 
+fehlenden Labels zu ergänzen. 
+
+\subsection{Problemstellung}
+Das Knotenklassifierungsproblem sei wie folgt definiert:\\
+
+\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
+    Sei $\G_t = (\N_t, \A_t, \T_t)$ ein Netzwerk,
+    wobei $\N_t$ die Menge aller Knoten,
+    $\A_t$ die Kantenmenge und $\T_t \subseteq \N_t$ die Menge Knoten mit Labels 
+    jeweils zum Zeitpunkt $t$ bezeichne.
+    Außerdem sei $\L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
+    Labels und $f:\T_t \rightarrow \L_t$ die Funktion, die einen
+    Knoten auf sein Label abbildet.
+
+    Gesucht sind nun Labels für $\N_t \setminus \T_t$, also
+    $\tilde{f}:\N_t \rightarrow \L_t$ mit 
+    $\tilde{f}|_{\T_t} = f$.
+\end{definition}
+
+Wir haben häufig zusätzlich zu dem Graphen $\G_t$ und der Label-Funktion
+$f$ aus Definition~\ref{def:Knotenklassifizierungsproblem} noch
+textuelle Inhalte, die Knoten zugeornet werden. 
+
+
+\subsection{Herausforderungen}
+Die beispielhaft aufgeführen Netzwerke sind viele 
+$\num{10000}$~Knoten groß und dynamisch. Das bedeutet, es kommen
+neue Knoten und eventuell auch neue Kanten hinzu bzw. Kanten oder
+Knoten werden entfernt.Außerdem stehen 
+textuelle Inhalte zu den Knoten bereit, die bei der Klassifikation 
+genutzt werden können.
+
+Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
+Netzwerken angewandt werden.
+
 Der DYCOS-Algorithmus nutzt Random Walks im Graphen, startend 
 von dem zu klassifizierenden Knoten $n$. Dabei wird pro Random Walk
 gezählt, welche Klasse $K$ am häufigsten gesehen wird. Der Knoten $n$

+ 2 - 0
documents/DYCOS/Makefile

@@ -2,6 +2,8 @@ DOKUMENT = DYCOS
 
 make:
 	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen erstellen
+	bibtex $(DOKUMENT)
+	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden
 	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden
 	make clean
 

+ 7 - 12
documents/DYCOS/abstract.tex

@@ -1,13 +1,8 @@
-Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
-bzw. Wikipedia mit Kategorien, soziale Netzwerke mit Eigenschaften der 
-Benutzer und Datenbanken zur Analyse des Kaufverhaltens mit 
-Produkt oder Kundeneigenschaften als Labels. Da die Labels nur 
-teilweise vorhanden sind, ist es wünschenswert die fehlenden Labels
-zu ergänzen. Doch häufig sind diese Netzwerke viele $\num{10000}$ 
-Knoten groß und ändern sich laufend. Außerdem stehen textuelle
-Inhalte zu den Knoten bereit, die bei der Klassifikation genutzt 
-werden können.
-
-Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
-Netzwerken angewandt werden.
+In dieser Arbeit wird der DYCOS-Algorithmus vorgestellt. Er 
+klassifiziert automatisch Knoten in Netzwerken, die bereits
+teilweise gelabelt sind. Zur Klassifizierung kann er textuelle
+Informationen, die den Knoten zugeordnet sind, nutzen. Auch ist
+er für für viele $\num{10000}$ Knoten große, dynamische Netzwerke
+geeignet.\\
 
+\textbf{Keywords:} DYCOS, Label Propagation, Knotenklassifizierung

+ 9 - 0
documents/DYCOS/literatur.bib

@@ -1,3 +1,12 @@
 % This file was created with JabRef 2.3.1.
 % Encoding: Cp1252
 
+@Online{zappella,
+  author      = {Giovanni Zappella},
+  title       = {A Scalable Multiclass Algorithm for Node Classification},
+  version     = {1},
+  date        = {2011-12-19},
+  eprinttype  = {arxiv},
+  eprintclass = {cs.LG, cs.GT},
+  eprint      = {http://arxiv.org/abs/1112.4344v1}
+}

+ 9 - 0
documents/DYCOS/mystyle.sty

@@ -8,3 +8,12 @@
 \def\nodes{\ensuremath{\mathcal{N}_t}}
 \def\labeledNodes{\ensuremath{\mathcal{T}_t}}
 \DeclareUnicodeCharacter{00A0}{~}
+
+\theoremstyle{definition}
+\renewtheorem{definition}{Definition}
+
+\def\A{\ensuremath{\mathcal{A}}}
+\def\G{\ensuremath{\mathcal{G}}}
+\def\L{\ensuremath{\mathcal{L}}}
+\def\N{\ensuremath{\mathcal{N}}}
+\def\T{\ensuremath{\mathcal{T}}}