12 jaren geleden · 1efccc09d9
--- a/documents/DYCOS/Abgrenzung.tex
+++ b/documents/DYCOS/Abgrenzung.tex
@@ -0,0 +1,5 @@
 
				+Es gibt viele Knotenklassifizierungsalgorithmen. Im folgenden
			
 
				+werden einige von Ihnen mit dem DYCOS-Algorithmus verglichen und
			
 
				+unterschiedliche Eigenschaften der Algorithmen hervorgehoben.
			
 
				+
			
 
				+Der MUCCA-Algorithmus aus \cite{zappella} sei der erste.
			
--- a/documents/DYCOS/Ausblick.tex
+++ b/documents/DYCOS/Ausblick.tex
--- a/documents/DYCOS/DYCOS-Algorithmus.tex
+++ b/documents/DYCOS/DYCOS-Algorithmus.tex
@@ -0,0 +1,5 @@
 
				+\subsection{Notation}
			
 
				+\input{Notation}
			
 
				+
			
 
				+\subsection{Inhalte}
			
 
				+\input{Inhalte}
			
--- a/documents/DYCOS/DYCOS.tex
+++ b/documents/DYCOS/DYCOS.tex
@@ -17,13 +17,16 @@
 
				 \usepackage{listings}

			
 
				 \usepackage{subfigure}

			
 
				 \usepackage{hyperref}

			
 
				+\usepackage{cite}

			
 
				+\usepackage{parskip}

			
 
				+\usepackage[framed,amsmath,thmmarks,hyperref]{ntheorem}

			
 
				 \usepackage{mystyle}

			
 
				 

			
 
				 \setcounter{tocdepth}{3}

			
 
				 \setcounter{secnumdepth}{3}

			
 
				 

			
 
				 \hypersetup{ 

			
 
				-  pdftitle    = {Über die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt},

			
 
				+  pdftitle    = {"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt},

			
 
				   pdfauthor   = {Martin Thoma}, 

			
 
				   pdfkeywords = {DYCOS}

			
 
				 }

			
@@ -31,10 +34,10 @@
 
				 \begin{document}

			
 
				 

			
 
				 \mainmatter

			
 
				-\title{\"Uber die Klassifizierung von Knoten in einem dynamischen Netzwerk mit Inhalt}

			
 
				-\titlerunning{Titel der Seminararbeit}

			
 
				+\title{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt}

			
 
				+\titlerunning{\"Uber die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt}

			
 
				 \author{Martin Thoma}

			
 
				-\authorrunning{Titel des Seminars}

			
 
				+\authorrunning{Proseminar Netzwerkanalyse}

			
 
				 \institute{Betreuer: Christopher O\ss{}ner}

			
 
				 \date{17.01.2014}

			
 
				 \maketitle

			
@@ -42,15 +45,19 @@
 
				 \begin{abstract}%

			
 
				 \input{abstract}

			
 
				 \end{abstract}

			
 
				+\clearpage

			
 
				 

			
 
				 \section{Einleitung}

			
 
				 \input{Einleitung}

			
 
				 

			
 
				-\section{Notation}

			
 
				-\input{Notation}

			
 
				+\section{Abgrenzung}

			
 
				+\input{Abgrenzung}

			
 
				 

			
 
				-\section{Inhalte}

			
 
				-\input{Inhalte}

			
 
				+\section{DYCOS}

			
 
				+\input{DYCOS-Algorithmus}

			
 
				+

			
 
				+\section{Ausblick}

			
 
				+\input{Ausblick}

			
 
				 

			
 
				 % Normaler LNCS Zitierstil

			
 
				 %\bibliographystyle{splncs}

			
--- a/documents/DYCOS/Einleitung.tex
+++ b/documents/DYCOS/Einleitung.tex
@@ -1,3 +1,46 @@
 
				+\subsection{Motivation}
			
 
				+Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
			
 
				+mit Publikationen als Knoten, Literaturverweisen und Zitaten als Kanten
			
 
				+sowie Tags oder Kategorien als Labels;
			
 
				+Wikipedia mit Artikeln als Knoten, Links als Kanten und Kategorien
			
 
				+als Labels sowie soziale Netzwerke mit Eigenschaften der Benutzer
			
 
				+sind drei Beispiele dafür.
			
 
				+Da Labels nur teilweise vorhanden sind, ist es wünschenswert die 
			
 
				+fehlenden Labels zu ergänzen. 
			
 
				+
			
 
				+\subsection{Problemstellung}
			
 
				+Das Knotenklassifierungsproblem sei wie folgt definiert:\\
			
 
				+
			
 
				+\begin{definition}[Knotenklassifierungsproblem]\label{def:Knotenklassifizierungsproblem}
			
 
				+    Sei $\G_t = (\N_t, \A_t, \T_t)$ ein Netzwerk,
			
 
				+    wobei $\N_t$ die Menge aller Knoten,
			
 
				+    $\A_t$ die Kantenmenge und $\T_t \subseteq \N_t$ die Menge Knoten mit Labels 
			
 
				+    jeweils zum Zeitpunkt $t$ bezeichne.
			
 
				+    Außerdem sei $\L_t$ die Menge aller zum Zeitpunkt $t$ vergebenen
			
 
				+    Labels und $f:\T_t \rightarrow \L_t$ die Funktion, die einen
			
 
				+    Knoten auf sein Label abbildet.
			
 
				+
			
 
				+    Gesucht sind nun Labels für $\N_t \setminus \T_t$, also
			
 
				+    $\tilde{f}:\N_t \rightarrow \L_t$ mit 
			
 
				+    $\tilde{f}|_{\T_t} = f$.
			
 
				+\end{definition}
			
 
				+
			
 
				+Wir haben häufig zusätzlich zu dem Graphen $\G_t$ und der Label-Funktion
			
 
				+$f$ aus Definition~\ref{def:Knotenklassifizierungsproblem} noch
			
 
				+textuelle Inhalte, die Knoten zugeornet werden. 
			
 
				+
			
 
				+
			
 
				+\subsection{Herausforderungen}
			
 
				+Die beispielhaft aufgeführen Netzwerke sind viele 
			
 
				+$\num{10000}$~Knoten groß und dynamisch. Das bedeutet, es kommen
			
 
				+neue Knoten und eventuell auch neue Kanten hinzu bzw. Kanten oder
			
 
				+Knoten werden entfernt.Außerdem stehen 
			
 
				+textuelle Inhalte zu den Knoten bereit, die bei der Klassifikation 
			
 
				+genutzt werden können.
			
 
				+
			
 
				+Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
			
 
				+Netzwerken angewandt werden.
			
 
				+
			
 
				 Der DYCOS-Algorithmus nutzt Random Walks im Graphen, startend 
			
 
				 von dem zu klassifizierenden Knoten $n$. Dabei wird pro Random Walk
			
 
				 gezählt, welche Klasse $K$ am häufigsten gesehen wird. Der Knoten $n$
			
--- a/documents/DYCOS/Makefile
+++ b/documents/DYCOS/Makefile
@@ -2,6 +2,8 @@ DOKUMENT = DYCOS
 
				 
			
 
				 make:
			
 
				 	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen erstellen
			
 
				+	bibtex $(DOKUMENT)
			
 
				+	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden
			
 
				 	pdflatex $(DOKUMENT).tex -output-format=pdf # Referenzen einbinden
			
 
				 	make clean
			
 
				 
			
--- a/documents/DYCOS/abstract.tex
+++ b/documents/DYCOS/abstract.tex
@@ -1,13 +1,8 @@
 
				-Teilweise gelabelte Netzwerke sind allgegenwärtig. Publikationsdatenbanken
			
 
				-bzw. Wikipedia mit Kategorien, soziale Netzwerke mit Eigenschaften der 
			
 
				-Benutzer und Datenbanken zur Analyse des Kaufverhaltens mit 
			
 
				-Produkt oder Kundeneigenschaften als Labels. Da die Labels nur 
			
 
				-teilweise vorhanden sind, ist es wünschenswert die fehlenden Labels
			
 
				-zu ergänzen. Doch häufig sind diese Netzwerke viele $\num{10000}$ 
			
 
				-Knoten groß und ändern sich laufend. Außerdem stehen textuelle
			
 
				-Inhalte zu den Knoten bereit, die bei der Klassifikation genutzt 
			
 
				-werden können.
			
 
				-
			
 
				-Der DYCOS-Algorithmus nutzt diese und kann auf große, dynamische
			
 
				-Netzwerken angewandt werden.
			
 
				+In dieser Arbeit wird der DYCOS-Algorithmus vorgestellt. Er 
			
 
				+klassifiziert automatisch Knoten in Netzwerken, die bereits
			
 
				+teilweise gelabelt sind. Zur Klassifizierung kann er textuelle
			
 
				+Informationen, die den Knoten zugeordnet sind, nutzen. Auch ist
			
 
				+er für für viele $\num{10000}$ Knoten große, dynamische Netzwerke
			
 
				+geeignet.\\
			
 
				 
			
 
				+\textbf{Keywords:} DYCOS, Label Propagation, Knotenklassifizierung
			
--- a/documents/DYCOS/literatur.bib
+++ b/documents/DYCOS/literatur.bib
@@ -1,3 +1,12 @@
 
				 % This file was created with JabRef 2.3.1.

			
 
				 % Encoding: Cp1252

			
 
				 

			
 
				+@Online{zappella,

			
 
				+  author      = {Giovanni Zappella},

			
 
				+  title       = {A Scalable Multiclass Algorithm for Node Classification},

			
 
				+  version     = {1},

			
 
				+  date        = {2011-12-19},

			
 
				+  eprinttype  = {arxiv},

			
 
				+  eprintclass = {cs.LG, cs.GT},

			
 
				+  eprint      = {http://arxiv.org/abs/1112.4344v1}

			
 
				+}

			
--- a/documents/DYCOS/mystyle.sty
+++ b/documents/DYCOS/mystyle.sty
@@ -8,3 +8,12 @@
 
				 \def\nodes{\ensuremath{\mathcal{N}_t}}
			
 
				 \def\labeledNodes{\ensuremath{\mathcal{T}_t}}
			
 
				 \DeclareUnicodeCharacter{00A0}{~}
			
 
				+
			
 
				+\theoremstyle{definition}
			
 
				+\renewtheorem{definition}{Definition}
			
 
				+
			
 
				+\def\A{\ensuremath{\mathcal{A}}}
			
 
				+\def\G{\ensuremath{\mathcal{G}}}
			
 
				+\def\L{\ensuremath{\mathcal{L}}}
			
 
				+\def\N{\ensuremath{\mathcal{N}}}
			
 
				+\def\T{\ensuremath{\mathcal{T}}}