%!s(int64=12) %!d(string=hai) anos · e03e13a284
--- a/documents/DYCOS/DYCOS-Algorithmus.tex
+++ b/documents/DYCOS/DYCOS-Algorithmus.tex
@@ -3,9 +3,9 @@ DYCOS (\underline{DY}namic \underline{C}lassification
 
																 algorithm with c\underline{O}ntent and \underline{S}tructure) ist ein 
															
 
																 Knotenklassifizierungsalgorithmus, der Ursprünglich in \cite{aggarwal2011} vorgestellt 
															
 
																 wurde. Er klassifiziert Knoten, indem mehrfach Random Walks startend
															
 
																-bei dem zu klassifizierenden Knoten gemacht werden und die Labels
															
 
																+bei dem zu klassifizierenden Knoten $v$ gemacht werden und die Labels
															
 
																 der besuchten Knoten gezählt werden. Das Label, das am häufigsten
															
 
																-vorgekommen ist, wird als Label gewählt.
															
 
																+vorgekommen ist, wird als Label für $v$ gewählt.
															
 
																 DYCOS nutzt also die sog. Homophilie, d.~h. die Eigenschaft, dass
															
 
																 Knoten, die nur wenige Hops von einander entfernt sind, häufig auch
															
 
																 ähnlich sind \cite{bhagat}.
															
@@ -17,7 +17,7 @@ stehenden Texte.
 
																 Für diese Erweiterung wird zuerst wird Vokabular $W_t$ bestimmt, das 
															
 
																 charakteristisch für eine Knotengruppe ist. Wie das gemacht werden kann
															
 
																 und warum nicht einfach jedes Wort in das Vokabular aufgenommen wird,
															
 
																-wird in Abschnitt~\ref{sec:vokabularbestimmung} erläutert.\\
															
 
																+wird in \cref{sec:vokabularbestimmung} erläutert.\\
															
 
																 Nach der Bestimmung des Vokabulars wird für 
															
 
																 jedes Wort im Vokabular ein Wortknoten zum Graphen hinzugefügt. Alle
															
 
																 Knoten, die der Graph zuvor hatte, werden nun \enquote{Strukturknoten}
															
@@ -53,17 +53,21 @@ tatsächlich die Grapherweiterung:
 
																     Dann heißt das zufällige wechseln des aktuell betrachteten
															
 
																     Knoten $v \in V_t$ zu einem benachbartem Knoten $w \in W_t$
															
 
																-    und weiter zu Nachbar von $v' \in V_t$ von $w$
															
 
																-    ein \textbf{inhaltlicher Mehrfachsprung}. $v'$ ist also genau
															
 
																-    einen Sprung über einen Wortknoten $w$ von $v$ entfernt.
															
 
																+    und weiter zu einem zufälligem Nachbar $v' \in V_t$ von $w$
															
 
																+    ein \textbf{inhaltlicher Mehrfachsprung}.
															
 
																 \end{definition}
															
 
																+Jeder inhaltliche Mehrfachsprung beginnt und endet also in einem Strukturknoten,
															
 
																+springt über einen Wortknoten und ist ein Pfad der Länge~2.
															
 
																+
															
 
																+Bevor der DYCOS-Algorithmus im Detail erklärt wird, sei noch auf eine
															
 
																+Besonderheit hingewiesen:
															
 
																 Der DYCOS-Algorithmus betrachtet die Texte, die einem Knoten 
															
 
																-zugeornet sind, als eine
															
 
																-Multimenge von Wörtern. Das heißt, zum einen wird nicht auf die
															
 
																-Reihenfolge der Wörter geachtet, zum anderen wird bei Texten
															
 
																-eines Knotens nicht zwischen verschiedenen Texten unterschieden.
															
 
																-Jedoch wird die Anzahl der Vorkommen jedes Wortes berücksichtigt.
															
 
																+zugeornet sind, als eine Multimenge von Wörtern. Das heißt, zum einen 
															
 
																+wird nicht auf die Reihenfolge der Wörter geachtet, zum anderen wird 
															
 
																+bei Texten eines Knotens nicht zwischen verschiedenen 
															
 
																+Texten unterschieden. Jedoch wird die Anzahl der Vorkommen 
															
 
																+jedes Wortes berücksichtigt.
															
 
																 \subsection{Datenstrukturen}
															
 
																 Zusätzlich zu dem gerichteten Graphen $G_t = (V_t, E_t, V_{L,t})$ 
															
@@ -94,27 +98,32 @@ verwaltet der DYCOS-Algorithmus zwei weitere Datenstrukturen:
 
																 \subsection{Der Algorithmus}
															
 
																 Der DYCOS-Algorithmus verwendet nun für jeden Knoten der gelabelt wird
															
 
																 $r$ Random Walks der Länge $l$, wobei mit einer Wahrscheinlichkeit 
															
 
																-$p_S$ ein struktureller $l$-Sprung und mit einer Wahrscheinlichkeit
															
 
																-von $(1-p_S)$ ein inhaltlicher $l$-Mehrfachsprung gemacht wird.
															
 
																+$p_S$ ein struktureller Sprung und mit einer Wahrscheinlichkeit
															
 
																+von $(1-p_S)$ ein inhaltlicher Mehrfachsprung gemacht wird. Dieser 
															
 
																+Parameter gibt an, wie wichtig die Struktur des Graphen im Verhältnis
															
 
																+zu den textuellen Inhalten ist. Bei $p_S = 0$ werden ausschließlich
															
 
																+die Texte betrachtet, bei $p_S = 1$ ausschließlich die Struktur des
															
 
																+Graphen.
															
 
																 Die Vokabularbestimmung kann zu jedem Zeitpunkt $t$ durchgeführt 
															
 
																 werden, muss es aber nicht.
															
 
																-Im Folgenden werde ich den DYCOS-Algorithmus als Pseudocode vorstellen.
															
 
																-Dafür benötigt man die beiden Hilfsfunktionen für den strukturellen
															
 
																-Sprung sowie den inhaltlichen Mehrfachsprung:
															
 
																+In \cref{alg:DYCOS} wurde der DYCOS-Algorithmus als 
															
 
																+Pseudocode vorgestellt. Dafür werden die beiden Hilfsfunktionen 
															
 
																+für den strukturellen Sprung sowie den inhaltlichen Mehrfachsprung
															
 
																+benötigt.
															
 
																-\begin{algorithm}[H]
															
 
																+\begin{algorithm}
															
 
																     \begin{algorithmic}[1]
															
 
																-        \Require \\$\G_t = (\N_t, \A_t, \T_t)$ (Netzwerk),\\
															
 
																+        \Require \\$G_t = (V_t, E_t, V_{L,t})$ (Netzwerk),\\
															
 
																                  $r$ (Anzahl der Random Walks),\\
															
 
																                  $l$ (Länge eines Random Walks),\\
															
 
																                  $p_s$ (Wahrscheinlichkeit eines strukturellen Sprungs),\\
															
 
																-                 $q$ (Anzahl der betrachteten Knoten nach der Aggregatanalyse)
															
 
																-        \Ensure  Klassifikation von $\N_t \setminus \T_t$\\
															
 
																+                 $q$ (Anzahl der betrachteten Knoten in der Clusteranalyse)
															
 
																+        \Ensure  Klassifikation von $V_t \setminus V_{L,t}$\\
															
 
																         \\
															
 
																-        \ForAll{Knoten $v$ in $\N_t \setminus \T_t$}
															
 
																+        \ForAll{Knoten $v$ in $V_t \setminus V_{L,t}$}
															
 
																             \State $d \gets $ defaultdict
															
 
																             \For{$i$ von $1$ bis $r$}
															
 
																                 \State $w \gets v$
															
@@ -140,7 +149,7 @@ Sprung sowie den inhaltlichen Mehrfachsprung:
 
																             \State $label \gets \Call{Random}{M_H}$ 
															
 
																             \State $v.\Call{AddLabel}{label}$ \Comment{und weise dieses $v$ zu}
															
 
																         \EndFor
															
 
																-        \State \Return Labels für $\N_t \setminus \T_t$
															
 
																+        \State \Return Labels für $V_t \setminus V_{L,t}$
															
 
																     \end{algorithmic}
															
 
																 \caption{DYCOS-Algorithmus}
															
 
																 \label{alg:DYCOS}
															
--- a/documents/DYCOS/DYCOS.pdf
+++ b/documents/DYCOS/DYCOS.pdf
--- a/documents/DYCOS/DYCOS.tex
+++ b/documents/DYCOS/DYCOS.tex
@@ -24,7 +24,11 @@
 
																 \usepackage{csquotes}

															
 
																 \usepackage[colorinlistoftodos]{todonotes}

															
 
																 \usepackage{subfig}         % multiple figures in one

															
 
																+\usepackage{caption}

															
 
																 \usepackage{tikz}

															
 
																+\usepackage{enumitem}

															
 
																+\usepackage[german,nameinlink]{cleveref}

															
 
																+\allowdisplaybreaks

															
 
																 \usetikzlibrary{backgrounds}

															
 
																 \usepackage{mystyle}

															
@@ -32,7 +36,7 @@
 
																 \setcounter{secnumdepth}{3}

															
 
																 \hypersetup{ 

															
 
																-  pdftitle    = {Über die Klassifizierung von Knoten in dynamischen Netzwerken mit Inhalt},

															
 
																+  pdftitle    = {Über die Klassifizierung von Knoten in dynamischen Netzwerken mit textuellen Inhalten},

															
 
																   pdfauthor   = {Martin Thoma}, 

															
 
																   pdfkeywords = {DYCOS}

															
 
																 }

															
--- a/documents/DYCOS/Sprungtypen.tex
+++ b/documents/DYCOS/Sprungtypen.tex
@@ -1,36 +1,52 @@
 
																 \subsection{Sprungtypen}
															
 
																 Die beiden bereits definierten Sprungtypen, der strukturelle Sprung
															
 
																 sowie der inhaltliche Mehrfachsprung werden im folgenden erklärt.
															
 
																-
															
 
																+\goodbreak
															
 
																 Der strukturelle Sprung entspricht einer zufälligen Wahl eines 
															
 
																-Nachbarknotens. Hier gibt es nichts besonderes zu beachten.
															
 
																+Nachbarknotens, wie es in \cref{alg:DYCOS-structural-hop}
															
 
																+gezeigt wird.
															
 
																+\begin{algorithm}[H]
															
 
																+    \begin{algorithmic}[1]
															
 
																+        \Procedure{SturkturellerSprung}{Knoten $v$, Anzahl $q$}
															
 
																+            \State $n \gets v.\Call{NeighborCount}{}$ \Comment{Wähle aus der Liste der Nachbarknoten}
															
 
																+            \State $r \gets \Call{RandomInt}{0, n-1}$ \Comment{einen zufällig aus}
															
 
																+            \State $v \gets v.\Call{Next}{r}$ \Comment{Gehe zu diesem Knoten}
															
 
																+            \State \Return $v$
															
 
																+        \EndProcedure
															
 
																+    \end{algorithmic}
															
 
																+\caption{Struktureller Sprung}
															
 
																+\label{alg:DYCOS-structural-hop}
															
 
																+\end{algorithm}
															
 
																-Bei inhaltlichen Mehrfachsprüngen sieht die Sache schon anders aus:
															
 
																-Es ist nicht sinnvoll, direkt von einem strukturellem Knoten 
															
 
																-$v \in \N_t$ zu einem mit $v$ verbundenen Wortknoten $w$ zu springen
															
 
																+Bei inhaltlichen Mehrfachsprüngen ist jedoch nicht sinnvoll so direkt
															
 
																+nach der Definition vorzugehen,  also
															
 
																+direkt von einem strukturellem Knoten 
															
 
																+$v \in V_t$ zu einem mit $v$ verbundenen Wortknoten $w \in W_t$ zu springen
															
 
																 und von diesem wieder zu einem verbundenem strutkurellem Knoten 
															
 
																-$v' \in \N_t$. Würde man dies machen, wäre zu befürchten, dass
															
 
																+$v' \in V_t$. Würde man dies machen, wäre zu befürchten, dass
															
 
																 aufgrund von Homonymen die Qualität der Klassifizierung verringert
															
 
																 wird. So hat \enquote{Brücke} im Deutschen viele Bedeutungen.
															
 
																 Gemeint sein können z.~B. das Bauwerk, das Entwurfsmuster der
															
 
																 objektorientierten Programmierung oder ein Teil des Gehirns.
															
 
																 Deshalb wird für jeden Knoten $v$, von dem aus man einen inhaltlichen
															
 
																-Mehrfachsprung machen will folgendes vorgehen gewählt:
															
 
																-\begin{enumerate}
															
 
																-    \item Gehe alle in $v$ startenden Random Walks der Länge 2 durch
															
 
																+Mehrfachsprung machen will folgendes Clusteranalyse durchgeführt:
															
 
																+\begin{enumerate}[label=C\arabic*),ref=C\arabic*]
															
 
																+    \item[C1] Gehe alle in $v$ startenden Random Walks der Länge 2 durch
															
 
																           und erstelle eine Liste $L$, der erreichbaren Knoten $v'$. Speichere
															
 
																           außerdem, durch wie viele Pfade diese Knoten $v'$ jeweils erreichbar sind.
															
 
																-    \item Betrachte im folgenden nur die Top-$q$ Knoten, wobei $q \in \mathbb{N}$
															
 
																-          eine zu wählende Konstante des Algorithmus ist.
															
 
																-    \item Wähle mit Wahrscheinlichkeit $\frac{\Call{Anzahl}{v'}}{\sum_{w \in L} \Call{Anzahl}{v'}}$
															
 
																+    \item[C2] Betrachte im folgenden nur die Top-$q$ Knoten, wobei $q \in \mathbb{N}$
															
 
																+          eine zu wählende Konstante des Algorithmus ist. \label{list:aggregate.2}
															
 
																+    \item[C3] Wähle mit Wahrscheinlichkeit $\frac{\Call{Anzahl}{v'}}{\sum_{w \in L} \Call{Anzahl}{v'}}$
															
 
																           den Knoten $v'$ als Ziel des Mehrfachsprungs.
															
 
																 \end{enumerate}
															
 
																 Konkret könnte also ein Inhaltlicher Mehrfachsprung sowie wie in
															
 
																-Algorithmus~\ref{alg:DYCOS-content-multihop} beschrieben umgesetz werden.
															
 
																+\cref{alg:DYCOS-content-multihop} beschrieben umgesetz werden.
															
 
																-\begin{algorithm}[H]
															
 
																+\begin{algorithm}
															
 
																+  \caption{Inhaltlicher Mehrfachsprung}
															
 
																+  \label{alg:DYCOS-content-multihop}
															
 
																     \begin{algorithmic}[1]
															
 
																         \Procedure{InhaltlicherMehrfachsprung}{Knoten $v$}
															
 
																             \State \textit{//Alle Knoten bestimmen, die von $v$ aus über Pfade der Länge 2 erreichbar sind}
															
@@ -43,9 +59,9 @@ Algorithmus~\ref{alg:DYCOS-content-multihop} beschrieben umgesetz werden.
 
																                 \EndFor
															
 
																             \EndFor
															
 
																-            \State \textit{//Im folgenden gehe ich davon aus, dass ich über Indizes wahlfrei auf Elemente }
															
 
																-            \State \textit{//aus $M_H$ zugreifen kann. Dies muss bei der konkreten Wahl der Datenstruktur}
															
 
																-            \State \textit{//berücksichtigt werden}
															
 
																+            \State \textit{//Im folgenden wird davon ausgegangen, dass man über Indizes wahlfrei auf}
															
 
																+            \State \textit{//Elemente aus $M_H$ zugreifen kann. Dies muss bei der konkreten Wahl}
															
 
																+            \State \textit{//der Datenstruktur berücksichtigt werden.}
															
 
																             \State $M_H \gets \Call{max}{reachableNodes, q}$ \Comment{Also: $|M_H| = q$, falls $|reachableNodes|\geq q$}
															
 
																             \State \textit{//Generate dictionary with relative frequencies}
															
 
																             \State $s \gets 0$
															
@@ -56,12 +72,13 @@ Algorithmus~\ref{alg:DYCOS-content-multihop} beschrieben umgesetz werden.
 
																             \ForAll{Knoten $x$ in $M_H$}
															
 
																                 \State $relativeFrequency \gets \frac{reachableNodes[x]}{s}$
															
 
																             \EndFor
															
 
																-
															
 
																+            \State \textit{//Wähle Knoten $i$ mit einer Wahrscheinlichkeit entsprechend seiner relativen}
															
 
																+            \State \textit{//Häufigkeit an Pfaden der Länge 2}
															
 
																             \State $random \gets \Call{random}{0, 1}$
															
 
																-            \State $s \gets 0$
															
 
																+            \State $r \gets 0.0$
															
 
																             \State $i \gets 0$
															
 
																             \While{$s < random$}
															
 
																-                \State $s \gets s + relativeFrequency[i]$
															
 
																+                \State $r \gets r + relativeFrequency[i]$
															
 
																                 \State $i \gets i + 1$
															
 
																             \EndWhile
															
@@ -69,19 +86,4 @@ Algorithmus~\ref{alg:DYCOS-content-multihop} beschrieben umgesetz werden.
 
																             \State \Return $v$
															
 
																         \EndProcedure
															
 
																     \end{algorithmic}
															
 
																-\caption{Inhaltlicher Mehrfachsprung}
															
 
																-\label{alg:DYCOS-content-multihop}
															
 
																-\end{algorithm}
															
 
																-
															
 
																-\begin{algorithm}[H]
															
 
																-    \begin{algorithmic}[1]
															
 
																-        \Procedure{SturkturellerSprung}{Knoten $v$, Anzahl $q$}
															
 
																-            \State $n \gets v.\Call{NeighborCount}{}$ \Comment{Wähle aus der Liste der Nachbarknoten}
															
 
																-            \State $r \gets \Call{RandomInt}{0, n-1}$ \Comment{einen zufällig aus}
															
 
																-            \State $v \gets v.\Call{Next}{r}$ \Comment{Gehe zu diesem Knoten}
															
 
																-            \State \Return $v$
															
 
																-        \EndProcedure
															
 
																-    \end{algorithmic}
															
 
																-\caption{Struktureller Sprung}
															
 
																-\label{alg:DYCOS-structural-hop}
															
 
																 \end{algorithm}
															
--- a/documents/DYCOS/Vokabularbestimmung.tex
+++ b/documents/DYCOS/Vokabularbestimmung.tex
@@ -21,27 +21,27 @@ In diesem Fall ist $G(w)=0$ nicht möglich, da zur Vokabularbestimmung
 
																 nur Wörter betrachtet werden, die auch vorkommen.
															
 
																 Ein Vorschlag, wie die Vokabularbestimmung implementiert werden kann,
															
 
																-ist als Pseudocode mit Algorithmus~\ref{alg:vokabularbestimmung}
															
 
																+ist als Pseudocode mit \cref{alg:vokabularbestimmung}
															
 
																 gegeben. Dieser Algorithmus benötigt neben dem Speicher für den
															
 
																 Graphen, die Texte sowie die $m$ Vokabeln noch $\mathcal{O}(|\text{Verschiedene Wörter in } S_t| \cdot (|\L_t| + 1))$
															
 
																 Speicher. Die Average-Case Zeitkomplexität beträgt 
															
 
																 $\mathcal{O}(|\text{Wörter in } S_t|)$, wobei dazu die Vereinigung
															
 
																 von Mengen $M,N$ in $\mathcal{O}(\min{|M|, |N|})$ sein muss.
															
 
																-\begin{algorithm}[H]
															
 
																+\begin{algorithm}
															
 
																     \begin{algorithmic}[1]
															
 
																         \Require \\
															
 
																-                 $\T_t$ (Knoten mit Labels),\\
															
 
																+                 $V_{L,t}$ (Knoten mit Labels),\\
															
 
																                  $\L_t$ (Labels),\\
															
 
																-                 $f:\T_t \rightarrow \L_t$ (Label-Funktion),\\
															
 
																+                 $f:V_{L,t} \rightarrow \L_t$ (Label-Funktion),\\
															
 
																                  $m$ (Gewünschte Vokabulargröße)
															
 
																         \Ensure  $\M_t$ (Vokabular)\\
															
 
																-        \State $S_t \gets \Call{Sample}{\T_t}$ \Comment{Wähle eine Teilmenge $S_t \subseteq \T_t$ aus}
															
 
																+        \State $S_t \gets \Call{Sample}{V_{L,t}}$ \Comment{Wähle eine Teilmenge $S_t \subseteq V_{L,t}$ aus}
															
 
																         \State $\M_t \gets \bigcup_{v \in S_t} \Call{getTextAsSet}{v}$ \Comment{Menge aller Wörter}
															
 
																         \State $cLabelWords \gets (|\L_t|+1) \times |\M_t|$-Array, mit 0en initialisert\\
															
 
																-        \ForAll{$v \in \T_t$} \Comment{Gehe jeden Text Wort für Wort durch}
															
 
																+        \ForAll{$v \in V_{L,t}$} \Comment{Gehe jeden Text Wort für Wort durch}
															
 
																             \State $i \gets \Call{getLabel}{v}$
															
 
																             \ForAll{$(word, occurences) \in \Call{getTextAsMultiset}{v}$}
															
 
																                 \State $cLabelWords[i][word] \gets cLabelWords[i][word] + occurences$
															
--- a/documents/DYCOS/abstract.tex
+++ b/documents/DYCOS/abstract.tex
@@ -1,5 +1,4 @@
 
																-In dieser Arbeit wird der DYCOS-Algorithmus, wie ihn Charu Aggarwal
															
 
																-und Nan Li in \cite{aggarwal2011} vorgestellt haben, erklärt.
															
 
																+In dieser Arbeit wird der DYCOS-Algorithmus, wie er in \cite{aggarwal2011} vorgestellt wurde, erklärt.
															
 
																 Er klassifiziert automatisch Knoten in 
															
 
																 Netzwerken, die bereits teilweise mit Labels versehen sind. Zur 
															
 
																 Klassifizierung kann er textuelle Informationen, die den Knoten 
															
--- a/documents/DYCOS/literatur.bib
+++ b/documents/DYCOS/literatur.bib
@@ -6,26 +6,24 @@
 
																   title       = {A Scalable Multiclass Algorithm for Node Classification},

															
 
																   version     = {1},

															
 
																   date        = {2011-12-19},

															
 
																+  year        = {2011},

															
 
																   eprinttype  = {arxiv},

															
 
																   eprintclass = {cs.LG, cs.GT},

															
 
																   eprint      = {http://arxiv.org/abs/1112.4344v1}

															
 
																 }

															
 
																 @inproceedings{aggarwal2011,

															
 
																-  author    = {Charu C. Aggarwal and

															
 
																-               Nan Li},

															
 
																+  author    = {Charu C. Aggarwal AND Nan Li},

															
 
																   title     = {On Node Classification in Dynamic Content-based Networks},

															
 
																   booktitle = {SDM},

															
 
																   year      = {2011},

															
 
																   pages     = {355-366},

															
 
																   ee        = {http://siam.omnibooksonline.com/2011datamining/data/papers/033.pdf\#page=1},

															
 
																-  crossref  = {aggarwal2011},

															
 
																   bibsource = {DBLP, http://dblp.uni-trier.de}

															
 
																 }

															
 
																 @book{DBLP:series/ads/2010-40,

															
 
																-  editor    = {Charu C. Aggarwal and

															
 
																-               Haixun Wang},

															
 
																+  editor    = {Charu C. Aggarwal AND Haixun Wang},

															
 
																   title     = {Managing and Mining Graph Data},

															
 
																   booktitle = {Managing and Mining Graph Data},

															
 
																   publisher = {Springer},

															
@@ -38,9 +36,7 @@
 
																 }

															
 
																 @inproceedings{DBLP:conf/kdd/BhagatCR07,

															
 
																-  author    = {Smriti Bhagat and

															
 
																-               Graham Cormode and

															
 
																-               Irina Rozenbaum},

															
 
																+  author    = {Smriti Bhagat AND Graham Cormode AND Irina Rozenbaum},

															
 
																   title     = {Applying Link-Based Classification to Label Blogs},

															
 
																   booktitle = {WebKDD/SNA-KDD},

															
 
																   year      = {2007},

															
@@ -50,13 +46,13 @@
 
																   bibsource = {DBLP, http://dblp.uni-trier.de}

															
 
																 }

															
 
																 @proceedings{DBLP:conf/kdd/2007web,

															
 
																-  editor    = {Haizheng Zhang and

															
 
																-               Myra Spiliopoulou and

															
 
																-               Bamshad Mobasher and

															
 
																-               C. Lee Giles and

															
 
																-               Andrew McCallum and

															
 
																-               Olfa Nasraoui and

															
 
																-               Jaideep Srivastava and

															
 
																+  editor    = {Haizheng Zhang AND

															
 
																+               Myra Spiliopoulou AND

															
 
																+               Bamshad Mobasher AND

															
 
																+               C. Lee Giles AND

															
 
																+               Andrew McCallum AND

															
 
																+               Olfa Nasraoui AND

															
 
																+               Jaideep Srivastava AND

															
 
																                John Yen},

															
 
																   title     = {Advances in Web Mining and Web Usage Analysis, 9th International

															
 
																                Workshop on Knowledge Discovery on the Web, WebKDD 2007,

															
@@ -85,33 +81,43 @@
 
																 }

															
 
																 @article{Vitter,

															
 
																-    author = {Vitter, Jeffrey S.},

															
 
																-    title = {Random Sampling with a Reservoir},

															
 
																-    journal = {ACM Trans. Math. Softw.},

															
 
																-    volume = {11},

															
 
																-    number = {1},

															
 
																-    year = {1985},

															
 
																-    issn = {0098-3500},

															
 
																-    pages = {37--57},

															
 
																-    numpages = {21},

															
 
																-    url = {http://doi.acm.org/10.1145/3147.3165},

															
 
																-    doi = {10.1145/3147.3165},

															
 
																-    acmid = {3165},

															
 
																+    author    = {Vitter, Jeffrey S.},

															
 
																+    title     = {Random Sampling with a Reservoir},

															
 
																+    journal   = {ACM Trans. Math. Softw.},

															
 
																+    volume    = {11},

															
 
																+    number    = {1},

															
 
																+    year      = {1985},

															
 
																+    issn      = {0098-3500},

															
 
																+    pages     = {37--57},

															
 
																+    numpages  = {21},

															
 
																+    url       = {http://doi.acm.org/10.1145/3147.3165},

															
 
																+    doi       = {10.1145/3147.3165},

															
 
																+    acmid     = {3165},

															
 
																     publisher = {ACM},

															
 
																-    address = {New York, NY, USA},

															
 
																+    address   = {New York, NY, USA},

															
 
																 } 

															
 
																 @incollection{porter,

															
 
																- author = {Porter, M. F.},

															
 
																- chapter = {An Algorithm for Suffix Stripping},

															
 
																- title = {Readings in Information Retrieval},

															
 
																- editor = {Sparck Jones, Karen and Willett, Peter},

															
 
																- year = {1997},

															
 
																- isbn = {1-55860-454-5},

															
 
																- pages = {313--316},

															
 
																- numpages = {4},

															
 
																- url = {http://dl.acm.org/citation.cfm?id=275537.275705},

															
 
																- acmid = {275705},

															
 
																- publisher = {Morgan Kaufmann Publishers Inc.},

															
 
																- address = {San Francisco, CA, USA},

															
 
																+ author     = {Porter, M. F.},

															
 
																+ chapter    = {An Algorithm for Suffix Stripping},

															
 
																+ title      = {Readings in Information Retrieval},

															
 
																+ editor     = {Sparck Jones, Karen and Willett, Peter},

															
 
																+ year       = {1997},

															
 
																+ isbn       = {1-55860-454-5},

															
 
																+ pages      = {313--316},

															
 
																+ numpages   = {4},

															
 
																+ url        = {http://dl.acm.org/citation.cfm?id=275537.275705},

															
 
																+ acmid      = {275705},

															
 
																+ publisher  = {Morgan Kaufmann Publishers Inc.},

															
 
																+ address    = {San Francisco, CA, USA},

															
 
																 } 

															
 
																+

															
 
																+@incollection{szummer,

															
 
																+title       = {Partially labeled classification with Markov random walks},

															
 
																+author      = {Martin Szummer and Jaakkola, Tommi},

															
 
																+booktitle   = {Advances in Neural Information Processing Systems 14},

															
 
																+editor      = {T.G. Dietterich and S. Becker and Z. Ghahramani},

															
 
																+pages       = {945--952},

															
 
																+year        = {2001},

															
 
																+url         = {http://media.nips.cc/nipsbooks/nipspapers/paper_files/nips14/AA36.pdf},

															
 
																+}

															
--- a/documents/DYCOS/mystyle.sty
+++ b/documents/DYCOS/mystyle.sty
@@ -4,9 +4,9 @@
 
																     group-separator={\,},
															
 
																 }
															
 
																-\def\edges{\ensuremath{\mathcal{E}_t}}
															
 
																-\def\nodes{\ensuremath{\mathcal{N}_t}}
															
 
																-\def\labeledNodes{\ensuremath{\mathcal{T}_t}}
															
 
																+%\def\edges{\ensuremath{\mathcal{E}_t}}
															
 
																+%\def\nodes{\ensuremath{\mathcal{N}_t}}
															
 
																+%\def\labeledNodes{\ensuremath{\mathcal{T}_t}}
															
 
																 \DeclareUnicodeCharacter{00A0}{~}
															
 
																 \theoremstyle{definition}
															
@@ -14,13 +14,8 @@
 
																 \theoremheaderfont{\normalfont\bfseries\hspace{-\theoremindent}}
															
 
																 \renewtheorem{definition}{Definition}
															
 
																-\def\A{\ensuremath{\mathcal{A}}}
															
 
																-\def\G{\ensuremath{\mathcal{G}}}
															
 
																 \def\L{\ensuremath{\mathcal{L}}}
															
 
																 \def\M{\ensuremath{\mathcal{M}}}
															
 
																-\def\N{\ensuremath{\mathcal{N}}}
															
 
																-\def\T{\ensuremath{\mathcal{T}}}
															
 
																-\def\powerset{\ensuremath{\mathcal{P}}}
															
 
																 \renewcommand{\algorithmicrequire}{\textbf{Input:}}
															
 
																 \renewcommand{\algorithmicensure}{\textbf{Output:}}