Related-Work.tex 1.6 KB

123456789101112131415161718192021222324252627282930
  1. %!TEX root = Ausarbeitung-Thoma.tex
  2. Sowohl das Problem der Knotenklassifikation, als auch das der
  3. Textklassifikation, wurde bereits in verschiedenen Kontexten. Jedoch scheien
  4. bisher entweder nur die Struktur des zugrundeliegenden Graphen oder nur
  5. Eigenschaften der Texte verwendet worden zu sein.
  6. So werden in \cite{bhagat,szummer} unter anderem Verfahren zur
  7. Knotenklassifikation beschrieben, die wie der in \cite{aggarwal2011}
  8. vorgestellte DYCOS-Algorithmus, um den es in dieser Ausarbeitung geht, auch auf
  9. Random Walks basieren.
  10. Obwohl es auch zur Textklassifikation einige Paper gibt
  11. \cite{Zhu02learningfrom,Jiang2010302}, geht doch keines davon auf den
  12. Spezialfall der Textklassifikation mit einem zugrundeliegenden Graphen ein.
  13. Die vorgestellten Methoden zur Textklassifikation variieren außerdem sehr
  14. stark. Es gibt Verfahren, die auf dem bag-of-words-Modell basieren
  15. \cite{Ko:2012:STW:2348283.2348453} wie es auch im DYCOS-Algorithmus verwendet
  16. wird. Aber es gibt auch Verfahren, die auf dem Expectation-Maximization-
  17. Algorithmus basieren \cite{Nigam99textclassification} oder Support Vector
  18. Machines nutzen \cite{Joachims98textcategorization}.
  19. Es wäre also gut Vorstellbar, die Art und Weise wie die Texte in die
  20. Klassifikation des DYCOS-Algorithmus einfließen zu variieren. Allerdings ist
  21. dabei darauf hinzuweisen, dass die im Folgeden vorgestellte Verwendung der
  22. Texte sowohl einfach zu implementieren ist und nur lineare Vorverarbeitungszeit
  23. in Anzahl der Wörter des Textes hat, als auch es erlaubt einzelne Knoten zu
  24. klassifizieren, wobei der Graph nur lokal um den zu klassifizerenden Knoten
  25. betrachten werden muss.