Kollaboratives Filtern

Die Anwendung von kollaborativem Filtern erfolgt meistens für sehr große Datenmengen. Kollaboratives Filtern wird für die verschiedensten Bereiche angewandt wie z.B. im Finanzdienstleistungssektor zur Integration finanzieller Quellen oder in Anwendungen im eCommerce und Web 2.0. Dieser Artikel beschäftigt sich mit dem kollaborativen Filtern für Benutzerdaten, auch wenn manche Methoden und Ansätze auf andere Bereiche übertragen werden können.

Das Ziel der Methode ist eine automatische Vorhersage (Filtern) von Benutzerinteressen. Zu diesem Zweck werden Informationen über das Verhalten und Vorlieben von möglichst vielen Nutzern gesammelt (Kollaboration). Die zugrunde liegende Annahme von kollaborativem Filtern ist, dass jemand der sich für etwas (z.B. eine Fernsehsendung) in der Vergangenheit interessiert hat, sich auch in der Zukunft dafür interessieren wird. Durch kollaboratives Filtern kann für das Fernsehprogramm eine Vorhersage gemacht werden, welche Fernsehsendung einem Zuschauer gefallen könnte. Der Output wäre eine Liste mit möglichen favorisierten Fernsehsendungen. Es gilt zu beachten, dass diese Vorhersage für jeden einzelnen Zuschauer individuell gemacht wird. Die Datengrundlage zur Vorhersage wird von der Gesamtheit der Nutzer gesammelt. Hier unterscheidet sich das kollaborative Filtern von einfacheren Methoden, bei denen ein unspezifischer Mittelwert errechnet wird.

Ein spezifisches Problem kollaborativer Filter besteht in ihrer Latenzzeit: Ein neuer Nutzer tritt mit einem leeren Benutzerprofil in das System ein. Da seine Interessen noch nicht bekannt sind, kann er zu Beginn keine sinnvollen Empfehlungen erhalten. Gleiches gilt für neu in das System eintretende Elemente (z. B. Produkte in einem Online-Shop). Sie weisen keine quantifizierbare Ähnlichkeit mit anderen Elementen auf und können damit nicht sinnvoll empfohlen werden. Es handelt sich bei kollaborativen Filtern also um lernende Systeme und damit um eine Form der künstlichen Intelligenz.

Kollaboratives Filtern läuft meistens in zwei Schritten ab.

Suche nach Nutzern, die das gleiche Verhaltensmuster wie der aktive Nutzer haben. (= der Nutzer für den die Vorhersage getroffen wird)
Verwendung der Verhaltensmuster um eine Vorhersage für den aktiven Nutzer zu treffen.

Alternativ dazu gibt es das artikelbasierte kollaborative Filtern, das durch Amazon.com bekannt wurde („Das könnte Sie auch interessieren.“) und erstmals von Vucetic und Obradovic im Jahre 2000 vorgestellt wurde.

Erstellen einer Ähnlichkeitsmatrix zur Bestimmung von Beziehungen zwischen Artikeln.
Aus der Matrix werden die Vorlieben des aktiven Nutzers abgeleitet.

Weitere Formen des Kollaborativen Filterns können auf impliziter Beobachtung der Nutzerverhalten beruhen. Bei diesen Formen des Filterns wird das Verhalten des einzelnen Benutzers mit dem Verhalten aller anderen Benutzer verglichen (Welche Musik haben Sie gehört? Welche Produkte haben Sie gekauft?). Diese Daten werden genutzt um das zukünftige Verhalten des Nutzers vorhersagen zu können. Dabei ist es nicht sinnvoll, einem Nutzer ein bestimmtes Musikstück anzubieten, wenn er durch sein Verhalten deutlich gemacht hat, dass er es bereits besitzt. Ebenso ist es nicht sinnvoll, einem Nutzer weitere Paris-Reiseführer anzubieten, wenn er bereits einen Reiseführer für diese Stadt besitzt.

Im heutigen Informationszeitalter stellen sich diese und ähnliche Technologien als äußerst hilfreich für die Produktauswahl heraus, gerade wenn bestimmte Produktgruppen (z.B. Musik, Filme, Bücher, Nachrichten, Internetseiten) so groß geworden sind, dass einzelne Personen das gesamte Angebot nicht überblicken können.

Aus: Wikipedia

Kollaboratives Filtern