Im Zeitalter der digitalen Welt sehen wir Empfehlungen in jedem Bereich, ob es sich um E-Commerce-Websites, Unterhaltungswebsites oder Websites sozialer Netzwerke handelt. Empfehlung gibt dem Benutzer nicht nur die empfohlene Auswahl (basierend auf früheren Aktivitäten), sondern auch Informationen zum Benutzerverhalten (sentimentale Analyse oder Emotionserkennung).
Also lasst uns zuerst verstehen, was Empfehlung ist. Grundsätzlich empfiehlt es dem Benutzer ein Element basierend auf seiner früheren Suche / Aktivität.
Abbildung 1 zeigt die Empfehlung von Amazon basierend auf dem bisherigen Browserverlauf und den vergangenen Suchvorgängen an. Wir können also sagen, dass Empfehlung im Grunde genommen zukünftiges Verhalten basierend auf vergangenem Verhalten vorhersagt. Es gibt zwei Arten von Ansätzen, die im Empfehlungssystem verwendet werden
1- Inhaltsbasierte Filterung
2- Inhaltsbasierte Filterung
Inhaltsbasierte Filterung-
Es basiert auf der Idee, den Artikel dem Benutzer K zu empfehlen, der dem vorherigen Artikel ähnelt, der von K hoch bewertet wurde. Inhaltsbasierte Filterung zeigt Transparenz in der Empfehlung, aber im Gegensatz zur kollaborativen Filterung kann sie nicht effizient für große Datenmengen arbeiten
Kollaborative Filterung
Es basiert auf der Idee, dass Menschen, die das gleiche Interesse an bestimmten teilen Art von Gegenständen wird auch das gleiche Interesse an einer anderen Art von Gegenständen teilen, im Gegensatz zu Inhalten, die im Grunde auf Metadaten beruhen, während sie sich mit realen Aktivitäten befassen. Diese Art der Filterung ist für den größten Teil der Domäne flexibel (oder wir können sagen, dass sie domänenfrei ist), aber aufgrund des Kaltstartproblems, der Datensparsamkeit (die durch Matrixfaktorisierung gehandhabt wurde), steht diese Art von Algorithmus in einigen Szenarien vor einem Rückschlag.
Matrixfaktorisierung
Die Matrixfaktorisierung steht nach dem Netflix-Wettbewerb (2006) im Rampenlicht, als Netflix ein Preisgeld von 1 Million US-Dollar für diejenigen ankündigte, die die Leistung des quadratischen Mittelwerts um 10% verbessern werden. Netflix lieferte einen Trainingsdatensatz von 100.480.507 Bewertungen, die 480.189 Benutzer 17.770 Filmen gaben.
Die Matrixfaktorisierung ist die kollaborative Filtermethode, bei der die Matrix m*n in m* k und k* n zerlegt wird. Es wird grundsätzlich zur Berechnung komplexer Matrixoperationen verwendet. Division der Matrix ist so, dass, wenn wir faktorisierte Matrix multiplizieren wir ursprüngliche Matrix erhalten, wie in Abbildung 2 gezeigt. Es wird verwendet, um latente Merkmale zwischen zwei Entitäten zu entdecken (kann für mehr als zwei Entitäten verwendet werden, dies wird jedoch unter Tensorfaktorisierung fallen)