i en tid med digital verden, ser vi anbefaling i alle områder vejr det er e-handel hjemmeside eller Underholdning hjemmeside eller sociale netværkssider. Anbefaling giver ikke kun brugeren sit anbefalede valg (baseret på tidligere aktivitet), men det fortæller også om brugeradfærd (sentimental analyse eller emotion AI).
så lad os først forstå, hvilken anbefaling der er. Det er dybest set anbefale element til brugeren baseret på sin tidligere søgning/aktivitet.
Figur 1 fortæller Amasons anbefaling baseret på tidligere gennemsøgningshistorik og tidligere søgninger. Så vi kan sige, at anbefaling dybest set forudsiger fremtidig adfærd baseret på tidligere adfærd. Der er to typer tilgange, der bruges i anbefalingssystem
1 – indholdsbaseret filtrering
2 – samarbejdsbaseret filtrering
indholdsbaseret filtrering-
det er baseret på ideen om at anbefale varen til bruger K, som ligner tidligere vare højt vurderet af K. grundlæggende koncept i indholdsbaseret filtrering er TF-IDF (Term frekvens — invers dokumentfrekvens), som bruges til at bestemme vigtigheden af dokument/ord/film osv. Indholdsbaseret filtrering viser gennemsigtighed i anbefalingen, men i modsætning til samarbejdsfiltrering kan den ikke arbejde effektivt for store data
samarbejdsbaseret filtrering
det er baseret på ideen om, at folk, der deler den samme interesse for bestemte slags elementer, også vil dele den samme interesse for en anden slags elementer i modsætning til indholdsbaseret, som dybest set er afhængige af metadata, mens det beskæftiger sig med aktivitet i det virkelige liv. Denne type filtrering er fleksibel til det meste af domænet (eller vi kan sige, at det er domænefrit), men på grund af koldstartproblem, data sparsity (som blev håndteret af matriksfaktorisering) denne type algoritme står over for et tilbageslag i nogle scenarier.
matriksfaktorisering kommer i rampelyset efter netfleks-konkurrencen (2006), da Netfleks annoncerede en præmiepenge på $1 million til dem, der vil forbedre dens rod gennemsnitlige kvadratpræstation med 10%. Et træningsdatasæt på 100.480.507 vurderinger, som 480.189 brugere gav til 17.770 film.
matriksfaktorisering er den samarbejdsbaserede filtreringsmetode, hvor matricen m*n nedbrydes til m*k og k*n . Det er dybest set anvendes til beregning af komplekse matrice drift. Opdeling af matrice er sådan, at hvis vi multiplicerer faktoriseret matrice, får vi original matrice som vist i figur 2. Det bruges til at opdage latente funktioner mellem to enheder (kan bruges til mere end to enheder, men dette vil komme under tensorfaktorisering)