Articles

Latent Semantisk Analyse: Enkel Definisjon, Metode

Del på

Statistikk Definisjoner> Latent Semantisk Analyse

Hva Er Latent Semantisk Analyse?

Latent Semantisk Analyse (Lsa) er en måte å analysere hvordan ord og grupper av ord brukes i tekster. Det brukes til å svare på spørsmål som:

  • Hva er den underliggende betydningen av teksten?
  • Hvilken effekt har ord på betydningen av passasjer?
  • hvordan relaterer den gjennomsnittlige betydningen av ord i et avsnitt til den generelle betydningen av et avsnitt?

Språk (spesielt engelsk) er komplekst, delvis fordi ord har flere betydninger. For eksempel kan ordet » hot «bety en rekke ting, inkludert «nær kokende», «sexy» eller » priset for å selge.»Mye avhenger av konteksten du bruker den i (dvs.den omkringliggende passasjen). «Hot» i en tekst kan ha en helt annen betydning i en annen, så å finne relaterte ord, passasjer eller hele tekster er ingen enkel oppgave. LSA forsøker å gjøre dette ved å kartlegge ord til begreper som «temperatur», » sex «eller» virksomhet.»Ordene og de koblede konseptene sammenlignes deretter for å komme til den virkelige betydningen av tekst.Latent semantisk analyse kalles også latent semantisk indeksering (lsi).


Metode

latent semantisk analyse

en matrise hvor hvert element viser hvor ofte ord blir brukt.vises i en tekst.

LSA bruker en avansert matrise algebra metode kalt Singular Verdi Dekomponering (SVD) for å faktorisere matriser . SVD er vanligvis upraktisk å utføre for hånd for noe mer enn et lite utvalg av tekst. Faktisk ble det bare populært etter 1980-tallet da datamaskiner kom på scenen for å håndtere komplekse algoritmer.
den grunnleggende metoden er:

  • teksten konverteres til matriser for å representere passasjer. Hver celle i matrisen inneholder antall ganger et bestemt ord vises i en bestemt passasje.
  • matrisen er faktorisert slik at hver passasje er representert som en vektor. Verdien for hver vektor er summen av vektorer som representerer komponentordene.Dot-produkter, cosinus eller lignende beregninger brukes til å representere likheter mellom ord og passasjer.

teorien bak algoritmene som brukes I SVD er utenfor rammen av denne artikkelen, men du kan lese mer om Det i Denne University Of Victoria artikkelen.


Thomo, A. Latent Semantisk Analyse (Opplæring). Hentet 28. Mai 2020 fra: https://www.engr.uvic.ca/~seng474/svd.pdf

SITERE Dette SOM:
Stephanie Glen. «Latent Semantisk Analyse: Enkel Definisjon, Metode» Fra StatisticsHowTo.com Elementær Statistikk for resten av oss! https://www.statisticshowto.com/latent-semantic-analysis/

——————————————————————————

Trenger du hjelp med lekser eller test spørsmål? Med Chegg Study kan du få trinnvise løsninger på dine spørsmål fra en ekspert på feltet. Din første 30 minutter med En Chegg veileder er gratis!