Latentti semanttinen analyysi: yksinkertainen määritelmä, menetelmä
Statistics Definitions > latentti semanttinen analyysi
mikä on latentti semanttinen analyysi?
latentti semanttinen analyysi (LSA) on tapa analysoida, miten sanoja ja sanaryhmiä käytetään teksteissä. Sitä käytetään vastaamaan kysymyksiin, kuten:
- mikä on tekstin taustalla oleva merkitys?
- mikä vaikutus sanoilla on jakeiden merkitykseen?
- miten katkelman sanojen keskimääräinen merkitys liittyy katkelman kokonaismerkitykseen?
kieli (erityisesti englannin kieli) on monimutkainen osittain siksi, että sanoilla on useita merkityksiä. Esimerkiksi sana ” kuuma ”voi tarkoittaa monia asioita, kuten” lähellä kiehumista”,” seksikäs ”tai” hinnoiteltu myydä.”Paljon riippuu kontekstista, jossa sitä käytetään (eli ympäröivästä kulkuväylästä). ”Kuuma” yhdessä tekstissä voi olla täysin eri merkitys toisessa, joten löytää Liittyvät sanat, kohdat, tai kokonaisia tekstejä ei ole helppo tehtävä. LSA yrittää tehdä tämän kartoittamalla sanoja sellaisiin käsitteisiin kuin ”lämpötila”, ”seksi” tai ”Bisnes”.”Sanoja ja niihin liittyviä käsitteitä verrataan, jotta saadaan selville tekstin todellinen merkitys.
piilevää semanttista analyysiä kutsutaan myös latent semanttiseksi indeksoinniksi (LSI).
menetelmä
matriisi, jossa jokainen alkio näyttää kuinka usein sanat esiintyy tekstissä.
LSA käyttää kehittynyttä Matriisialgebran menetelmää nimeltä Singular Value Decomposition (SVD) matriisien factorisointiin . SVD on yleensä epäkäytännöllinen suorittaa käsin mitään muuta kuin pieni tekstinäyte. Itse asiassa se todella tuli suosittu vasta 1980-luvun jälkeen, kun tietokoneet tulivat paikalle käsittelemään monimutkaisia algoritmeja.
perusmenetelmä on:
- teksti muunnetaan matriiseiksi esittämään kohtia. Matriisin jokainen solu sisältää sen, kuinka monta kertaa tietty sana esiintyy tietyssä kohdassa.
- matriisi on factorisoitu niin, että jokainen läpivienti esitetään vektorina. Kunkin vektorin arvo on sen komponenttisanoja edustavien vektorien summa.
- Pistetuotteita, kosineja tai vastaavia mittareita käytetään kuvaamaan sanojen ja kohtien yhtäläisyyksiä.
SVD: ssä käytettyjen algoritmien taustalla oleva teoria on tämän artikkelin ulkopuolella, mutta voit lukea siitä lisää tästä Victorian yliopiston artikkelista.
Thomo, A. piilevä semanttinen analyysi (Tutorial). Retrieved May 28, 2020 alkaen: https://www.engr.uvic.ca/~seng474/svd.pdf
Stephanie Glen. ”Latent semanttinen analyysi: yksinkertainen määritelmä, menetelmä” alkaen StatisticsHowTo.com: alkeellisia tilastoja meille muille! https://www.statisticshowto.com/latent-semantic-analysis/
——————————————————————————
Tarvitsetko apua läksy-tai koekysymyksessä? Chegg Studyn avulla saat askelmittaisia ratkaisuja kysymyksiisi alan asiantuntijalta. Ensimmäinen 30 minuuttia Chegg tutor on ilmainen!