潜在的な意味分析:単純な定義、方法
統計定義>潜在的な意味分析
潜在的な意味分析とは何ですか?Latent Semantic Analysis(Lsa)は、単語や単語のグループがテキストでどのように使用されているかを分析する方法です。 これは、次のような質問に答えるために使用されます。
- テキストの根本的な意味は何ですか?
- 言葉は通路の意味にどのような影響を与えますか?
- 通路内の単語の平均的な意味は、通路の全体的な意味にどのように関連していますか?
言語(特に英語)は、単語が複数の意味を持っているため、部分的には複雑です。 例えば、「熱い」という言葉は、「沸騰近く」、「セクシー」、または「販売する価格」を含む様々なものを意味することができます。”多くは、あなたがそれを使用している文脈(すなわち、周囲の通路)に依存します。 あるテキストの”ホット”は、別のテキストでは全く異なる意味を持つ可能性があるため、関連する単語、通路、またはテキスト全体を見つけることは容易 LSAは、単語を「温度」、「性別」、または「ビジネス」などの概念にマッピングすることによってこれを実行しようとします。”言葉とリンクされた概念は、テキストの本当の意味に到達するために比較されます。潜在的意味分析は、潜在的意味索引付け(LSI)とも呼ばれます。
潜在的意味分析は、潜在的意味索引付け(
メソッド
各要素がテキストに単語が表示される頻度を示
LSAは、特異値分解(SVD)と呼ばれる高度な行列代数法を使用して行列を因数分解します。 SVDは、通常、テキストの小さなサンプル以上のもののために手で実行することは実用的ではありません。 実際には、コンピュータが複雑なアルゴリズムを処理するために現場に来たときに、それは本当に唯一の1980年代後に人気となりました。
基本的な方法は次のとおりです。
- テキストは、通路を表すために行列に変換されます。 行列内の各セルには、特定の単語が特定の通路に表示される回数が含まれています。
- 行列は、すべての通路がベクトルとして表されるように因数分解されます。 各ベクトルの値は、その成分の単語を表すベクトルの合計です。
- ドット積、余弦、または同様のメトリックは、単語とパッセージの類似性を表すために使用されます。 SVDで使用されるアルゴリズムの背後にある理論は、この記事の範囲を超えていますが、このUniversity of Victoriaの記事で詳細を読むことができます。
Thomo、A.潜在的な意味分析(チュートリアル)。 取得されたMay28,2020から: https://www.engr.uvic.ca/~seng474/svd.pdf
これを次のように引用します。
Stephanie Glen。 “潜在的意味分析:単純な定義、方法”からStatisticsHowTo.com:私たちの残りの部分のための基本的な統計! https://www.statisticshowto.com/latent-semantic-analysis/——————————————————————————
宿題やテストの質問の助けが必要ですか? Cheggの調査を使うと、分野の専門家からのあなたの質問に段階的な解決を得ることができます。 Cheggの家庭教師とのあなたの最初の30分は無料です!