Articles

Reddit-SiliconValleyHBO-誰もが概念的に中間圧縮を理解していますか?

それは本物ではない、それは構成されています。

可逆データ圧縮アルゴリズムは、すべての入力データセットの圧縮を保証することはできません。 つまり、任意の可逆データ圧縮アルゴリズムの場合、アルゴリズムによって処理されたときに小さくならない入力データセットがあり、少なくとも一つのフ これは、次のように、カウント引数を使用して初等数学で簡単に証明されます。

各ファイルが任意の長さのビットの文字列として表されていると仮定します。すべてのファイルを元のファイルよりも長い出力ファイルに変換する圧縮アルゴリズムがあり、少なくとも一つのファイルが元のファイルよりも短

短いものに圧縮する長さMビットのファイルFが存在するように、Mを最小の数とします。

NをFの圧縮バージョンの長さ(ビット単位)とします。p>

N<Mなので、長さNのすべてのファイルは圧縮中にサイズを保持します。 そのようなファイルは2Nあります。 Fと一緒に、これはすべての長さNの2Nファイルのいずれかに圧縮する2N+1ファイルを作成します。

しかし、2Nは2N+1よりも小さいので、ピジョンホールの原則によって、同時に二つの異なる入力に対する圧縮関数の出力である長さNのファイルがなければなりません。 そのファイルを確実に解凍することはできません(2つのオリジナルのうち、どちらが得られるべきですか?これは、アルゴリズムが可逆であるという仮定と矛盾する。したがって、元の仮説(圧縮関数がファイルをもはや作らないという)は必ずしも真実ではないと結論付けなければなりません。

したがって、私たちは/p>

https://en.wikipedia.org/wiki/Lossless_compression#Limitations

https://en.wikipedia.org/wiki/Kolmogorov_complexity

https://en.wikipedia.org/wiki/Lossless_compression#Limitations

https://en.wikipedia.org/wiki/Kolmogorov_complexity