Articles

Reddit-SiliconValleyHBO – ¿Alguien entiende conceptualmente la compresión intermedia?

No es real, es inventado.

Los algoritmos de compresión de datos sin pérdida no pueden garantizar la compresión de todos los conjuntos de datos de entrada. En otras palabras, para cualquier algoritmo de compresión de datos sin pérdida, habrá un conjunto de datos de entrada que no se reducirá cuando sea procesado por el algoritmo, y para cualquier algoritmo de compresión de datos sin pérdida que haga al menos un archivo más pequeño, habrá al menos un archivo que haga más grande. Esto se prueba fácilmente con matemáticas elementales utilizando un argumento de conteo, como sigue:

Suponga que cada archivo se representa como una cadena de bits de alguna longitud arbitraria.Supongamos que existe un algoritmo de compresión que transforma cada archivo en un archivo de salida que no es más que el archivo original, y que al menos un archivo comprimido en un archivo de salida que es más corto que el archivo original.

Sea M el número mínimo tal que haya un archivo F con bits de longitud M que se comprime en algo más corto. Sea N la longitud (en bits) de la versión comprimida de F.

Debido a que N< M, cada archivo de longitud N mantiene su tamaño durante la compresión. Hay 2N de estos archivos. Junto con F, esto hace que los archivos 2N + 1 se comprimen en uno de los archivos 2N de longitud N.

Pero 2N es más pequeño que 2N+1, por lo que, según el principio de casillero, debe haber algún archivo de longitud N que sea simultáneamente la salida de la función de compresión en dos entradas diferentes. Ese archivo no se puede descomprimir de forma fiable (¿cuál de los dos originales debería producir?), lo que contradice la suposición de que el algoritmo no tenía pérdidas.

Por lo tanto, debemos concluir que nuestra hipótesis original (que la función de compresión no hace ningún archivo más largo) es necesariamente falsa.

https://en.wikipedia.org/wiki/Lossless_compression#Limitations

https://en.wikipedia.org/wiki/Kolmogorov_complexity