Compresión sin pérdidas: no te dejes nada por el camino

Los algoritmos de compresión nos permiten codificar un conjunto de archivos en un único fichero, reduciendo su tamaño y facilitando su posterior almacenaje en dispositivos extraíbles. Además, resultan de gran utilidad para la distribución de información por la red de redes

Sergi Puertas

Compresión sin pérdidas: no te dejes nada por el camino

28 julio 2010

Los mecanismos de compresión de datos sin pérdida que emplean los formatos que nos ocupan se fundamentan en la búsqueda de repeticiones y patrones en las secuencias de datos que contiene un fichero o un conjunto de ficheros. Una vez analizados estos, la información se recodifica de forma que requiera menor espacio en disco. Así, la cadena CCCCCCCC, que ocupa ocho bytes, puede codificarse sencillamente como 8C, lo cual constituye un ahorro de seis bytes sin que a lo largo del proceso se haya perdido ningún dato: tras la descodificación de los mismos, la cadena puede ser restaurada como CCCCCCCC y devuelta a su estado original. Nuestro ejemplo tal vez peca de simplista, puesto que los algoritmos que se emplean en este ámbito son capaces de simplificar series de datos mucho más complejas.

En algunos de los formatos que se emplean con mayor frecuencia, como ZIP, cada uno de los ficheros que se incluyen en el paquete se trata de manera independiente, lo cual cuenta con la ventaja de permitirnos recuperarlos más adelante sin tener que procesar los demás, con el consiguiente ahorro de tiempo y recursos. Otros, en cambio, como el formato RAR, agrupan conjuntos de ficheros y los tratan como uno solo. En la inmensa mayoría de los casos, este segundo método, que utiliza un mismo diccionario para codificar toda la información, arroja como resultado una mayor tasa de compresión, aunque tiene repercusiones negativas en el tiempo de procesado.

Stuffi

• Si te topas con los antiguos ficheros en formato SIT y SITX, no tendrás más remedio que echar mano de Stuffi Expander para procesarlos.

Nuestras pruebas

Para evaluar las capacidades de compresión de los principales formatos, hemos generado diversos paquetes comprimidos que más adelante hemos descomprimido valorando también el tiempo empleado. El primero lo hemos creado a partir de un conjunto de documentos de Microsoft Office compuesto por ficheros de texto, hojas de cálculo y presentaciones de PowerPoint. Para el segundo hemos compendiado ficheros de aplicación: ejecutables, librerías DLL y archivos tomados al azar de nuestra carpeta de programas. El tercero está integrado por material multimedia sin comprimir, es decir, ficheros de imagen y sonido que no gozaban de ningún tipo de compresión. Por último, hemos empaquetado y desempaquetado archivos de la misma categoría pero que implementaban distintos niveles de compresión interna.

Imagen-3

Las pruebas han sido realizadas en un ordenador equipado con un procesador Dual Core a 2,6 GHz y 4 Gbytes de RAM. Con ánimo de unificarlas, hemos empleado PeaZip siempre que nos ha sido posible, tanto para la compresión como para la descompresión. Para comprimir en formatos propietarios como RAR, ACE o ZIPX, claro está, hemos tenido que recurrir en cada caso particular al software que suministraba el desarrollador. En todos los casos, el nivel de compresión aplicado ha sido el medio, por considerar que ofrece un equilibrio entre tiempo de procesado y reducción de tamaño.

Imagen-2

Por otra parte, puesto que las aplicaciones de compresión de archivos son tan fundamentales que se hace imprescindible instalarlas en netbooks y dispositivos de capacidad limitada, hemos tenido en cuenta tanto el espacio en disco que ocupan tras la instalación como el hecho de que parte de ellas intenten agregar a nuestro equipo aplicaciones de terceros que requerirán que permanezcamos particularmente alerta durante el proceso.

8_WinZip_1

• ZIP es uno de los formatos de compresión más utilizados. En este estándar, cada uno de los ficheros que se incluye en el paquete se trata de manera independiente.

Sit y Sitx, un caso aparte

Pese a que algunos formatos de compresión solo pueden ser generados por la aplicación que suministran sus desarrolladores, existen programas capaces de descomprimirlos prácticamente todos. La excepción más insidiosa a este principio la constituye el formato SIT, que fue uno de los estándares entre los usuarios de Apple Macintosh durante largo tiempo antes de que el formato DMG lo eclipsara. Sin embargo, todavía circulan multitud de archivos empaquetados en SIT y en SITX, estos últimos generados por las últimas versiones de Stuffit.
Si te topas con ellos, no tendrás más remedio que procesarlos utilizando Stuffit Expander (www.stuffit.com/win-expander.html). Es totalmente gratuito, pese a que la versión que permite generar ficheros cuesta 18,52 euros.

Codificación y montaje de imágenes de disco

Las aplicaciones y librerías que se distribuyen en DVDs raramente aprovechan toda la capacidad del medio. Por otra parte, el precio de este tipo de soporte se ha visto tan reducido a lo largo de los últimos años que resulta caro y engorroso tener que utilizar diversos CDs para replicar una aplicación que bien podría caber en un DVD. Programas como Alcohol 120% (www.alcohol-software.com) o las célebres Daemon Tools (www.daemon-tools.cc) permiten generar ficheros de imagen a partir de distintos discos físicos que a menudo pueden guardarse en un único DVD, ahorrándonos dinero y espacio. Potenciaremos al máximo este ahorro si utilizamos un formato de imagen de disco con compresión interna. Aunque ocupe menos espacio, posteriormente, podremos trabajar con la imagen de manera transparente, leyendo sus contenidos como si se tratara de un disco físico y sin tener que efectuar descompresión alguna. En este sentido, cabe destacar la popularización que está comenzando a adquirir el formato DAA (Direct-Access-Archive), que permite además aplicar a la imagen de disco características como protección mediante contraseña o fraccionamiento en varios volúmenes. Para generarlas y posteriormente montarlas, utiliza PowerISO (www.poweriso.com/download.htm).

Recuadro-2

Compresión interna, la opción invisible utilizada por muchos

La apertura y edición de ficheros multimedia codificados en formatos como JPG o MP3 se lleva hoy a cabo de manera totalmente transparente, aunque los más veteranos recordarán sin duda los días en los que era preciso realizar una descompresión previa no ya para modificar los contenidos del archivo, sino incluso para visualizarlos o escucharlos. Efectivamente, el hecho de que los mencionados formatos y muchos otros (entre los que se incluyen los documentos PDF o los vídeos AVI) integren una compresión interna provoca que, al comprimirlos de nuevo, su tamaño no se reduzca significativamente. En los formatos que hemos citado se utilizan algoritmos de compresión con pérdida, es decir, la calidad de imagen o de sonido se ve en mayor o menor medida perjudicada dependiendo del nivel de reducción de tamaño aplicado. Otros, como pueden ser los archivos de audio APE o las imágenes en TIFF, emplean algoritmos de compresión interna similares a los que utilizan las aplicaciones que hemos puesto a prueba en estas páginas: tras el proceso no se produce pérdida alguna de información y se conservan todos los datos que poseía el original. De hecho, las imágenes TIFF, por ejemplo, pueden incluir compresión interna en ZIP o LWZ o no incluirla. En el primer caso, un compresor externo apenas marcará diferencias, mientras que en el segundo reducirá radicalmente el tamaño, por lo que resulta conveniente comprobar sus características y valorar si merece la pena procesarlas.

La opinión de PC Actual: si es posible, elige no pagar

Si has leído las reseñas de las aplicaciones analizadas, habrás sacado la misma conclusión que nosotros: a menos que precises generar ficheros en formatos ACE, RAR o ZIPX, no existe ninguna razón para pagar por unas prestaciones que software como IZArc o ZipGenius te ofrecen de manera gratuita. En la liga de los descompresores gratuitos, PeaZip está muy cerca de ser la aplicación ideal. Trabajar con ella generando archivos ZIP garantiza la compatibilidad de lo que comprimas y, a la hora de descomprimir, permitirá manejar prácticamente cualquier formato.
El mejor formato

Manejar muestras es siempre peliagudo, puesto que los algoritmos de compresión arrojarán siempre distintas tasas en función de cada documento concreto y de cada archivo en particular. No obstante, de las pruebas llevadas a cabo se extraen conclusiones reveladoras. La primera es que, a la hora de empaquetar los documentos de ofimática, el formato 7z se muestra tan superior al resto que nos hemos visto obligados a verificar la información repetidamente para certificar que no se trata de un error. La segunda es que, si dejamos de lado el antiguo formato LZH, que es el que peor parado ha salido, las diferencias entre los distintos formatos tanto en tiempo de proceso de los paquetes como en reducción del tamaño no son tan significativas como cabría pensar. A todo esto cabe hacerse una pregunta cuya respuesta es susceptible de arrojar nueva luz sobre el hecho de que el formato ZIP siga siendo el más extendido, a pesar de que parte de sus competidores le aventajan en diversos aspectos.

Opina_compresores

¿El tamaño importa tanto?

No es de extrañar que formatos de compresión como ZIP, desarrollados hace más de veinte años, experimentaran un gran auge durante los 90, cuando los módems de conexión dial up a 14.400 eran prácticamente un lujo y los soportes extraíbles no eran sino disquetes capaces de albergar, a lo sumo, poco más de 1 Mbyte. El creciente ancho de banda y el incremento de tamaño de los soportes dan como resultado un panorama donde una elevada tasa de compresión no resulta tan imprescindible como entonces.

A este fenómeno cabe sumar el hecho de que buena parte de los archivos multimedia que transmitimos o almacenamos en nuestros discos, que a fin de cuentas son los más propensos a generar ficheros de gran tamaño, implementan ya formatos de compresión interna. En este sentido, ninguno de los formatos puestos a prueba ha sido capaz de reducir significativamente el tamaño original de los ficheros MP3, JPG y similares por debajo del 90%. Así, cuando trabajemos con audio, imágenes y vídeo codificados en formatos de este tipo, podemos concluir que, excepto en casos muy concretos –como cuando precisemos encajar en un DVD un conjunto de archivos que rebasa ligeramente en tamaño la capacidad del disco–, prescindir de compresión adicional nos ahorrará tiempo y esfuerzo.

Si lo que deseamos es reunir un conjunto de archivos en un solo fichero, todos los formatos analizados cuentan con la posibilidad de trabajar con compresión cero. Las aplicaciones y los documentos sin compresión interna parecen más susceptibles a menguar, pero ¿hasta qué punto merece la pena el tiempo invertido en el proceso en un panorama donde imperan las conexiones de 20 Mbps y los discos USB de 16 Gigas?

En definitiva, el tamaño sigue importando hasta cierto punto, pero, aunque resulte paradójico, en muchos casos los compresores resultan más reseñables como utilidades para empaquetar que para el fin que fueron diseñados.

Lo mejor: las alternativas gratuitas

Las recientes arquitecturas y los actuales procesadores han reducido enormemente los tiempos de proceso de los paquetes. Por otro lado, a nivel de software, contamos con un sinfín de alternativas gratuitas de entre las que cabe destacar PeaZip.

Lo_mejor

Lo peor: meros empaquetadores

Los formatos de compresión interna relegan más y más a los compresores al papel de meros empaquetadores. Así, no parece factible que formatos como 7z, que generalmente ofrecen mejores resultados que ZIP, se impongan a medio plazo, pues éste se ha convertido en un estándar consolidado.

Lo_peor
Temas Relacionados