Fecha actual Jue Ago 22, 2019 5:22 pm

Posibilidades de lectura de PDFs parciales

Formatos usados para producir y almacenar texto enriquecido.


Usuarios leyendo este tema: Ninguno

Posibilidades de lectura de PDFs parciales

Notapor ~ » Mar Ene 01, 2013 4:14 pm

Si tenemos alguna forma de determinar qué partes de un PDF hacen falta, en términos generales, siempre y cuando la cabecera y tal vez unas cuantas páginas iniciales estén intactas, y también todo el final del archivo PDF esté integral, y tal vez también unas cuantas páginas al final, podremos leer lo que resta del PDF.

En otras palabras, un PDF puede leerse si sus datos al inicio y al final están completos, aunque falten datos a la mitad del PDF.

Si sabemos cómo se ve un PDF completo, también podemos hacer esta comprobación de forma rápida usando un editor hexadecimal para ver si el contenido del PDF al margen de los datos del inicio y del fin del archivo se miran completos (o simplemente tratar de abrir el archivo, ya que si encaja en esta descripción se abrirá con unas cuantas páginas perdidas en el medio, y si no encaja, si está incompleto en sus estructuras de datos vitales, simplemente no podremos abrirlo, no al menos directamente).

Cabe mencionar que los datos del inicio del PDF (la cabecera) es obviamente importante, pero tal vez son más importantes los datos al final del archivo, ya que para el formato PDF, el final del archivo define globalmente las páginas de todo el archivo. Así que mientrar esta parte esté intacta, tenemos gran probabilidad de leer dichas páginas. De lo contrario, estamos en problemas mayores.

Programas como BitTorrent y eMule hacen fácil saber, de manera visual, si tenemos un amplio margen de material completo al principio y al final del archivo, aunque falte una o más piezas relativamente pequeñas, hacia el centro del archivo (que técnicamente, es la parte de un PDF que en general es menos importante, menos crítica, para poder procesar el resto de un PDF, a menos que intentemos ver las páginas faltantes, claro está).

Ver el siguiente ejemplo de cómo se vería visualmente un PDF parcial (incompleto), pero que es posible de leer:

Descarga parcial de 2 PDFs en eMule


Y este es el ejemplo de forma "extendida", para comparar los dos PDFs anteriores, que son legibles, en comparación con muchos otros tipos de descargas parciales al azar, sin una estructura especial:

PDFs parciales legibles y otras descargas aleatorias en eMule
Imagen
IP for hosts file (email udocproject@yahoo.com to get updates if website becomes offline):
Código: Seleccionar todo
190.150.9.244 archefire.org



See what I'm doing in real time:
Main Desktop 1
Main Desktop 2
Avatar de Usuario
~
Site Admin
 
Mensajes: 2958
Registrado: Sab Nov 10, 2012 1:04 pm

Volver a Procesamiento de Texto

¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 2 invitados


cron