¿Por qué pesa tanto mi PDF? (y cómo reducirlo)
Imágenes en alta resolución, páginas escaneadas, fuentes incrustadas y objetos duplicados engordan un PDF. Aquí tienes qué lo causa y cómo solucionarlo.
Terminaste un documento de dos páginas, lo exportaste como PDF y, de algún modo, acabaste con un archivo de 40 MB que se niega a adjuntarse a un correo. Es una experiencia sorprendentemente común. Un PDF no es una sola cosa: es un contenedor que agrupa texto, fuentes, imágenes, gráficos vectoriales y metadatos en un único archivo. Cuando ese archivo es enorme, el tamaño casi siempre proviene de unos pocos culpables concretos. Una vez que sabes a quién echarle la culpa, reducir el PDF es sencillo. Esta guía repasa cada causa y la solución que realmente funciona para cada una.
Qué hay realmente dentro de un PDF
Un PDF almacena el contenido como una colección de objetos: flujos de texto, datos de imagen, programas de fuentes y las instrucciones que los disponen en la página. El formato está definido por un estándar ISO abierto, y la descripción general de ISO 32000 de la PDF Association es una buena referencia si quieres los detalles formales. La conclusión práctica es simple: el texto y los gráficos vectoriales son diminutos, mientras que las imágenes son enormes en comparación. Una página entera de texto denso puede ocupar unos pocos kilobytes. Una sola foto a página completa puede ocupar varios megabytes. Así que, cuando un PDF es inesperadamente grande, la primera pregunta que hay que hacerse casi siempre es: ¿de dónde vienen las imágenes?
Causa n.° 1: imágenes incrustadas en alta resolución
Esta es la razón más común por la que un PDF se dispara de tamaño. Cuando arrastras una foto de un móvil o una cámara modernos a un documento, puede tener 4000 píxeles de ancho o más. Aunque se muestre en la página a una fracción de ese tamaño, el PDF a menudo almacena la resolución completa. Para un documento pensado para leerse en pantalla o imprimirse con calidad normal, rara vez necesitas más de 150 píxeles por pulgada (PPP); para impresión de alta calidad, 300 PPP son de sobra. Cualquier cosa por encima de eso es peso desperdiciado.
La solución es reducir la resolución y recomprimir esas imágenes antes o después de que entren en el PDF. Si controlas las imágenes de origen, redúcelas primero: pásalas por el compresor de JPEGcon una calidad de 70–80 y ajústalas a las dimensiones que realmente necesitas. Si las imágenes ya están integradas en el PDF, pasa todo el archivo por el compresor de PDF, que vuelve a codificar las imágenes incrustadas a un tamaño menor y razonable. Para contenido fotográfico, solo este paso suele recortar el archivo en un 80 por ciento o más.
Causa n.° 2: páginas escaneadas
Un documento escaneado es un caso especial, y especialmente pesado. Cuando escaneas papel, cada página se convierte en una imagen a página completa: no hay texto real en el archivo, solo imágenes de texto. Los escáneres suelen configurarse por defecto con valores de DPI muy altos (600 DPI es habitual) y a todo color, lo que produce archivos enormes para lo que esencialmente es tinta negra sobre papel blanco.
Puedes hacer dos cosas. Primero, escanear con más cabeza: para un documento de texto, escanear a 200–300 DPI en escala de grises o en blanco y negro en lugar de a 600 DPI en color puede reducir el tamaño de forma drástica sin dejar de ser perfectamente legible. Segundo, para los escaneos que ya tienes, recomprímelos: al pasar el archivo por el compresor de PDF se vuelven a codificar esas imágenes de página a una resolución y calidad más razonables. Pero sé realista respecto al límite: un escaneo es, fundamentalmente, una pila de imágenes, así que siempre será más grande que un PDF de texto nativo digital de la misma extensión.
Causa n.° 3: fuentes incrustadas y objetos duplicados
Los PDF incrustan las fuentes que utilizan para que el documento se vea idéntico en todos los dispositivos, lo cual es estupendo para la fidelidad pero añade peso. Un exportador que se porta bien crea subconjuntos de fuentes, incrustando solo los caracteres que realmente se usan. Las herramientas mal configuradas incrustan la familia de fuentes entera, y un documento que usa varias tipografías decorativas puede arrastrar varios megabytes de datos de fuentes que apenas toca. Limitarse a un pequeño conjunto de fuentes comunes, y dejar que tu software cree subconjuntos, mantiene esto a raya.
Luego está la pura ineficiencia. Algunos programas escriben la misma imagen o recurso en el archivo varias veces en lugar de referenciarlo una sola vez: un logotipo que aparece en una cabecera en cada página puede acabar incrustado decenas de veces. Los ciclos repetidos de “Guardar como” y las ediciones incrementales también pueden dejar atrás objetos huérfanos y obsoletos que nunca se eliminan. Volver a guardar el PDF con una herramienta que reescriba y elimine duplicados de su estructura de objetos limpia todo esto automáticamente.
Causa n.° 4: metadatos, adjuntos y restos
Los contribuyentes más pequeños suman. Los PDF pueden llevar metadatos del documento, paquetes XMP, perfiles de color incrustados, miniaturas, datos de campos de formulario, JavaScript e incluso archivos adjuntos completos. Los documentos exportados desde software de diseño a veces incluyen capas ocultas, comentarios o historial de revisiones. Nada de esto es visible en la página, pero todo cuenta para el total de bytes. Optimizar o “aplanar” el PDF elimina las partes que no necesitas dejando intacto el contenido visible.
Cuando un PDF no se reduce mucho
La compresión no es magia, y ayuda saber cuándo has tocado fondo. Si tu PDF es en su mayoría texto real y gráficos vectoriales —un informe nativo digital, un contrato, un listado de código— es probable que ya sea pequeño, y hay poco que ganar. Los bytes están haciendo un trabajo útil, y apretar más no servirá de nada. Las grandes ganancias provienen casi por completo de las imágenes: fotos en alta resolución y páginas escaneadas. Si recomprimir esas imágenes no mueve la aguja, lo más probable es que tu archivo no tuviera muchas imágenes para empezar.
Una forma rápida de diagnosticarlo: pregúntate si puedes seleccionar y copiar el texto del documento. Si puedes, es nativo digital y el tamaño proviene de imágenes incrustadas, fuentes o restos. Si no puedes —si el texto es solo parte de una imagen— tienes un escaneo, y reducir la resolución de esas imágenes de página es tu mayor palanca.
Reducir el tuyo, de forma privada
La buena noticia es que solucionar todo esto no requiere subir tu documento a ningún sitio. El compresor de PDF de FileShrinking se ejecuta por completo en tu navegador, así que un contrato confidencial o un documento de identidad escaneado nunca sale de tu dispositivo: se procesa localmente y no se envía nada a ningún servidor. Empieza por ahí con cualquier PDF grande; si estás montando un documento a partir de tus propias fotos, redúcelas primero con el compresor de JPEG para que el peso de más nunca llegue a entrar. Entre los dos, la mayoría de los PDF sobredimensionados quedan en un tamaño manejable y apto para correo en una sola pasada.