viernes, 29 de marzo de 2019

¡Olvidado rey metadato!



Las pruebas que se presentan en este documento han sido hechas con dos máquinas, una de las cuales tiene instalado un sistema operativo Windows 7 y la otra tiene un sistema operativo Windows 10. Ambas, eso sí, tienen instalado el paquete ofimático Microsoft Office 2007, así como WinRar.

Añadir que se han utilizado la misma imagen “jpg” para incluir/vincularla en el documento en ambas máquinas.

Tras este prefacio, empecemos…

Todos tenemos controlados los metadatos de los archivos ofimáticos, sabemos cómo eliminarlos y como extraerlos con distintas herramientas. Pero, ¿qué ocurre cuando insertamos y/o vinculamos un elemento en un documento ofimático, por ejemplo en un documento Word?

NOTA: Para quién no lo sepa, la diferencia entre insertar y vincular es que cuando vinculamos; si se modifica algo de archivo origen, en nuestro caso un archivo “jpg”, el archivo ubicado en el documento Word también mostrará la modificación. No así si insertamos el archivo.

Decir antes de nada, que para ver la estructura interna del documento se aprovechará la característica que permite abrir un documento ofimático (que es un conjunto de directorios, y documentos XMLs), con WinRar (software de compresión/descompresión).

Para todos los casos que se van a exponer aquí, siempre nos fijaremos en el contenido del archivo: document.xml, ubicado dentro de la carpeta: Word, ya que dicho archivo, guarda el contenido que nosotros escribimos en el documento ofimático.

Al abrir el documento, buscaremos el objeto: <a:graphic>, y dentro de este documento buscamos dos ubicaciones:

1.- <wp:docPr>
2.- <pic:cNvPr>

Archivo con imagen insertada en Windows 7

Estructura interna del documento ofimático

¿Qué ocurre si insertamos la imagen?

Objetos donde mirar
 
Como se puede ver, <wp:docPr> y <pic:cNvPr> contiene un campo: descr, que contiene la ubicación del documento.

Esto nos está revelando información (metadatos), en nuestro caso, usuario (auditor) y como se ha comentado  antes, árbol de directorios donde reside el archivo.

¿Qué ocurre si vinculamos la imagen?

Vemos que: <wp:docPr>, nos sigue dando la misma información vista antes.




¿Y si la imagen es insertada desde una carpeta compartida ubicada en otro sistema?


Vemos que: <wp:docPr>, nos sigue dando información, pero en este caso nos da la dirección de red interna y el nombre de la carpeta compartida donde reside el archivo insertado.

Hasta aquí perfecto, ¡o no!

Ahora cambiemos de sistema operativo y vayámonos al Windows 10

¿Qué ocurre si insertamos la imagen?


Pues que nada de los visto en el Windows 7 es igual en Windows 10, y de hecho, no se proporciona ningún metadato.

¿Qué ocurre si vinculamos la imagen?



Vemos que: <wp:docPr>, nos vuelve a dar información.


¿Y si la imagen es insertada desde una carpeta compartida ubicada en otro sistema?


Pues que nada de los visto en el Windows 7 es igual en Windows 10, y de hecho, no se proporciona ningún metadato.

Conclusiones

Parece que todo depende del sistema operativo con el que trabajemos y del método que utilicemos: inserción o vinculación.

Los datos aportados permiten decir que lo mejor para no tener metadatos adicionales a los que ya maneja nuestro paquete Office es trabajar con un sistema Windows 10 y que las imágenes/datos deben ser insertadas/os.


En cualquier caso …

Lo que hagas con la información es cosa tuya, no mía ... pero ten conciencia.