Un viejo amigo, el formato Shape

GEOScéntricos
4 min readMay 21, 2019

¿Sabes en qué consiste?

Muchos de nosotros trabajamos con el formato Shape en algún tipo de Sistema de Información Geográfica, ya sea propietario o de código abierto. Este formato lo utilizamos para generar información, manipularla, compartirla y demás. Pero ¿qué hay realmente detrás de este formato?

El conjunto de información shape, es un formato de almacenamiento de datos vectorial que guarda la localización, la forma y los atributos de entidades geográficas.

Se almacena como un conjunto de archivos relacionados y contiene una clase única de datos. Esto es, el archivo puede ser de puntos, líneas o polígonos. Este formato fue desarrollado por la empresa ESRI a principios de los años 1990 para el software ArcView, sin embargo, a la fecha se mantiene vigente, pese a que existen otros formatos para almacenar datos geoespaciales con mayores ventajas (topojson, geojson, geopackage, entre otros).

El formato define la geometría y atributos de entidades geográficas en dos grupos de archivos (que comparten el mismo nombre), el primero de ellos es obligatorio y consta de archivos con las extensiones shp, shx y dbf. El resto de los archivos se definen por la forma de trabajo o por información complementaria que contengan y solo mencionaremos algunas extensiones que pueden ser encontradas, por ejemplo, prj, cpg ó idx.

Para los archivos obligatorios tenemos las extensiones:

.shp — Que es el formato shape por sí mismo. Contiene las entidades geométricas (y es un archivo binario).

.shx — Es el formato de índices para el shape, es un índice posicional de las entidades geométricas que permite búsquedas rápidas.

.dbf — Que contiene el formato de los atributos asociados a las entidades geométricas. Este formato de archivo fue originalmente usado en dBase (manejador de base de datos) y, a diferencia de los dos anteriores, es posible ver su contenido a través de un software tercero (como MS-Excel).

Otras extensiones que podemos tener son:

.prj — Es el archivo que almacena la descripción de la proyección por medio de texto (Well-know text representation of coordinate reference Systems). Este archivo también puede ser abierto por medio de un editor de texto.

.cpg — Se utiliza para guardar el código de página (utilizado en los archivos .dbf) en la codificación de caracteres. Esto es, que el sistema pueda reconocer los caracteres del archivo .dbf tal como fueron capturados.

.idx — Contiene un índice de atributos para la tabla de atributos.

Por último, tenemos algunas observaciones sobre el formato shape:

1. Pueden existir más extensiones en nuestro conjunto de datos shape y lo importante de recordar es que deben de considerarse como una sola entidad, ya sea para su uso, almacenamiento o transporte.

2. El tamaño de un formato shape no puede exceder de 2 GB (esto es, la suma de todos los archivos no puede exceder los 2 GB).

3. No puede almacenar valores nulos, no permite nombres de columna con más de 10 caracteres y no puede almacenar fecha y hora en una columna.

4. El formato shape no cuenta con la capacidad de almacenar topologías.

Muy bien, pues ahora conocemos mejor al formato shape, y como hemos aprendido tiene ventajas y desventajas. Es un formato aún bastante usado para trabajar en el fascinante mundo de los SIG.

En nuestro curso de Introducción a los Sistemas de Información Geográfica puedes aprender temas relacionados a datos geoespaciales a un precio increíble.

Revisa este enlace con toda la información del curso:

GEOScéntricos en Facebook
GEOScéntricos en Twitter
GEOScéntricos en Instagram
GEOScéntricos en Youtube

Facebook oficial de GEOS Informática y Sistemas

--

--

GEOScéntricos

Un blog dedicado a compartir noticias, curiosidades, análisis y ejercicios de tipo geoespacial