miércoles, 2 de octubre de 2013

IRIS: Formato de datos

El IRIS DMC surte de datos a los usuarios en distintos formatos. Los formatos son los siguientes:

SEED 

Standard for the Exchange of Earthquake Data (SEED) es un formato de datos destinado principalmente para el almacenamiento e intercambio de datos de serie de tiempo sismológicas y metadatos relacionados. El  formato is mantenido por la Federación Internacional de Redes Sismográficas Digitales (International Federation of Digital Seismograph Networks) y documentadas en el  SEEDManual ( formato PDF). Originalmente diseñado a finales de los 80s, el formato ha sido mejorado y refinado un número de veces y permanece como uso generalizado.
El llamado full SEED volume es la combinación de valores de series de tiempo junto con su metadata. Esencialmente un volumen full SEED es la combinación de miniSEED con un volumen sin datos coincidentes en un solo archivo. Los volúmenes SEED  no están diseñados para el procesamiento de datos, comúnmente se convierten a otros formatos. El software  rdseed de  IRIS DMC puede convertir volúmenes full SEED  a diferentes formatos de salida. 

Nomenclatura de identificación de datos 

El formato SEED  utiliza 4 componentes del nombre para identificar una serie de tiempo y dar la atribución al titular de los datos:
Network code:  Un código de 1 o 2 caracteres que identifica la estación/dueño  de los datos. Estos códigos son asignados por la FDSN para brindar unicidad a los datos sismológicos, nuevos codigos pueden ser pedidos.
Station code:  1 a 5 caracteres para identificar la estación que registra los datos 
Location ID:  Un código de 2 caracteres usado  para  identificar diferentes  cadenas de datos en una sola estación. Estos IDs son comúnmente usados para separar de manera lógica múltiples instrumentos o conjunto de sensores en una sola estación. 
Channel codes: una combinación de 3 caracteres utilizado para identificar  1) banda y la tasa general de muestreo 2) el tipo de instrumento and 3) la orientación del sensor. Una convención para estos códigos se ha fijado y documentado en el   Apéndice A del manual SEED.

Dataless SEED 

Un volumen dataless SEED  es la contraparte de metadatos para miniSEED que contiene las coordenadas geográficas y la información de la respuesta del instrumento, que a menudo es necesaria para procesar los datos de series de tiempo. Un Dataless puede contener una historia completa y detallada de los metadatos de una o varias redes y estaciones. Un volumen Dataless no contiene valores de las series de tiempo.
Un volumen Dataless se utiliza comúnmente para poblar una base de datos de metadatos o en combinación con miniSEED para convertir series de tiempo a un formato alternativo (utilizando el software rdseed del IRIS DMC). Una alternativa moderna a los volúmenes Dataless SEED para el intercambio de metadatos es el esquema sismológico  StationXML del FDSN.

Obtención del archivo Dataless

  1. Generar una petición para un dataless usando la online form
  2. Enviar una solucitud tipo  BREQ_FAST  a dataless@iris.washington.edu 
  3. Obtener un  dataless de [BUD Query Interface].
  4. Descargar la red de archivos  dataless SEED desde [IRIS FTP site].

MiniSEED 

miniSEED es un subconjunto estándar de SEED  que es usado para datos de series de tiempo.
A “file” or “stream” of miniSEED is simply a concatenation of data records. Depending on the capabilities of the intended reader the data records for multiple channels of data may be multiplexed together.
More than one programming library exists to support easy reading and writing of miniSEED data without knowing the details of the format, the libmseed library is supported and used extensively by the IRIS DMC.

Getting a MiniSEED File 

Submit a BREQ_FAST style request to miniseed@iris.washington.edu from your mail client.

Submitting MiniSEED data to the DMC 

For non-realtime data the DMC is providing a miniseed2dmc client to data suppliers (available athttp://www.iris.edu/pub/programs/). This client runs at the remote suppliers site and sends Mini-SEED records to a server at the DMC. The supplier specifies either files containing records or directories containing files with records and which server at the DMC to submit data to. It is important to emphasize that the client does not send files (just records) so the DMC has no idea of what the submitters’ files were organized or named, etc. The DMCreceives a stream of Mini-SEED records.
The sender can ship files that are >2Gb with this, since miniseed2dmc will turn the files into packet confetti, but on the receiving end, you must make sure that you do not write large files if the operating system doesn’t support it. The manual page for miniseed2dmc is included in the distribution in the doc directory as a man page.
On the DMC side we run a ringserver process to catch the streaming data sent by miniseed2dmc and write it out into file denominations of our choosing. In practice the DMC will run one ringserver process for each supplier. Each ringserver process will “listen” for connections on a network (TCP) port, so each supplier should be assigned a port number.
The submitting data center only need to open a firewall hole to this IRIS DMC machine, and contact Rick Bensonor Mea Edmunds at the IRIS DMC to initiate submission.

No hay comentarios:

Publicar un comentario