Una vez definido lo que para nosotros significa calidad sísmica
y haber recuperado y colectados los atributos, agregamos una utilidad
de minería de datos a nuestra herramienta, la cual nos ayudar
´a a buscar y estimar correlaciones que por la gran cantidad de
datos a analizar no son evidentes.
La Minería de Datos es un
conjunto de técnicas para la inducción de conocimiento
útil a partir de masas muy grandes de datos. Tiene, por lo
tanto, un solapamiento importante con otras disciplinas como la
estadística tradicional, el reconocimiento de patrones y la
inteligencia artificial. Se la suele distinguir de ellas por el campo
de aplicación: es aceptado que la minería de datos
estudia información acumulada en empresas y otras
organizaciones acerca de sus clientes o usuarios, y las interacciones
de éstos con aquellas de manera que el conocimiento que pueda
extraerse sirva para mejorar la rentabilidad, el nivel de servicio,
redefinir estrategias de marketing y otras.
En nuestro caso,
queremos determinar las correlaciones y patrones existentes en los
datos que no son evidentes a simple vista, para lograr un mejor
entendimiento de la relación entre la Calidad Sísmica y
lo que hemos llamado atributos. Con
este objetivo hemos implementado 3 algoritmos de
minería de datos: matriz de correlación, similitud por
correlación y redes neuronales (entrenamiento y predicción).
La matriz de correlación es
especialmente útil para determinar la relación entre un
grupo de atributos y la Calidad Sísmica. Se aplica
principalmente en áreas extensas (análisis a nivel
regional), usando esta técnica hemos podido determinar cuales
son los parámetros de adquisición que tienen mayor o
menor influencia sobre la Calidad Sísmica
por cuenca, vea ejemplo en la Tabla
La similitud por correlación permite identificar líneas
sísmicas con características similares de
acuerdo a un conjunto de parámetros seleccionados. Esta opción
es de utilidad para hacer una análisis comparativo de varias
líneas sísmicas usando una de ellas como
referencia para el análisis, de esta manera se podría
tomar como línea de referencia aquella que presente las
mejores características de Calidad Sísmica y compararla
con un grupo de líneas y determinar los parámetros que
son comunes con la buena Calidad
Sísmica.
Por
último, con las redes neuronales podremos identificar patrones
de parámetros que produzcan la mejor Calidad Sísmica
para aplicarlos a otras zonas y determinar de acuerdo a las
condiciones geológicas y topográficas, los parámetros
que producirían la mejor Calidad Sísmica. A diferencia
de la matriz de correlación, esta técnica permite
centrar el análisis en zonas
específicas.
Para la aplicación de estos algoritmos debemos tener la mayor
cantidad de datos disponible con toda la información cargada
en bases de datos. Para los propósitos de este trabajo el
inventário aproximado de información útil tiene
aproximadamente 1500 metadatos, como se muestra en la Tabla de abajo.
A nuestra herramienta la hemos denominado OCTOPUS, pues
refleja en parte la versatilidad, y la consulta y múltiples
búsqueda sobre diferentes fuentes de información y
con el uso de múltiples técnicas.
Ver
video sobre la Base de Datos de Octopus