Tuesday, February 4, 2014

Análisis de Imágenes Multiespectrales para Detectar Minerales

Pontificia Universidad Católica Madre y Maestra
Facultad de Ciencias de laS IngenieríaS
Departamento de Ingeniería TELEMÁTICA

Proyecto:
1ER ENTREGABLE: analisis de imágenes multiespectrales para detectar minerales
Autores:
Leonardo Antonio López 2008-2455
Anthony Manuel Ortiz Cepeda 2009-1407

Asesores:
Ing. arlene estévez
ing. Luis Francisco Fernández

versión:
v4.0

Fecha:
14 de Abril del 2014

Plan de Trabajo Detallado del Proyecto


Proyecto:
Análisis de Imágenes Satelitales Multiespectrales para Detectar Minerales
Fecha:
14/04/2014
Autores:
Leonardo López y Anthony Ortiz
Versión:
3


2. Índice
Plan de Trabajo Detallado del Proyecto.................................................................... 2
1    Historial del Plan de Trabajo................................................................................ 2
1.1    Historia de Revisiones...................................................................................... 2
1.2    Aprobaciones.................................................................................................... 2
1.3    Distribución....................................................................................................... 2
3.    Propósito del Documento..................................................................................... 4
4.    Antecedentes.......................................................................................................... 4
5.    Definición del Proyecto......................................................................................... 5
a.    Visión y Objetivos............................................................................................... 5
b.    Aspectos Metodológicos..................................................................................... 6
c.    Alcance del proyecto......................................................................................... 11
d.    Productos del proyecto..................................................................................... 11
6.    Marco Teórico..................................................................................................... 11
7.    Estructura de Organización del Proyecto......................................................... 37
a.    Estructura del Equipo de Proyecto.................................................................. 37
b.    Roles y responsabilidades................................................................................. 38
8.    Cronograma del Proyecto.................................................................................. 40
9.    Plan de Administración de Riesgos................................................................... 40
a.    Enfoque metodológico para la evaluación de riesgos...................................... 40
10.     Presupuesto....................................................................................................... 40
11.    Procedimiento.................................................................................................... 41
12.     Bibliografía....................................................................................................... 53
13.     Anexos............................................................................................................... 54
a.    Riesgos preliminares del proyecto.................................................................... 54

Plan de Trabajo Detallado del Proyecto

3.   Propósito del Documento

Este documento tiene como propósito servir de historial, como también plantear una guía clara sobre el propósito y las especificaciones de nuestro proyecto final de carrera en la Pontificia Universidad Católica Madre y Maestra.
En la primera parte de la elaboración de nuestro proyecto, el enfoque fue delimitar uno o varias metas, y en fin tener una idea clara de lo que queremos alcanzar. También, se pretende hacer un planteamiento e investigación sobre las diferentes técnicas y tecnologías que se quieren aplicar, con el objetivo de probar cuáles de estas serían de mejor provecho para nuestro objetivo de detectar minerales a través de imágenes satelitales.
Por otra parte, es necesario documentar el presupuesto planeado para los gastos concernientes al proyecto, los cuales incluirían material de documentación como libros y entrenamiento y la posible compra de imágenes satelitales en caso de que las facilitadas por el LANDSAT no proporcionen toda la información necesitada.
La plantilla de análisis de riesgos nos ayudará mejor en manejar el presupuesto, como también el tiempo de desarrollo del proyecto, y qué ambiciosos podemos ser con nuestros objetivos. El punto es poder prever posibles dificultades que pueden afectar de forma negativa el progreso de este proyecto.

4.   Antecedentes

Las imágenes obtenidas por los satélites ofrecen una perspectiva única de la Tierra y sus recursos. La teledetección por satélite puede ser una fuente rentable de valiosa información para numerosas aplicaciones, entre las que se pueden citar la planificación urbana, vigilancia del medio ambiente, gestión de cultivos, prospección petrolífera,  exploración minera, desarrollo de mercados, localización de bienes  raíces y muchas otras.
El valor de las imágenes de satélite y la información extraída de ellas son evidentes. Ofrecen una visión global de objetos y detalles de la superficie  terrestre y facilitan la comprensión de las relaciones entre ellos que pueden no verse claramente cuando se observan a ras de tierra.
Además de estas ventajas evidentes, las imágenes de satélite muestran, literalmente, mucho más de lo que el ojo humano puede observar, al desvelar detalles ocultos que de otra forma estarían fuera de su alcance. En la documentación ofrecida por Dirección General de Minería de la República Dominicana no se observan trabajos de detección de minerales usando teledetección. Esta carencia de medios que faciliten el estudio efectivo del suelo es la razón por la que muchas personas propietarias de vastas extensiones de terreno desconocen si su propiedad cuenta con recursos explotables.
Por todo esto nos hemos motivado a involucrarnos en este proyecto, y así aportar a nuestro país y a la comunidad científica.
Para ello se van a desarrollar los mecanismos científicos necesarios para obtener un modelo de análisis de imágenes satelitales multiespectrales para detectar posibles yacimientos minerales, que funcione para nuestro clima y relieve característico.

5.   Definición del Proyecto

a.      Visión y Objetivos

El objetivo de este proyecto es realizar un análisis remoto mediante imágenes satelitales multiespectrales que ayuden a determinar si alguna extensión de tierra cuenta con algún valor inorgánico. Dicho con otras palabras, se pretende desarrollar un algoritmo que proporcione la siguiente información: identificación de grupos de arcilla que son indicadores de diferentes tipos de depósitos minerales.
Se trata más bien de un proyecto en dónde se analizarán imágenes del satélite LANSAT 8 para lograr obtener información de minerales. Se pretende hacer diferentes combinaciones de bandas para detectar qué combinación de estas nos proporciona la mayor información para el análisis minero.
Se mejoraría una situación como esta:
Imagen 1. Exploración Minera Manual.

Esta información puede ser utilizada con el propósito de:
·         Identificar grupos de arcilla que son indicadores de diferentes tipos de depósitos minerales.
Este sistema generaría ciertos beneficios:
·         Conocimiento del subsuelo del país con muy poca inversión de recursos.
·         Descubrimiento de posibles yacimientos de minerales para su aprovechamiento y beneficio económico del país.
·         Aporte a la ciencia internacional con la especificación de las bandas que ofrecen mayor información sobre minerales en el Landsat 8.

b.      Aspectos Metodológicos

Se pretende plantear una metodología de trabajo estricta, de mucha investigación sobre diferentes trabajos realizados en el área y sobre las últimas publicaciones científicas de instituciones especializadas en este tema como el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE), con el fin de estar al tanto de todo lo realizado en el área. El siguiente paso es la obtención de imágenes satelitales multiespectrales para lo que contamos con el satélite LANDSAT 8 de la NASA. Luego de la obtención de las imágenes se procederá a hacer un análisis de estas.
Las imágenes multiespectrales tienen una resolución baja puesto que un pixel representa hasta cientos de metros y en cada uno de estos hay información de una enorme cantidad de elementos de la superficie y el subsuelo. Además, estas se ven afectadas por efectos de dispersión atmosférica debido a que la luz del atraviesa la atmósfera terrestre y algunas partículas presentes en estas afectan la información recibida en el sensor del satélite por lo que el primer reto será el de suprimir estos efectos no deseados de la imagen, lo que se conoce como corrección radiométrica
Histogram Values Method, DOS y COST son algoritmos importantes de corrección radiométrica.
Luego que se tiene la imagen adecuada para el análisis se procederá a hacer combinaciones de bandas de las que proporciona el LANSAT 8 para determinar la combinación que da mejor información acorde a nuestro objetivo. Se aplicará el método de Ratio Image que se trata de la realización de un cociente de los valores de pixel de dos bandas con el fin de destacar la información útil para detección. El paso final es el de aplicar algoritmos de clasificación basados en estadística de alto orden para la discriminación de las zonas donde se considere haya alta probabilidad de yacimientos minerales.



ELECCIÓN DE ÁREA DE TRABAJO
Nos enfocamos en el cuadrante geológico 6172 de Bonao, don se tiene información de estudios geológicos manuales realizados previamente y dentro del cual se sitúa la minera canadiense Barrick Gold (Imagen 2).
Imagen 2. Cuadrante Path 7 Row 47, donde se sitúa Barrick Gold.

En el año 2004 en el Proyecto K "Cartografía Geotemática en la República Dominicana" auspiciado y financiado en su totalidad por la Unión Europea, formando parte del conjunto de proyectos del Programa SYSMIN, cuyo objetivo general es promover el conocimiento y desarrollo del sector geológico-minero del país presentó un informe detallado de un estudio geológico realizado en el cuadrante de Bonao (6172). En ese proyecto adjudicado al consorcio integrado por el Instituto Geológico y Minero de España (IGME), el Bureau de Recherches Géologiques et Minières (BRGM) e Informes y Proyectos S.A. (INYPSA) bajo  la supervisión de la Dirección General de Minería (DGM) se presenta de forma detallada los minerales presentes en este cuadrante.
Vamos a trabajar con las imágenes multiespectrales de esa zona para demostrar lo realizado comparando  nuestros resultados con los de este estudio.


Cuadrante Geológico de Bonao (6172)
En este cuadrante se encuentran representadas las formaciones geológicas con mayor potencial metalogenético de la Rep. Dominicana. Reflejo de ello, es la presencia de un número importante de indicios metálicos y, en menor proporción, de rocas industriales.
La hoja cuadrante de Bonao a escala 1/100 000, se sitúa en la zona centro meridional de la República Dominicana. Está constituido por las Hojas de Hatillo (6172-I) Villa Altagracia (6172-II), Arroyo Caña (6172-III) y Bonao (6172-IV) a escala 1:50.000.
Su ámbito (superficie) se divide entre las provincias de San Cristóbal, Sánchez Ramírez, La Vega, Peravía y una pequeña parte correspondiente al Distrito Nacional.
Desde el punto de vista fisiográfico, la topografía es accidentada en general presentando los mayores relieves en el sector SW y W con cotas superiores a los 1,500 m. En el resto dentro de un contexto de relieves alomados se presentan alineaciones montañosas notables como Siete Cabezas, con cotas de hasta 1,000 m, Loma Peguera, Loma la Naviza, etc. entre las que se sitúan valles con cotas de 100 m en los cauces de los ríos. A destacar la planicie que constituye el Valle de Bonao en fuerte contraste fisiográfico con las alineaciones de Loma Caribe y con las elevaciones de la parte occidental de la Hoja.
La red hidrográfica está formada por un gran número de ríos y arroyos en general de cauces caudalosos y encajados. Los ríos más notables son el Ozama y su afluente La Isabela que desemboca en la capital; el Yuna que desemboca en la bahía de Samaná, el Haina, el Nizao, Maimón, etc.
La población es abundante, localizándose preferentemente en los núcleos más destacados; Villa Altagracia, Bonao, Maimón, Yamasá, Rancho Arriba, así como en multitud de pequeños núcleos distribuidos en las zonas bajas y accesibles. La economía se basa fundamentalmente en la agricultura, arroz, cacao, café; menos en la ganadería; también en el sector minero ya que se localizan en este cuadrante las explotaciones de lateritas niquelíferas de la compañía Falconbridge Dominicana (Bonao) así como la explotación aurífera de la mina Pueblo Viejo, perteneciente a la compañía canadiense Barrick Gold.

c.       Alcance del proyecto

Se pretende desarrollar un algoritmo e implementar mejoras de uno o varios de los existentes para obtener información de recursos minerales usando imágenes multiespectrales de Landsat 8. Se trata de un proyecto complejo de varias etapas y que ameritará trabajar con muchos algoritmos.
Por razón de la muy baja resolución de imágenes espectrales, es posible de que un pixel contenga una mezcla de varios elementos al azar.

Se pretende descubrir, también, qué bandas del LANDSAT 8 ofrecen mayor información sobre minerales.

d.      Productos del proyecto

El entregable de este proyecto estará disponible a partir de Proyecto 1, y consistirá en los resultados de la investigación, los algoritmos desarrollados y el análisis de su eficacia en contraste con otros así como la comparación de nuestra investigación con los informes mineros publicados anteriormente de la zona analizada.
Para la entrega de Proyecto 2, se pretende optimizar los procedimientos ya hechos en el previo semestre.

6.  Marco Teórico

Imágenes Multiespectrales
Una imagen Multiespectral es un modelo de la realidad construido con base en una respuesta espectral de los elementos que componen una escena y las cuales son captadas por detectores sensibles a un rango de longitudes de onda del espectro electromagnético.
Para ello se aprovecha el sol como fuente de radiación y las propiedades que tienen la mayor parte de los cuerpos en la superficie terrestre de reflejar una parte de esa radiación emitida que a su vez es captada por un sensor calibrado para trabajar en una franja o banda del espectro.

Con los programas espaciales dedicados al estudio de los recursos naturales de la tierra ha sido posible colocar un conjunto de sensores en un satélite para tener una visión sinóptica de la misma, éstos sensores trabajan en bandas generalmente del visible y del infrarrojo, lo que permite medir la respuesta espectral de cuerpos en la superficie terrestre en diferentes rangos de longitud de onda, creándose así la imagen de una escena de la tierra en múltiples bandas del espectro, que es lo que se conoce como imagen multiespectral.

Breve Resumen del Proyecto Landsat 8
Landsat 8 es un satélite de observación global de origen estadunidense, y fue lanzado a órbita el 11 de Febrero del 2013. Oficialmente, el Landsat 8 inició su operación rutinaria el 30 de Mayo del 2013, cuando la NASA transfirió comando de las operaciones satelitales hacia la entidad americana U.S. Geological Survey, o USGS.
Al transferir comando, el nombre del satélite cambió de “Landsat Data Continuity Mission” a “Landsat 8”. En la actualidad, USGS se encarga de manejar el equipo de operaciones de vuelo satelital dentro del Mission Operation Center situado en Goddart Space Flight Center de Nasa, en Greenbelt, Maryland, E.E.U.U. La transición tuvo una duración de 100 días, cuyo tiempo fue dedicado para verificaciones de los subsistemas de nave y tierra, y para subir el satélite a su órbita operacional a 438 millas (705 km) de altura.  Análisis de data obtenido durante este periodo de verificación demuestra que el rendimiento del satélite, los sensores, y del sistema terrestre correspondiente excede especificaciones anteriormente planteadas.
Los satélites Landsat están destinados específicamente a los estudios de recursos naturales, hasta la fecha se han lanzado al espacio ocho de estos satélites.
Estos satélites cubren en forma sistemática y repetitiva la superficie de la tierra girando alrededor de ella cada 103 minutos en una órbita circular, polar, sincrónica con el sol a 920 km de altura. El 11 de febrero del 2013 fue lanzado el satélite Landsat 8 (cuyo nombre técnico es LDCM: Landsat Data Continuity Mission, Misión de Continuidad de la Información Landsat) desde la base aérea Vandenberg en California, gracias a una operación conjunta entre la Administración Nacional de Aeronáutica y del Espacio (NASA) y el Servicio Geológico de los Estados Unidos (USGS).
Landsat 8, que reemplazará a Landsat 5 TM y Landsat 7 ETM+, cuenta con dos instrumentos de toma de datos: el OLI: Operational Land Imager, o Generador Operacional de Imágenes de Tierra) y el TIRS (Thermal Infrared Sensor, o Sensor Infrarrojo Térmico). Las escenas de Landsat 8 tendrán un total de 11 bandas espectrales, 9 tomadas por  el OLI y 2 por el TIRS. En la siguiente tabla se describen las principales características de las mismas: 
Los archivos de Landsat 8 rondan los 2 GB, por tener más bandas que sus antecesores, tratarse de archivos de 12 bits y contener una banda de Valoración de Calidad (QA), que proporcionará información sobre la “calidad” de determinado píxel, respecto a anomalías en la toma del dato por problemas de instrumental u otras, tales como presencia de aerosoles, agua o nieve, etc.
Estos satélites proporcionan imágenes multiespectrales gratuitas que podrían utilizarse para nuestro estudio. Las imágenes híperespectrales proporcionan mucho más información para hacer un análisis muy detallado, pero son muy caras y cada imagen cubre muy poca área de la superficie terrestre. Por los motivos antes expuestos se trabajará con las imágenes que proporciona el satélite LANDSAT 8.
Las imágenes satelitales de LANDSAT 8 que cubren esta superficie son 2:
Satellite Path: 7, Satellite Row: 47
Satellite Path: 8, Satellite Row: 47
La luz de colores que vemos es el resultado del reflejo de la luz blanca en los objetos. Es mejor hablar de radiación electromagnética que de luz, puesto que la luz visible no es más que una parte de la total.
Cuando se hace una foto se recoge la información relativa a las intensidades de luz de los tres colores básicos del espectro visible (rojo, azul y verde), pero sabemos que, en realidad, se podría obtener información en muchas más zonas del espectro electromagnético y de hecho, los sensores de los satélites lo hacen.
Los satélites permiten obtener sensores con 7 o más filtros diferentes o "bandas".  Las bandas 1, 2, 3, 4, 5, y 7 son sensibles a la energía de la luz solar reflejada por la superficie de la Tierra. Cada banda es sensible a una parte distinta de esta radiación, definida por su longitud de onda. Con esta información es posible estimar la cantidad de luz reflejada por la superficie terrestre. Mediante análisis matemático y el procesamiento digital de estas imágenes multiespectrales e híperespectrales se pueden hacer estimaciones de los objetos, no solo que cubren la superficie, sino también lo que hay en el sub-suelo.
Las propiedades de reflexión y de absorción, además de la litología de los suelos, las rocas y la vegetación se pueden analizar utilizando imágenes multiespectrales para identificar diversas estructuras minerales. Las diferencias en la absorción y la reflexión se analizan y traducen en colores asignados diferentes para cada tipo de roca y para cada grupo de longitudes de onda. Cuando se utilizan bandas del infrarrojo 3, 2 ​​y 1 del Landsat 7, por ejemplo, la vegetación aparece en rojo, nieve y secos lagos de sal son de color blanco y las rocas expuestas aparecen como marrón, gris, amarillo y azul. Otras longitudes de onda identifican arcilla, sulfitos y de carbonita, en base a su cualidades de absorción y reflexión, que luego se traduce en colores de la imagen final. Aún más longitudes de onda identifican carbonita y rocas volcánicas.
Bandas donde se obtendría mayor información
Al momento de redacción de este documento, en la base de datos de la IEEE sólo existen dos papers relacionados con Landsat 8 y ninguno habla entorno a este tema, pero se sabe que ninguna banda única específica del LANSAT  7 da la información requerida para lograr los objetivos buscados pero una combinación de las  bandas 7, 4, 1 (RGB) es ampliamente utilizada en geología por la información que ofrecen en conjunto. Utiliza las tres bandas menos correlacionadas entre sí. La banda 7, en rojo, cubre el segmento del espectro electromagnético en el que los minerales arcillosos absorben, más que reflejar, la energía; la banda 4, en verde, cubre el segmento en el que la vegetación refleja fuertemente; y la  banda 1, en azul, abarca el segmento en el cual los minerales con óxidos de hierro absorben energía. En el LANDSAT 8 estas bandas corresponden a las 7, 5 y 2. Se pretende poder detectar la combinación que nos da mayor información geológica en el LANDSAT 8 y ver cómo se pueden aprovechar esas nuevas bandas de información que proporciona.
ANÁLISIS DE IMÁGENES MULTIESPECTRALES

El análisis de imágenes multiespectrales por computador intenta detectar e identificar fenómenos importantes en una escena. Una vez identificados los fenómenos, son visualmente cuantificados y la información utilizada en la solución de un problema.
El análisis de las imágenes requiere del conocimiento de las características de los datos que contiene.

PROCESAMIENTO DIGITAL
Es posible almacenar en una computadora una imagen numérica resultado de una transformación hecha por el detector de la respuesta espectral de cada elemento de escena para producir una imagen digital escalizada. Como ya es conocido, la respuesta espectral de cada elemento de escena es captada por el sensor de acuerdo a la banda del espectro electromagnético para el cual esté calibrado. En realidad, lo que se hace es almacenar la respuesta espectral en varias bandas de una misma escena.

CARACTERIZACIÓN ESTADÍSTICA DE LAS IMÁGENES
Los datos contenidos en una imagen multiespectral proporcionan abundante información, sin embargo, para ello es necesario recurrir a la estadística para poder cuantificar y mejorar las características de la imagen.
Comúnmente se calculan histogramas, valores mínimos, medio y máximo, entropía, varianza, desviación típica, covarianza y coeficiente de correlación como parámetros fundamentales para caracterizar estadísticamente una imagen multiespectral

HISTOGRAMA DE UNA IMAGEN
Es la función que representa la frecuencia de ocurrencia de cada uno de los diferentes niveles de gris (valores radiométricos) en una imagen digital. Puede representarse en forma numérica o gráfica.
El rango de los valores discretos que puede tomar un pixel generalmente es ubicado en el eje de las abscisas, mientras que la frecuencia de ocurrencia de cada uno de estos valores es desplegada sobre las ordenadas.
Otra representación común del histograma es desplegar la frecuencia de aparición de cada uno de los valores radiométricos expresando su porcentaje con respecto al total y el porcentaje acumulado.
Antes de aplicar cualquier tipo de proceso a una imagen multiespectral, se acostumbra a calcular el histograma para cada una de las bandas lo que permite tener una idea de la calidad de los datos originales. Después de aplicar una técnica de mejoramiento se calcula de nuevo el histograma para documentar los efectos del proceso sobre la imagen original.








ENTROPIA
Es un parámetro que permite medir cuantitativamente la cantidad de información presente en una imagen. (Grado de desorden de los pixeles o nivel de utilización de los diferentes niveles de gris).
La entropía no tiene en cuenta la información que proviene de la distribución espacial de los pixeles.

VALOR MÍNIMO
Es el valor radiométrico (nivel de gris) más bajo encontrado en una imagen digital.

VALOR MÁXIMO
Es el valor radiométrico más alto encontrado en una imagen digital

MEDIA ARITMÉTICA.
La media expresa el promedio de los valores radiométricos de la imagen.
VARIANZA
Es una medida de dispersión o variación de los valores radiométricos de los pixeles de una imagen alrededor de su media. Si los valores tienden a concentrarse alrededor de la media la varianza es  pequeña, si los valores tienden a distribuirse lejos de la media, la varianza es grande.

COVARIANZA
Es una medida de la variación conjunta de los valores de los pixeles en ambas bandas alrededor de su media común.

COEFICIENTE DE CORRELACIÓN
Es una medida de la relación existente entre los valores de los pixeles de dos bandas.
El coeficiente de correlación toma valores que van entre - 1 y 1.
Un rxy = 1 indica una relación perfecta entre los valores radiométricos de los pixeles en las dos bandas (un incremento en el valor de un pixel en una banda, implica también un incremento igualmente proporcional en la otra banda. Sería el caso en el cual las dos bandas son iguales).
Un rxy = -1 indica que una banda está inversamente relacionada a la otra.
Un rxy = 0 sugiere que no existe alguna relación entre las dos bandas X e Y.
El que dos bandas estén relacionadas implica que existe redundancia en los datos de las bandas.
Si las dos bandas tienen un rxy = 0 significa que no existe ningún tipo redundancia en los datos de las bandas.
Los coeficientes rxy son usualmente almacenados en una matriz de correlación, que resume la relación entre bandas, esta matriz es simétrica con respecto a la diagonal, es decir que por ejemplo el coeficiente de correlación entre la banda con la banda 2 es igual al coeficiente de correlación entre banda 2 con banda.

MATRIZ VARIANZA COVARIANZA
La matriz de covarianza es uno de los más importantes conceptos matemáticos en el análisis de datos de sensores remotos, donde se observa si existe una correlación entre las respuestas en un par de bandas espectrales. La varianza y covarianza se acostumbran a representar en una matriz, donde la diagonal contiene los valores de la varianza y los elementos fuera de la diagonal serán grandes con respecto a los de la diagonal si existe mucha correlación. Pero si existe poca correlación, los elementos fuera de la diagonal serán cercanos a cero. Esta característica puede también ser observada en términos de la matriz de correlación.


PROCESAMIENTO DE IMÁGENES

Los sistemas de sensores remotos introducen algunos errores en el proceso de captación de datos. Estos errores afectan el análisis de las imágenes. Por esta razón es necesario pre procesar los datos captados por el sensor, antes de analizarlos.
La restauración de imágenes permite hacer correcciones de la distorsión, degradación y ruido introducido durante el proceso de captación de las imágenes.
Para corregir los datos de la imagen deben ser determinados los errores internos y externos. Los errores internos son originados por el sensor mismo, son generalmente sistemáticos (predecibles) y estacionarios (constantes).
Los errores externos son debidos a perturbaciones de la plataforma y a la variación de las características de la superficie.

DISTORSIONES Y CORRECCIONES RADIOMÉTRICAS
Las distorsiones radiométricas son las que afectan la radiometría de los objetos en la imagen.
Algunos de los problemas más frecuentes y el procedimiento para minimizarlos son:


Falta de una línea
El mal funcionamiento de un detector puede ocasionar que una línea de barrido aparezca con valores muy bajos o nulos, es decir que el sensor no capte información apareciendo en la imagen visual como una línea negra. La corrección a este error se logra sustituyendo la línea problema por el valor promedio de los pixeles correspondientes a la línea anterior y posterior.

Efectos atmosféricos
Los efectos atmosféricos en imágenes de sensores remotos son debidos especialmente a la atenuación que sufre la radiación en la atmósfera y la dispersión en dicha radiación. La dispersión es un fenómeno físico que se presenta al penetrar la radiación visible a la atmósfera, debido a que al chocar con las moléculas de aire y de aerosol, se dispersa en varias direcciones, de tal manera que una parte de esta puede ser desviada y nuevamente dirigida al espacio. Es claro que la dispersión guarda una relación con la longitud de onda, entre más pequeña la longitud de onda mayor será la dispersión. Por esta razón las imágenes multiespectrales presentan menos contraste en las bandas correspondientes al azul y al verde mientras aumenta en las bandas del infrarrojo.
Para corregir el efecto de este fenómeno, el método más sencillo consiste en comparar pixeles idénticos en todas las bandas.

 Los errores de distorsión también pueden ser corregidos usando métodos un poco más sofisticados basándose en estadísticas y en modelos de absorción y dispersión tomando parámetros como humedad relativa, visibilidad.


Ruidos
Se entiende por ruido cualquier señal no deseada dentro de una imagen. En imágenes de sensores remotos hay varios tipos de ruido, entre otros: ruido al azar, ruido aislado, ruido periódico y estacionario, ruido periódico pero no estacionario.
El ruido al azar se caracteriza por variaciones estadísticas de los niveles de gris pixel por pixel. Este ruido puede ser originado en la atmósfera o en los componentes electrónicos del sistema. Este tipo de ruido es independiente de la señal.

Error de medición de la irradiancia
Es un error inherente al sensor, ya que éste tiene una determinada precisión para medir la energía incidente, más allá de la cual el sensor no detecta señales diferentes. Este tipo de error resulta difícil de corregir por cuanto tendría que cambiarse la escala de valores radiométricos.

Saturación del detector
Un detector es sensible a un rango específico de radiación, fuera de este rango en sensor se satura. Es un error que sólo se presenta cuando se tienen objetos en tierra que presentan una alta reflectancia.

DISTORSIONES Y CORRECCIONES GEOMÉTRICAS

Distorsión por rotación de la tierra
Esta distorsión se presenta porque la mayoría de las imágenes de sensores remotos son registradas en forma continua y en el lapso de  tiempo durante el cual se forma la imagen, la tierra se ha desplazado debido a su rotación. Esta es una distorsión geométrica sistemática pero no es constante, ya que el desplazamiento depende de la latitud (a menor latitud mayor desplazamiento). Por ejemplo, las imágenes Landsat con las que trabajaremos deben ser corregidas y por esta razón tienen forma de paralelogramo. Esta corrección se hace aplicando algoritmos que logren desplazar grupos de pixeles hacia una nueva dirección.
Dado que es una distorsión determinística se corrige calculando la velocidad relativa entre la tierra y el satélite.

 Distorsión panorámica
A medida que se aleja la línea del nadir el tamaño del pixel aumenta. Este tipo de distorsión se corrige sólo cuando se tiene control terrestre adecuado y se hace a través del llamado Algoritmo de expansión.

Efecto de la curvatura terrestre
Afecta el tamaño del pixel por cuanto a medida que se aleja del nadir el campo de vista instantáneo el mayor


MEJORAMIENTO DE IMÁGENES
Mejorar una imagen consiste en ejecutar un procesamiento numérico para realzar, enfatizar o suprimir características de la imagen. En este procesamiento se incluye el mejoramiento del contraste entre objetos, énfasis en límites entre los diferentes tipos de cobertura terrestre y también sirve para suprimir características no deseadas en la imagen.
Se han desarrollado diversas técnicas que de acuerdo al tipo de operación que ejecuta sobre el pixel se pueden clasificar en puntuales y locales. El valor del pixel en la primera es modificado en forma independiente de los demás y en la segunda depende del valor que tengan los pixeles vecinos.


MEJORAMIENTO DEL CONTRASTE
Consiste en la aplicación de procedimientos que realzan el contraste visual en la imagen. Se utiliza una función definida por el usuario.

TRATAMIENTO CONJUNTO DE BANDAS
Trabajar con bandas individuales proporciona resultados útiles en la interpretación, sin embargo, es posible mejorar estos resultados cuando se incorpora información proveniente de varias bandas en forma simultánea por cuanto existe un mayor aporte de datos. Es aquí donde las imágenes multiespectrales demuestran su potencialidad para generar nuevas imágenes que recogen el resultado de un análisis conjunto de datos que aunque aparentemente se encuentra desmembrado en diferentes bandas del espectro, tiene una relación estrecha, que como tal debe ser aprovechada. El tratamiento conjunto de las bandas como tal, no implica que se tenga que trabajar con todas las bandas disponibles, sino con aquellas que están menos correlacionadas con el fin de que el aporte de información sea más significativo.

Existen múltiples operaciones que se pueden aplicar a las bandas entre ellas operaciones matemáticas, como adición, sustracción, producto, división y algunas combinaciones de las anteriores como el caso de índice de vegetación. Otras operaciones son las de tipo lógico, entre las cuales se encuentra la composición a color. También se pueden aplicar a las imágenes cierto tipo de transformaciones que facilitan el análisis de los datos, entre ellas están las transformada de Karhunen-Loeve y la transformada de Fourier, muy utilizadas en imágenes de sensores remotos.

COMPOSICIÓN EN COLOR
Los monitores de los computadores despliegan los colores basados solamente en tres colores primarios el rojo, verde y azul, con los cuales construye otra serie de colores, que dependen del porcentaje que aporte cada uno de ellos.
La composición en color es un proceso mediante el cual se crea una nueva imagen basado en la combinación de 3 bandas.
En general este proceso se conoce como composición en falso color debido a que el resultado difiere de los colores naturales, ya sea porque el monitor no alcanza el número de colores, o porque no hay una correspondencia entre el rango de frecuencias de la banda asignada y el color que está representando su aporte.

ANÁLISIS EN COMPONENTES PRINCIPALES

También denominado factor KL o Transformador Karhunen-Locue. Tiene un significado especial en el análisis de datos de Sensores Remotos. La transformación de los datos usando CP puede resaltar imágenes en una nueva componente principal que a menudo son más fáciles de interpretar que los datos originales.

Para ejecutar la descomposición en CP, se aplica una transformación al conjunto de datos correlacionados, es decir eliminando la redundancia de información y correlación entre bandas, se consigue la reducción en la dimensionalidad de la imagen multiespectral.
La posición de un pixel en un espacio multiespectral puede ser descrita por vectores cuyos componentes son respuestas espectrales en cada banda.

CLASIFICACIÓN DE IMÁGENES MULTIESPECTRALES
Es posible analizar datos captados por sensores remotos de la tierra y extraer información temática útil. Uno de los métodos más utilizados para la extracción de información es la Clasificación Multiespectral. Este procedimiento asume que la imagen de un área geográfica específica es agrupada en múltiples regiones del espectro electromagnético y que están registradas en las imágenes.
La clasificación multiespectral es un concepto del procesamiento digital de imágenes que contempla los procedimientos mediante los cuales un computador puede agrupar los pixeles de una imagen de acuerdo a categorías o clases dentro de un espacio multiespectral. Este proceso incluye la determinación de un criterio de decisión que pueda usar un computador para asignar a un objeto determinado una clase específica con base en reglas de clasificación.
Existen dos enfoques principales para la determinación de las características espectrales de todos los tipos de cobertura del terreno en los cuales se clasifican los datos y estos son el método supervisado y el no supervisado.

CLASIFICACIÓN SUPERVISADA
Dentro de la clasificación supervisada la identidad y localización de algunos de los tipos de cobertura tanto urbana, agrícola y forestal son conocidos a priori a través de una combinación de trabajos de campo, análisis de fotografías aéreas, mapas y experiencias personales. Los análisis previos para localizar sitios específicos en los datos de sensores remotos, que representan ejemplos homogéneos de éstas, son comúnmente conocidos como áreas de entrenamiento en razón de que las características espectrales de estas áreas conocidas son utilizadas para "entrenar" un algoritmo de clasificación. Los parámetros estadísticos multivariados (media, desviación estándar, matriz de covarianza, matriz de correlación) son calculados para cada sitio de entrenamiento, para luego evaluar cada pixel de la imagen, compararlo y asignarlo a una respectiva clase.

Los principales aspectos que deben considerarse para orientar una clasificación supervisada son:
1.      Adoptar un esquema de clasificación ordenado.
2.      Seleccionar áreas de entrenamiento representativas.
3.      Extraer las estadísticas de los datos espectrales del área de entrenamiento
4.      Analizar las estadísticas para seleccionar los datos que ofrezcan mayores ventajas (bandas) en el proceso de clasificación.
5.      Seleccionar el algoritmo de clasificación adecuado
6.      Clasificar la imagen en n clases
7.      Evaluar estadísticamente la exactitud de la clasificación

En este análisis se pueden utilizar mapas temáticos, fotografías aéreas, trabajos de campo, experiencia previa, etc.

Selección de algoritmos apropiados para la clasificación supervisada
Muchos algoritmos fueron propuestos para responder a la pregunta de cómo asociar un punto desconocido con cada información de clase.
Para escoger un algoritmo particular o regla de decisión, se debe tener en cuenta la naturaleza de los datos de entrada y lo que se desea obtener como resultado.
Los algoritmos de clasificación paramétricos asumen que las medidas de los vectores observados Xc obtenidos para cada clase, en cada banda espectral en la zona de entrenamiento de la clasificación supervisada son de naturaleza
Gaussiana (es decir, están normalmente distribuidos). Los algoritmos de clasificación no paramétricos no asumen esta situación. Esta es una regla para revisar la lógica de algunos de los clasificadores.
Entre los clasificadores más frecuentemente usados están los de: Paralelepípedo, distancia mínima y máxima verosimilitud.

Máxima probabilidad
El clasificador de máxima verosimilitud evalúa cuantitativamente la varianza y correlación de la respuesta espectral del patrón de la muestra de entrenamiento cuando clasifica un pixel desconocido. Para realizar esto se asume que la distribución de los puntos de una categoría de una zona de entrenamiento es
Gaussiana (es decir, que su distribución es normal). Esto es razonable generalmente para distribuciones espectrales de clases de entrenamiento comunes. En consecuencia, la misma puede ser descrita por medio del vector promedio y la materia de parámetros de covarianza.
El principal inconveniente del clasificador de máxima verosimilitud es el gran número de cómputos que se requieren para clasificar cada pixel. Esta complejidad hace que el proceso de clasificación sea lento y más costoso que las técnicas más sencillas. Mientras más costosa sea la técnica de clasificación de máxima verosimilitud, es generalmente de mayor exactitud.
Intuitivamente pareciera que cuando se utiliza un mayor número de bandas en un clasificador de máxima verosimilitud, el resultado de la clasificación es mejor.
Pero generalmente, hay un número óptimo relativamente pequeño que se utiliza.
Pues al aumentarse el número de bandas, el tiempo computacional requerido dada la gran cantidad de cálculos involucrados, aumenta y también porque el contenido de la información puede estar contaminada por información insignificante en otras bandas.
Este problema es particularmente crítico, cuando se utilizan un número grande de bandas espectrales correlacionadas. Se ha encontrado en algunos casos que la exactitud del clasificador de máxima verosimilitud comienza a decaer cuando se utilizan más de cuatro o cinco bandas espectrales, es beneficioso el considerar un subconjunto de las bandas más representativas.
La decisión sobre cuál de las bandas se debe utilizar se basa en un proceso llamado selección de rasgos o características. En este proceso se evalúan muchos subconjuntos de bandas para así determinar cuál combinación es más útil para discriminar las categorías de intereses y el análisis de la clasificación se limita a ese conjunto de bandas.

CLASIFICACIÓN NO SUPERVISADA
En este método los tipos de cobertura no se conocen bien porque falta trabajo de campo o porque las características espectrales de la superficie no están claramente definidas en la imagen. El computador es orientado para que agrupe (cluster) los pixeles en diferentes clases de acuerdo con un cierto criterio estadístico.
En este enfoque los parámetros estadísticos que determinan las clases de entrenamiento se determina mediante la selección de campos heterogéneos que contienen tantas relaciones espectrales diferentes como sean posibles y entonces se usa un algoritmo aglutinante para agrupar automáticamente los pixeles de características espectrales similares en un número de clases de grupos separables espectralmente. No se requiere conocer a priori la identidad del agrupamiento (entrenamiento) y quizás una de las características más importantes de este método es que no solo determina los tipos de cobertura pura del terreno, en una zona, sino también las clases mezcladas que se presentan usualmente en un grupo de datos Landsat. Por consiguiente, se obtiene una representación más cercana de los agrupamientos espectrales naturales de una zona mediante el enfoque no supervisado.

Evaluación de los resultados de la clasificación
Para que una clasificación multiespectral sea de utilidad práctica es necesario determinar su exactitud y confiabilidad. Usando el análisis numérico es posible evaluar cuantitativamente el grado de exactitud de una clasificación multiespectral.

Una imagen es una señal y su análisis es también parte de nuestra carrera. Para lograr el objetivo planteado se utilizarán diversas herramientas de Procesos Estocásticos, Señales y Sistemas, Comunicaciones Digitales, etc. Entre estas herramientas se pueden enunciar las siguientes:
Transformada discreta, rápida y continua de Fourier.
Transformada Karhunen-Loeve (KL)
Una imagen multiespectral podría modelarse como un conjunto de procesos aleatorios conjuntamente gaussianos.
Filtrado de Bandas y sub-bandas.
Funciones de correlación y auto correlación.
Transformadas Espectral-Espacial y Espacial-Espectral.
Transformada Espacial-Espectral Compleja.
Transformada Z, y muchas más herramientas.
First-order Gauss Markov random field model.


11.                     Procedimiento


1.      Obtención de las imágenes satelitales
Esta sección abarca instrucciones sobre cómo adquirir imágenes de alta resolución LANDSAT 8 de cualquier área en el mundo.
La aplicación Google Earth facilita este proceso. Instalando Google Earth fue el primer paso. En su sitio web, USGS provee un archivo .kml (Imagen 1) que provee anotación geográfica para programas de vista satelital, como es Google Earth.
Imagen 3. Fuente del archivo .kml en el sitio web de USGS.
Imagen 4.  Archivo .kml obtenido del sitio web USGS, y descargado.

Abrir este archivo .kml con Google Earth muestra un overlay, o capa, por encima de la vista satelital de la aplicación, la cual identifica la imagen satelital correspondiente a esa área en específico (Imagen 3).
Imagen 5. Identificador de imagen satelital (Path 7, Row 47) para fines de descarga de la misma.
Se necesita hacer click en el recuadro identificador etiquetado “Path 7, Row 47” (Imagen 4), lo cual abrirá una ventana con detallada información sobre la imagen satelital que estaremos descargando.



Imagen 6. Ventana de información sobre opciones de descarga de imágenes Landsat.
Esta nueva ventana provee cuatro (4) opciones (:
·         Ver imagen [satelital] en el mapa [de Google Earth]
·         Descargar Imagen Landsat para vista rápida (jpeg 5 mb)
·         Descargar productos adicionales (requiere registración)
·         Buscar otras imágenes L8 sobre las coordenadas actuales Path 7 Row 47





Imagen 7. Opciones de descarga de imágenes Landsat 8.
Previo a descargar las imágenes, nos pide ingresar a la página web USGS con nombre de usuario y contraseña (Imagen 6).

Imagen 8. Página de ingreso de usgs.gov.
Ingresamos nuestro usuario y contraseña deseada en los campos definidos (Imagen 7).

Imagen 9.  Ingreso de usuario y contraseña en la página usgs.gov.
En el segundo paso, nos muestra que ingrese información de uso de la data. Esto es, que ingresara información sobre cómo usaremos la información descargada (Imagen 8).
Imagen 10. Información de uso de la data, requerido en el proceso de registración del sitio web usgs.gov.

El tercer y penúltimo paso, nos pide nuestra información personal, como se nota en la imagen siguiente (Imagen 9).

Imagen 11. Ingresando información de usuario en el proceso de registración del sitio web usgs.gov.

Al confirmar la información ingresada, nos encontramos logueados a la página usgs.gov.
Imagen 12. Ya ingresado al sistema de usgs.gov.
Regresando a los pasos descritos en la Imagen 4 y la Imagen 5, donde nos muestra el recuadro de la imagen Landsat que queremos descargar, le damos click nuevamente al enlace “Search for more L8 Images over Path 7 Row 7”, el cual nos muestra un formulario de búsqueda, y nos permite buscar dentro de un rango de días en específico.

Optamos por bajar la imagen con fecha más reciente que estaba disponible en el servidor, la cual está compuesta por doce (12) bandas y un archivo de texto de metadata, la cual está relacionada a la imagen descargada (Imagen 11).

Imagen 13. Imagen multiespectral Landsat 8 con sus respectivas bandas, y un archivo texto que contiene información meta (meta-data), la cual describe parámetros y condiciones relacionadas a la imagen.

DEFINICIONES DE TÉRMINOS DEL ARCHIVO METADATA

El archivo meta-data contiene una estructura la cual está dividida en grupos y subgrupos (grupos padres y grupos hijos) de información. El grupo raíz, llamado “L1_METADATA_FILE” contiene los demás grupos dentro de él.

GROUP = L1_METADATA_FILE

// El primer subgrupo es nombrado “METADATA_FILE_INFO”, y contiene información básica de información del archivo, tal como el origen de la imagen, que en el caso de la imagen LandSat 8 es la USGS; también se encuentra la variable de número de identificación, fecha de captura, y versión de software de procesamiento.

  GROUP = METADATA_FILE_INFO
    ORIGIN = "Image courtesy of the U.S. Geological Survey"
    REQUEST_ID = "0101402106818_00001"
    LANDSAT_SCENE_ID = "LC80070472013359LGN00"
    FILE_DATE = 2014-02-10T16:58:38Z
    STATION_ID = "LGN"
    PROCESSING_SOFTWARE_VERSION = "LPGS_2.3.0"
  END_GROUP = METADATA_FILE_INFO


// Dentro del grupo llamado “PRODUCT_METADATA”, observamos que nos provee información relacionada con tipos de formato de las bandas de la imagen multiespectral, y los nombres asociados a estas bandas.


  GROUP = PRODUCT_METADATA
    DATA_TYPE = "L1T"
    ELEVATION_SOURCE = "GLS2000"
    OUTPUT_FORMAT = "GEOTIFF"
    SPACECRAFT_ID = "LANDSAT_8"
    SENSOR_ID = "OLI_TIRS"
    WRS_PATH = 7
    WRS_ROW = 47
    NADIR_OFFNADIR = "NADIR"
    TARGET_WRS_PATH = 7
    TARGET_WRS_ROW = 47
    DATE_ACQUIRED = 2013-12-25
    SCENE_CENTER_TIME = 15:04:01.6130145Z
    CORNER_UL_LAT_PRODUCT = 19.83130
    CORNER_UL_LON_PRODUCT = -70.87242
    CORNER_UR_LAT_PRODUCT = 19.84085
    CORNER_UR_LON_PRODUCT = -68.68675
    CORNER_LL_LAT_PRODUCT = 17.72026
    CORNER_LL_LON_PRODUCT = -70.84924
    CORNER_LR_LAT_PRODUCT = 17.72872
    CORNER_LR_LON_PRODUCT = -68.69064
    CORNER_UL_PROJECTION_X_PRODUCT = 303900.000
    CORNER_UL_PROJECTION_Y_PRODUCT = 2193900.000
    CORNER_UR_PROJECTION_X_PRODUCT = 532800.000
    CORNER_UR_PROJECTION_Y_PRODUCT = 2193900.000
    CORNER_LL_PROJECTION_X_PRODUCT = 303900.000
    CORNER_LL_PROJECTION_Y_PRODUCT = 1960200.000
    CORNER_LR_PROJECTION_X_PRODUCT = 532800.000
    CORNER_LR_PROJECTION_Y_PRODUCT = 1960200.000
    PANCHROMATIC_LINES = 15581
    PANCHROMATIC_SAMPLES = 15261
    REFLECTIVE_LINES = 7791
    REFLECTIVE_SAMPLES = 7631
    THERMAL_LINES = 7791
    THERMAL_SAMPLES = 7631
    FILE_NAME_BAND_1 = "LC80070472013359LGN00_B1.TIF"
    FILE_NAME_BAND_2 = "LC80070472013359LGN00_B2.TIF"
    FILE_NAME_BAND_3 = "LC80070472013359LGN00_B3.TIF"
    FILE_NAME_BAND_4 = "LC80070472013359LGN00_B4.TIF"
    FILE_NAME_BAND_5 = "LC80070472013359LGN00_B5.TIF"
    FILE_NAME_BAND_6 = "LC80070472013359LGN00_B6.TIF"
    FILE_NAME_BAND_7 = "LC80070472013359LGN00_B7.TIF"
    FILE_NAME_BAND_8 = "LC80070472013359LGN00_B8.TIF"
    FILE_NAME_BAND_9 = "LC80070472013359LGN00_B9.TIF"
    FILE_NAME_BAND_10 = "LC80070472013359LGN00_B10.TIF"
    FILE_NAME_BAND_11 = "LC80070472013359LGN00_B11.TIF"
    FILE_NAME_BAND_QUALITY = "LC80070472013359LGN00_BQA.TIF"
    METADATA_FILE_NAME = "LC80070472013359LGN00_MTL.txt"
    BPF_NAME_OLI = "LO8BPF20131225145305_20131225153629.02"
    BPF_NAME_TIRS = "LT8BPF20131225144911_20131225153722.02"
    CPF_NAME = "L8CPF20131001_20131231.04"
    RLUT_FILE_NAME = "L8RLUT20130211_20431231v09.h5"
  END_GROUP = PRODUCT_METADATA


 En el grupo llamado “IMAGE_ATTRIBUTES”, se encuentra información imprescindible sobre las variables que se estarán utilizando en la parte de pre-procesamiento y procesamiento de la imagen final. Entre estas variables se destaca la información de la variable del ángulo Azimut (SUN_AZIMUTH), el cual se mide en sentido horario desde el Norte; el ángulo de elevación del sol (SUN_ELEVATION), y la distancia desde el sol y la tierra (EARTH_SUN_DISTANCE). En el caso del ángulo Zenit, el cual la imagen Landsat no provee, se calcula con la fórmula siguiente:

,
donde  representa el ángulo Zenit, y  el ángulo de elevación del sol.


Figura 2. Descripción detallada de los ángulos Azimut, de elevación, y de Zenit.

  GROUP = IMAGE_ATTRIBUTES
    CLOUD_COVER = 8.16
    IMAGE_QUALITY_OLI = 9
    IMAGE_QUALITY_TIRS = 9
    ROLL_ANGLE = -0.001
    SUN_AZIMUTH = 150.09884705
    SUN_ELEVATION = 41.95373804
    EARTH_SUN_DISTANCE = 0.9835172
    GROUND_CONTROL_POINTS_MODEL = 254
    GEOMETRIC_RMSE_MODEL = 7.579
    GEOMETRIC_RMSE_MODEL_Y = 5.906
    GEOMETRIC_RMSE_MODEL_X = 4.750
    GROUND_CONTROL_POINTS_VERIFY = 75
    GEOMETRIC_RMSE_VERIFY = 4.300
  END_GROUP = IMAGE_ATTRIBUTES


// Otro conjunto importante de datos que serán utilizados en el pre-procesamiento de las imágenes LandSat8 son los del grupo llamado “MIN_MAX_RADIANCE”, cuya información representa los niveles mínimo y máximo de Radiancia encontrados para cada banda de la imagen multiespectral.


  GROUP = MIN_MAX_RADIANCE
    RADIANCE_MAXIMUM_BAND_1 = 785.75189
    RADIANCE_MINIMUM_BAND_1 = -64.88765
    RADIANCE_MAXIMUM_BAND_2 = 804.61951
    RADIANCE_MINIMUM_BAND_2 = -66.44574
    RADIANCE_MAXIMUM_BAND_3 = 741.45001
    RADIANCE_MINIMUM_BAND_3 = -61.22918
    RADIANCE_MAXIMUM_BAND_4 = 625.23242
    RADIANCE_MINIMUM_BAND_4 = -51.63190
    RADIANCE_MAXIMUM_BAND_5 = 382.61105
    RADIANCE_MINIMUM_BAND_5 = -31.59615
    RADIANCE_MAXIMUM_BAND_6 = 95.15189
    RADIANCE_MINIMUM_BAND_6 = -7.85767
    RADIANCE_MAXIMUM_BAND_7 = 32.07128
    RADIANCE_MINIMUM_BAND_7 = -2.64846
    RADIANCE_MAXIMUM_BAND_8 = 707.59100
    RADIANCE_MINIMUM_BAND_8 = -58.43310
    RADIANCE_MAXIMUM_BAND_9 = 149.53308
    RADIANCE_MINIMUM_BAND_9 = -12.34849
    RADIANCE_MAXIMUM_BAND_10 = 22.00180
    RADIANCE_MINIMUM_BAND_10 = 0.10033
    RADIANCE_MAXIMUM_BAND_11 = 22.00180
    RADIANCE_MINIMUM_BAND_11 = 0.10033
  END_GROUP = MIN_MAX_RADIANCE


  GROUP = MIN_MAX_REFLECTANCE
    REFLECTANCE_MAXIMUM_BAND_1 = 1.210700
    REFLECTANCE_MINIMUM_BAND_1 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_2 = 1.210700
    REFLECTANCE_MINIMUM_BAND_2 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_3 = 1.210700
    REFLECTANCE_MINIMUM_BAND_3 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_4 = 1.210700
    REFLECTANCE_MINIMUM_BAND_4 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_5 = 1.210700
    REFLECTANCE_MINIMUM_BAND_5 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_6 = 1.210700
    REFLECTANCE_MINIMUM_BAND_6 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_7 = 1.210700
    REFLECTANCE_MINIMUM_BAND_7 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_8 = 1.210700
    REFLECTANCE_MINIMUM_BAND_8 = -0.099980
    REFLECTANCE_MAXIMUM_BAND_9 = 1.210700
    REFLECTANCE_MINIMUM_BAND_9 = -0.099980
  END_GROUP = MIN_MAX_REFLECTANCE
  GROUP = MIN_MAX_PIXEL_VALUE
    QUANTIZE_CAL_MAX_BAND_1 = 65535
    QUANTIZE_CAL_MIN_BAND_1 = 1
    QUANTIZE_CAL_MAX_BAND_2 = 65535
    QUANTIZE_CAL_MIN_BAND_2 = 1
    QUANTIZE_CAL_MAX_BAND_3 = 65535
    QUANTIZE_CAL_MIN_BAND_3 = 1
    QUANTIZE_CAL_MAX_BAND_4 = 65535
    QUANTIZE_CAL_MIN_BAND_4 = 1
    QUANTIZE_CAL_MAX_BAND_5 = 65535
    QUANTIZE_CAL_MIN_BAND_5 = 1
    QUANTIZE_CAL_MAX_BAND_6 = 65535
    QUANTIZE_CAL_MIN_BAND_6 = 1
    QUANTIZE_CAL_MAX_BAND_7 = 65535
    QUANTIZE_CAL_MIN_BAND_7 = 1
    QUANTIZE_CAL_MAX_BAND_8 = 65535
    QUANTIZE_CAL_MIN_BAND_8 = 1
    QUANTIZE_CAL_MAX_BAND_9 = 65535
    QUANTIZE_CAL_MIN_BAND_9 = 1
    QUANTIZE_CAL_MAX_BAND_10 = 65535
    QUANTIZE_CAL_MIN_BAND_10 = 1
    QUANTIZE_CAL_MAX_BAND_11 = 65535
    QUANTIZE_CAL_MIN_BAND_11 = 1
  END_GROUP = MIN_MAX_PIXEL_VALUE
  GROUP = RADIOMETRIC_RESCALING
    RADIANCE_MULT_BAND_1 = 1.2980E-02
    RADIANCE_MULT_BAND_2 = 1.3292E-02
    RADIANCE_MULT_BAND_3 = 1.2248E-02
    RADIANCE_MULT_BAND_4 = 1.0328E-02
    RADIANCE_MULT_BAND_5 = 6.3205E-03
    RADIANCE_MULT_BAND_6 = 1.5718E-03
    RADIANCE_MULT_BAND_7 = 5.2980E-04
    RADIANCE_MULT_BAND_8 = 1.1689E-02
    RADIANCE_MULT_BAND_9 = 2.4702E-03
    RADIANCE_MULT_BAND_10 = 3.3420E-04
    RADIANCE_MULT_BAND_11 = 3.3420E-04
    RADIANCE_ADD_BAND_1 = -64.90063
    RADIANCE_ADD_BAND_2 = -66.45903
    RADIANCE_ADD_BAND_3 = -61.24143
    RADIANCE_ADD_BAND_4 = -51.64222
    RADIANCE_ADD_BAND_5 = -31.60247
    RADIANCE_ADD_BAND_6 = -7.85925
    RADIANCE_ADD_BAND_7 = -2.64899
    RADIANCE_ADD_BAND_8 = -58.44479
    RADIANCE_ADD_BAND_9 = -12.35096
    RADIANCE_ADD_BAND_10 = 0.10000
    RADIANCE_ADD_BAND_11 = 0.10000
    REFLECTANCE_MULT_BAND_1 = 2.0000E-05
    REFLECTANCE_MULT_BAND_2 = 2.0000E-05
    REFLECTANCE_MULT_BAND_3 = 2.0000E-05
    REFLECTANCE_MULT_BAND_4 = 2.0000E-05
    REFLECTANCE_MULT_BAND_5 = 2.0000E-05
    REFLECTANCE_MULT_BAND_6 = 2.0000E-05
    REFLECTANCE_MULT_BAND_7 = 2.0000E-05
    REFLECTANCE_MULT_BAND_8 = 2.0000E-05
    REFLECTANCE_MULT_BAND_9 = 2.0000E-05
    REFLECTANCE_ADD_BAND_1 = -0.100000
    REFLECTANCE_ADD_BAND_2 = -0.100000
    REFLECTANCE_ADD_BAND_3 = -0.100000
    REFLECTANCE_ADD_BAND_4 = -0.100000
    REFLECTANCE_ADD_BAND_5 = -0.100000
    REFLECTANCE_ADD_BAND_6 = -0.100000
    REFLECTANCE_ADD_BAND_7 = -0.100000
    REFLECTANCE_ADD_BAND_8 = -0.100000
    REFLECTANCE_ADD_BAND_9 = -0.100000
  END_GROUP = RADIOMETRIC_RESCALING
  GROUP = TIRS_THERMAL_CONSTANTS
    K1_CONSTANT_BAND_10 = 774.89
    K1_CONSTANT_BAND_11 = 480.89
    K2_CONSTANT_BAND_10 = 1321.08
    K2_CONSTANT_BAND_11 = 1201.14
  END_GROUP = TIRS_THERMAL_CONSTANTS
  GROUP = PROJECTION_PARAMETERS
    MAP_PROJECTION = "UTM"
    DATUM = "WGS84"
    ELLIPSOID = "WGS84"
    UTM_ZONE = 19
    GRID_CELL_SIZE_PANCHROMATIC = 15.00
    GRID_CELL_SIZE_REFLECTIVE = 30.00
    GRID_CELL_SIZE_THERMAL = 30.00
    ORIENTATION = "NORTH_UP"
    RESAMPLING_OPTION = "CUBIC_CONVOLUTION"
  END_GROUP = PROJECTION_PARAMETERS
END_GROUP = L1_METADATA_FILE
END


Preprocesamiento
Bandas a pre-procesar:
Para nuestro objetivo de detección de minerales se trabajará en el preprocesamiento de las bandas 2, 3, 4, 5, 6, 7 y 9 de las 11 bandas con las que se cuenta en una imagen multiespectral del LANDSAT 8.
Banda 1: Fue añadida a petición de investigadores del color del océano para aplicaciones marítimas. (http://landsat.gsfc.nasa.gov/pdf_archive/20101119_LDCMbrochure.pdf) No será útil para nuestros fines.
Banda 8: Una escena NIR Landsat 8 en la banda 8 prácticamente no posee valores de reflectancia por encima de cero y ninguna escena de las preprocesadas present valores de reflectancia mayores a 0, 01(1%) que es la reflectancia mínima realista. Por tal motivo esta banda se dejó tal cual como fue recibida.
Bandas 10 y 11: Estas Bandas corresponden al infrarrojo de longitude de onda larga. Son captadas con un sensor de infrarrojo termal y usadas para aplicaciones donde la temperatura es una variable influyente. Para nuestro objetivo no seran  utilizadas por lo que no fueron preprocesadas.
Corrección Radiométrica de la Imagen                
 Debido a que el satélite con el sensor se encuentra situado a una altura de unos 705 Km, la respuesta radiométrica que le llega desde la superficie se modifica a consecuencia de su paso por la atmósfera. Uno de los efectos más importantes de la atmósfera en las radiaciones visibles e infrarrojas próximas es debido a la dispersión producida por las moléculas de los gases (dispersión de Rayleigh). (Ver marco teórico).
Tres mecanismos de corrección Radiométrica han sido aplicados a la imagen a procesar:
1.      Histogram Minimum Method
2.      DOS
3.      COST
Histogram Minimum Method (Campbell, 1987)
En primera instancia se procedió a hacer una mejora a la imagen tomando en cuenta solo los valores oscuros en esta. Se eligió un valor mayor a por lo menos 100 números digitales(DN) en la imagen usando la parte baja del  histograma de cada banda.
Imagen 14. Histograma banda 5 (NIR) realizado en MATLAB
Este método se limita a substraer en cada banda el valor mínimo observado, ya que se supone que en una escena siempre pueden existir algunos pixeles en sombra total, que en ausencia de atmósfera no recibirían ni deberían reflejar ninguna energía de procedencia solar.
Imagen 15. Banda 2 como se recibió del satélite
Imagen 16. Banda 2 preprocesada con el método de los valores mínimos del histograma.

Los resultados no fueron los mejores debido a que no se tomaron en cuenta elementos que afectan la imagen como lo es el ángulo de elevación entre el satélite y el sol al momento de la toma de la imagen y la distancia de la Tierra al Sol ese día.
Imagen 17. Calculando Scatter, imagen de gisagmaps.
La reflectancia es la relación entre la cantidad de radiación total reflejada y la cantidad de radiación total que entra gracias a la influencia del sol.
DOS (Dark Object Subtraction)
Partimos de la ecuación de reflectancia propuesta por Chávez en 1988


Lsatrad es la radiancia en el sensor del satélite. Las imágenes de los satélites Landsat presentan los valores de los pixels en format de números digitales (DN). Estos valores van desde 0 hasta 65535. Los DNs se deben convertir a radiancia esto se hace con en una ecuación basada en algunos valores presents en el archive .MTL suministrado por la NASA (específicamente la USGS) junto con la imagen. La ecuación suministrada por la USGS para este objetivo es la siguiente:
Donde,
: Radiancia spectral (Watt/(m2 *Rad*um))
ML: Factor de re-escalamiento multiplicativo de cada banda (RADIANCE_MULT_BAND_x, donde x es la banda a preprocesar)
Qcal : Valor del pixel cuantizado y calibrado (DN).
AL: Factor de re-escalamiento aditivo de cada banda (RADIANCE_ADD_BAND_x, donde x es la banda a preprocesar)

Lhaze1%rad: Este componente representa la cantidad de radiación que se incrementa de forma incorrecta debido a los efectos de la distorsión atmosférica. Como la radiación solar viaja por el espacio, atraviesa la atmosfera terrestre y hay partículas en esta que reflejan luz al sensor del satélite, aumentando de forma errónea el valor de radiancia real. La teoría detrás de este método es que en una escena cualquiera e Landsat con millones de pixeles debería haber por lo menos algunos que no reflejen ninguna radiancia (que sean negros) y que el valor de dicho pixel es mayor que cero debido al efecto de dispersión atmosférica. Sin embargo debido a que muy pocos objetos en la superficie de la tierra son absolutamente negros Chávez en 1996 demostró que una reflectancia mínima del 1 por ciento es mejor que la del cero por ciento.

Hay varios métodos para elegir el valor de dispersión que debería ser el de reflectancia de 0%. Nosotros utilizamos el método del valor mínimo del histograma descrito anteriormente eligiendo el valor de pixel número 100 ordenados de menor a mayor y despreciando los ceros.
Despejando de la ecuación original:
TAUz es asumido como 1 para Landsat para fines de corrección atmosférica por lo que no afectará el resultado y no es necesario tomarlo en cuenta.

Los valores de ESUN son proporcionados por la USGS y son los siguientes:
d2: Cuadrado de la distancia de la tierra al sol al momento en que se tomó la imagen.
: Coseno del ángulo zenith o lo que es lo mismo coseno de 90 grados menos el Angulo de elevación entre la tierra y el sol.
Π = 3.14159265.
COST
COST fue una mejora realizada por Chávez en el 1996 a el método DOS incluyendo un factor en la ecuación para para aumentar el valor de reflectancia real ya que se dió cuenta que DOS permitía valores de reflectancia menores que los reales en Landsat 5 y 7. La ecuación para reflectancia del COST es:


Para Landsat, TAUz coincide con  por lo que la ecuación resultante sería:






Conclusiones en la parte de pre-procesamiento
COST ha sido el algoritmo que ha funcionado mejor para la corrección de imágenes de LANDSAT 5 y LANDSAT 7. COST se trata realmente de una mejora de DOS hecha en 1996 por Chávez a el algoritmo de corrección que hasta ese momento daba mejores resultados, el DOS(Dark Object Substraction). Para la mejora Chávez agregó un factor de coseno del angulo Zenith (Ver Marco Teórico). La razón de esto era que el modelo de DOS calculaba valores de reflectancia mayore a los reales en cada pixel de cada banda. Con ese factor coseno en el COST se mejora el cálculo de reflectacia y los valores son más precisos.
En nuestro caso trabajamos con Landsat 8. De este satélite hay pocos estudios realizados (En la base de datos de la IEEE solo hay dos papers relacionados a Landsat 8 al momento de redacción de este documento) y no se puede asumir que los modelos de LANDSAT 7 y Landsat 5 se adaptan igual a las nuevas imágenes.
Se implementaron las tres técnicas de preprocesamiento. Los resultados se muestran a continuacion:
Imagen 18 Imagen como fue recibida de Landsat 8
Imagen 19 Imagen RGB por el método de los valores mínimos del histograma

Imagen 20 Imagen preprocesada con DOS
Imagen 21. Imagen preprocesada con COST
Al observar las imágenes resultantes con DOS y COST en RGB (Se presenta el RGB para ver las diferencias en los resultados) se observa que los resultados del DOS parecen ser mucho mejores que los del COST en cuya imagen se pierden muchos detalles y se va gran parte a negro. El peor método es el de los valores mínimos del histograma como se esperaba.
La imagen anterior explica el hecho de que para Landsat 8 la corrección radiométrica usando DOS (Chávez 1988) sea mejor que usando COST(Chávez 1996). El punto es que Landsat 8 sensa valores de longitud de onda del espectro electromagnetico más altos. Si recurrimos a la naturaleza fotónica de la luz obsevaremos que la física cuántica explica que a longitudes de onda menores hay mayor energía por lo que la reflectancia será mayor. Como el factor coseno del ángulo Zenith introducido en COST aumenta los valores en el cálculo de la reflectancia, al Landsat 8 tener valores de reflectancia menor COST producirá imágenes con valores de números digitales más pequeños (oscuros) que los reales.
El grupo de estudio de ArcGis concuerda con nuestra conclusión. Ellos afirman que basados en los valores de reflectancia principalmente de las bandas en infrarrojo DOS debería ser el método de corrección atmosférica utilizado para Landsat 8.






Valores de Reflectancia de cada Banda
Banda 2:
8.21% DOS
12.28% COST

Banda 3
4.17% DOS
6.24% COST

Banda 4
2.35% DOS
3.51% COST

Banda 5
0.85% DOS
1.28% COST

Banda 6
0.08675% DOS
1.3% COST

Banda 7
0.02094% DOS
0.03132% COST


Banda 9
-0.07180% DOS
-0.11% COST


Procesamiento de la imagen

Tabla #1: Información de la correlación calculada entre bandas
Algunas combinaciones de bandas nos dan información de elementos que son probables hayan en la superficie y/o subsuelo
Imagen 22. Imagen con la combinación de las bandas 7 en Rojo, 5 een verde y 3 en Azul
En verde se destaca la vegetación, la parte rojiza indica la presencia de minerales ferrosos.
Imagen 23. Combinación de bandas 567 en RGB
Imagen 24. Combinación de Bandas 765 en RGB, Vegetación en azul.

La primera técnica usada ha sido la de Ratio Image (División de pixeles equivalentes) de las bandas menos correlacionadas
Ratio Image
Normalización de los resultados
Imagen 25. Normalización de Ratio Image 67 con respecto al valor máximo
Imagen 26. Normalización de Ratio Image 67 con respecto a la media
Imagen 27. Normalización del Ratio Image 67 dando el mismo peso a los valores entre 0 y 1 que a los valores entre 1 y 65535.
Imagen 28. Gráfica que muestra el comportamiento de la tangente hiperbólica
La tangente hiperbólica tiene un dominio de todos los números reales y un recorrido que va desde -1 hasta 1. Además da mucha mayor prioridad a un conjunto de valores específicos. La ecuación de la tangente hiperbólica fue adaptada a nuestros objetivos
, donde
µ: Media aritmética de los números digitales de la imagen.
Desv: Desviación estándar de los números digitales de la imagen.
Imagen 29. Normalización de Ratio Image 67 usando un modelo de tangente hiperbólica adaptado.
El nivel de contraste logrado con la normalización de Ratio Image usando la tangente hiperbólica es bastante bueno y acorde con los resultados esperados.

Imagen 30. Imagen RGB compuesta en falso color (Ratio Image 67 en rojo,  Ratio Image 75 en verde y Ratio Image 47 en azul).
Imagen 31. Zoom de la imagen anterior. En amarillo brillante se destaca una alta probabilidad de presencia de minerales hidrotermales con concentraciones de oro.


A la imagen compuesta obtenida con la combinación de diversos Ratio Images se le aplicó un algoritmo de clasificación no supervisado conocido como K-means usando el software Erdas Imagine 2013. Se probó con la creación de diversas cantidades de clases y se concluyó que a partir de 160 clases la diferencia no es muy notoria. De esas 160 clases 159 fueron agrupadas en un súper clase de no interés. La clase 150 indica alta probabilidad de presencia de minerales hidrotermales.
Tabla 1. Parte de las 160 clases creadas con el algoritmo de clasificación no supervisado K-means usando Erdas Imagine 2013. La clase 150 es la clase que representa la presencia de minerales hidrotermales con concentraciones de oro.
Imagen 32. En amarillo se resaltan, usando k-means, las zonas con altas probabilidades de presencia de minerales hidrotermales con concentraciones de oro de alrededor del 5%.
Es importante resaltar las diferencias entre la imagen 32 y la Imagen 31. Hay amarillos en la imagen 31 que usando solo el ojo humano como clasificador pidiesen confundirse con las áreas de interés. Luego de la clasificación estas zonas no deseadas por sus diferencias estadísticas con respecto a lo esperado fueron representadas con otro color.
Imagen 33. Zonas detectadas dentro de la clasificación hecha en nuestro estudio.
La mayor parte de las zonas detectadas en nuestro estudio son también mencionadas en el proyecto de Cartografía Temática de la Republica Dominicana en el cuadrante geológico de Bonao como zonas de presencia de oro. Entre estas se pueden mencionar: Falconbridge Dominicana, Barrick Gold y la Mina Cerro Maimón.

Conclusiones y recomendaciones
Método de corrección radiométrica recomendado para landsat 8:
·         Dark Object Substraction (DOS).
La banda 8 no necesita de corrección geométrica en territories de la República Dominicana debido a que sus valores de reflectancia en ninguno de los casos excede el 1%.
Se propone normalizar los valores resultants de Ratio Images usanda un modelo adaptado de tangente hiperbólica.
La densidad de la cobertura vegetal afecta la detección de minerals. A mayor densidad vegetal menor capacidad de deteccion por lo que este mecanismo funciona major para zonas áridas y semiáridas.


















12.                     Bibliografía


1.      M. Jovovic, Space-color quantization of multispectral images in hierarchy of scales," Proc. IEEE Intl. Conf. Image Processing, 2001.
2.       P. De Neve, W. Philips, K. Denecker, I. Lemahieu, Introducing a decorrelated color space in the lossy compression of pre-press applications," Proc. 5th Color Imaging Conference, Scottsdale, AZ, pp. 88-92, 1997.
3.      D. Tretter and C. Bouman, Optimal transforms for multispectral and multilayer image coding," IEEE Trans. on Image Processing, Vol. 4, pp. 296-308, March 1995.
5.      Multispectral satellite image analysis based on the method of blind separation and fusion of sources.  Geoscience and Remote Sensing Symposium, 2003. IGARSS '03. Proceedings. 2003 IEEE International, Vol. 6, pp.3638-3648, Julio 2003.
6.      Use of Multispectral Data Extracting Information of Gold Ore Bearing Rocks by MPH Technique in Hatu Gold Occurrence Area in Western China. Geoscience and Remote Sensing Symposium, 2008. IGARSS 2008. IEEE International , Vol. 2, pp. 1663-1665, Julio 2008. Boston, Ma.
7.      Unsupervised iterative detection of land mines in highly cluttered environments. Image Processing, IEEE Transactions on  (Vol. 12), pp. 509-523. Mayo 2003.
8.      Unmixing based Landsat ETM+ and ASTER image fusion for hybrid multispectral image analysis. Geoscience and Remote Sensing Symposium, 2007. IGARSS 2007. IEEE International, pp. 3074-3077, Julio 2007.
9.       Agar & T. J. Coughlin, Gold and Base Metal Exploration Project Generation Using Landsat TM Data and Spectral Angle Mapping for Specific Alteration Styles in the Peruvian Andes.  R. A. Resource Discovery Systems, Cumbrae Stewart Building, Research Road, The University of Queensland, St. Lucia, Qld. 4072, Australia. 2498-2500.
10.   Alexandru Imbroane, Cornelia Melenti, Dorian Gorgan. Ninth International Symposium on Symbolic and Numeric Algorithms for Scientific Computing. Mineral Explorations by Landsat Image Ratios. pp. 335-340
11.   Remote Detection of Vegetation Stress for Mineral Exploration E. J. M. Carranza, M. Hale. International Institute for Aerospace Survey and Earth Sciences.
12.  B. T. San, E. O. Sumer, B. Gurcay, COMPARISON OF BAND RATIOING AND SPECTRAL INDICES METHODS FOR DETECTING ALUNITE AND KAOLINITE MINERALS USING ASTER DATA IN BIGA REGION, TURKEY. General Directorate of Mineral Research and Exploration, Remote Sensing Center - 06520, Ankara, TURKEY

15.   JORGE LIRA CHÁVEZ, Tratamiento digital de imágenes multiespectrales, 2010, Mx.
16.  http://www.nasa.gov/mission_pages/landsat/main/index.html#.UxAMRXn38ds, Administración Nacional de la Aeronáutica y del Espacio de los Estados Unidos NASA.
Servicio Geológico de los Estados Unidos.
18.  Chavez, P.S., Jr. 1996. Image-based atmospheric corrections–revisited and improved. Photogrammetric Engineering and Remote Sensing: pp.1025-1036.
19.   Chavez, P.S., Jr. 1988. An improved dark-object subtraction technique for atmospheric scattering correction of multispectral data. Remote Sensing of Environment: pp.459-479.
20.  http://mapas.igme.es/sgn/docu/Memoria%20Recursos%20Minerales%206172%20Bonao.pdf "Mapa de recursos minerales de la RD, cuadrante Bonao"
21.  http://ffyl.uncu.edu.ar/IMG/pdf/Notas_clase_Procesamiento_digital.pdf Fundamentos de procesamiento digital de imagenes de satelite, Ing. Esp. H. Cristina Salvatierra. PP.1
23.  Rolf Richter, DLR, http://www.rese.ch/products/atcor/atcor4/atcor4_meth.html