Análisis de Componentes Principales de Imágenes de Satélite
Principal component Analysis of Satellite Imagery
Por Eber Risco Sence
El análisis de componentes principales (ACP) es un método general de análisis para correlacionar conjunto de datos multivariados (Guo y Mason 2009). ACP lleva a cabo una transformación lineal de un conjunto de vectores aleatorios correlacionados para que sean representados en un nuevo espacio de tal manera que no están correlacionados. El nuevo espacio de coordenadas esta relacionado con el original por una rotación alrededor del origen, de tal manera que los ejes de coordenadas nuevas están alineadas con las direcciones dominantes de dispersión (los componentes principales) de datos, como se deduce a partir de su matriz de covarianza (Ünsalan y Boyer 2011).
La capacidad de síntesis que ofrece el análisis de componentes principales es la base para su aplicación en teledetección. La adquisición de imágenes sobre bandas adyacentes del espectro, implica con frecuencia detectar una información redundante, puesto que los tipos de cubierta tienden a presentar un comportamiento similar en longitudes de onda próximas. Por ello, las medidas realizadas en una banda pueden presentar una importante correlación con las deducidas de otra, haciendo una o varias de ellas prácticamente irrelevantes. En este contexto, el ACP permite sintetizar las bandas originales, creando unas nuevas bandas, las cuales recogen la parte más relevante de la información original (Chuvieco 2008).
En términos generales, los componentes principales de una imagen se obtienen de acuerdo:
Donde CPj indica el ND correspondiente al componente principal j, ai,j el coeficiente aplicado al ND de la banda i para generar el componente j y Rj una constante para desplazar el eje del origen. Existen tantos componentes como bandas, pero la forma de extraer esos componentes implica que solo los primeros tienen una información significativa.
A partir de la matriz de varianza-covarianza de las bandas que componen la imagen original, se extraen los autovalores (ξj) que expresan la magnitud del vector de cada uno de los nuevos componentes, y, en última instancia, la proporción de información original que retienen. La varianza original explicada por cada componente se calcula como la proporción de su autovalor frente a la suma de todos los autovalores:
A partir de los autovectores, se calcula la matriz de correlaciones entre los componentes principales y bandas de la imagen, lo que nos permite conocer el sentido espectral de estos componentes:
Donde ri,j indica el coeficiente de correlación entre el componente j y la banda i; ai,j el autovector de ese componente en la misma banda: ξj , el autovalor del componente j, y si la desviación típica de la banda i.
La aplicación de esta técnica sobre los valles de San Juan y Pisco, ubicado en el departamento de Ica, Perú se presenta a continuación
Band 1 | Band 2 | Band 3 | Band 4 | Band 5 | Band 7 | |
Band 1 | 231.614592 | 164.280382 | 256.411602 | 65.114782 | 346.50827 | 283.210261 |
Band 2 | 164.280382 | 121.698043 | 190.181291 | 49.222812 | 260.856374 | 212.21982 |
Band 3 | 256.411602 | 190.181291 | 301.778151 | 63.632969 | 415.628234 | 342.109923 |
Band 4 | 65.114782 | 49.222812 | 63.632969 | 161.281077 | 129.659515 | 50.339129 |
Band 5 | 346.50827 | 260.856374 | 415.628234 | 129.659515 | 656.207422 | 507.597661 |
Band 7 | 283.210261 | 212.21982 | 342.109923 | 50.339129 | 507.597661 | 422.653071 |
Cuadro 1: Matriz de varianza-covarianza de la imagen de los valles de San Juan y Pisco. Los números se refieren a ND, no se ha incluido la banda térmica.
Band 1 | Band 2 | Band 3 | Band 4 | Band 5 | Band 7 | |
Band 1 | 1 | 0.9785 | 0.969864 | 0.336903 | 0.888812 | 0.905178 |
Band 2 | 0.9785 | 1 | 0.992389 | 0.351344 | 0.923079 | 0.935733 |
Band 3 | 0.969864 | 0.992389 | 1 | 0.288434 | 0.933986 | 0.957921 |
Band 4 | 0.336903 | 0.351344 | 0.288434 | 1 | 0.398559 | 0.192807 |
Band 5 | 0.888812 | 0.923079 | 0.933986 | 0.398559 | 1 | 0.963845 |
Band 7 | 0.905178 | 0.935733 | 0.957921 | 0.192807 | 0.963845 | 1 |
Cuadro 2: Matriz de correlación de la imagen de los valles de San Juan y Pisco Los números se refieren a ND, no se ha incluido la banda térmica.
Band 1 | Band 2 | Band 3 | Band 4 | Band 5 | Band 7 | |
Band 1 | 0.353015 | 0.262338 | 0.416165 | 0.110289 | 0.615856 | 0.491857 |
Band 2 | -0.008765 | -0.001255 | -0.097794 | 0.948331 | 0.122144 | -0.275876 |
Band 3 | -0.612229 | -0.317451 | -0.381971 | -0.050628 | 0.567013 | 0.233307 |
Band 4 | -0.679572 | 0.273049 | 0.530711 | 0.160121 | -0.310043 | 0.24537 |
Band 5 | 0.17683 | -0.15784 | -0.364852 | 0.238534 | -0.431843 | 0.753203 |
Band 7 | -0.085976 | 0.854946 | -0.506528 | -0.058349 | 0.041037 | -0.004009 |
Cuadro 3: Matriz de autovalores de la imagen de los valles de San Juan y Pisco. Los números se refieren a ND, no se ha incluido la banda térmica.
Band 1 | Band 2 | Band 3 | Band 4 | Band 5 | Band 7 | |
CP 1 | 0.949451 | 0.973377 | 0.980582 | 0.355468 | 0.984059 | 0.979285 |
CP 2 | -0.007196 | -0.001422 | -0.070336 | 0.932999 | 0.059575 | -0.167662 |
CP 3 | -0.293735 | -0.210116 | -0.16055 | -0.029109 | 0.161621 | 0.082863 |
Cuadro 4: Matriz de correlación de la imagen del valle de los valles de San Juan y Pisco . Los números se refieren a ND, no se ha incluido la banda térmica.
Figura 2: Componente principal 1 de la imagen de los valles de San Juan y Pisco .
De la figura 2 se aprecia que en el componente 1 (CP1) los valores altos corresponden a las zonas sin vegetación, mientras los valores bajos corresponden a las zonas de cultivos. Del cuadro 4 y de la figura 3 se aprecia que el segundo componente muestra una importante correlación positiva con la banda 4, apenas perceptible con la banda 5 y moderadamente negativa con el resto de bandas, con lo que esta evidenciando el contraste entre el IRC y el resto de bandas analizadas, lo que muestra una valoración del vigor vegetal de la imagen. De la figura 4 se aprecia que el tercer componente ofrece valores muy bajos para los cuerpos de agua y zonas húmedas (llanuras de inundación en la escena), por lo que se podría considerar como el componente de humedad.
Referencias
- Chuvieco Salinero, E. 2008. Teledetección Ambiental. 2 ed. Barcelona, ES, Ariel. 592 p.
- Guo, J; Mason, P. 2009. Essential Image Processing and GIS for Remote Sensing. Oxford, UK. Wiley-Blackwell.462 p.
- Schowengerdt, R. 2007. Remote Sensing-Models and Methods for Image Processing. 3 ed. California, US, Academic Press. 558 p.
- Steven M. de Jong; Freek D. Van der Meer. 2004. Remote Sensing Image Analysis. California, US, Springer. 370 p.
- Ünsalan, C.; Boyer, K. 2011. Multispectral Satellite Image Understanding. New York, US. Springer. 203 p.
No hay comentarios:
Publicar un comentario