Selección de AGN utilizando criterios de color en el infrarrojo

Para la realización de esta práctica es imprescindible disponer de un Java Runtime Environment (JRE) v1.5 o posterior, así como la aplicación TopCat. La conexión a internet es necesaria para descargar los catálogos, pero no para el resto de la práctica.

Ver aquí las instrucciones de instalación del JRE y TopCat, tutoriales, y otros recursos.

Índice

1.0 Introducción
1.1 Obtención de los catálogos astronómicos
1.2 Conversión de flujos a magnitudes
1.3 Cálculo de índices de color
1.4 Colores de un cuásar en función de z
1.5 Correlación con catálogos de AGN conocidos
1.6 Selección de candidatos AGN con criterios de color
1.7 Identificación de contaminantes
1.8 Completitud y eficiencia de selección
1.9 Verificación de candidatos
1.10 Memoria de la práctica

1.0 Introducción

Los núcleos galácticos activos (AGN, del inglés Active Galactic Nuclei) son fuentes muy compactas y extremadamente luminosas que se encuentran en el núcleo de algunas galaxias (aproximadamente el 5%). El origen de la luminosidad del AGN es el acrecimiento por parte de un agujero negro supermasivo (106-108 Msol) de material procedente de la galaxia que lo rodea. El material forma un disco de acreción en torno al agujero negro, que se calienta por viscosidad hasta temperaturas de millones de Kelvin, emitiendo radiación muy energética, principalmente rayos X y ultravioleta. Rodeando el disco de acreción se encuentra una estructura mucho mayor, de forma probablemente toroidal, que contiene gas y polvo a temperaturas moderadas (desde ~100 K hasta ~1500 K). Este toro se calienta indirectamente por la radiación del AGN, y emite principalmente en el infrarrojo.

Los primeros AGN en ser descubiertos, los cuásares (QSO, por cuasi-stellar objects) son muy luminosos en el visible y ultravioleta, hasta el punto de deslumbrar la galaxia que los rodea e impedir su observación salvo con telescopios espaciales. Otros AGN fueron descubiertos por su emisión en radio: las radiogalaxias. Sin embargo, hoy día sabemos que la mayoría de AGN luminosos son indetectables tanto en radio como en el visible/ultravioleta, debido (en el segundo caso) a que la orientación del toro nos impide una visión directa del disco de acreción. Una alternativa para seleccionar AGN independientemente de su orientación es mediante la emisión en rayos X, que es capaz de atravesar el toro (salvo en casos extremos). En los últimos años, y gracias a la disponibilidad de grandes cartografiados multibanda en el infrarrojo, primero con Spitzer y luego con WISE, se han desarrollado nuevas técnicas de selección, que buscan identificar directamente la emisión infrarroja del toro.

Una de las técnicas más sencillas y potentes es el uso de diagramas color-color, que permite separar los AGN de otras fuentes astronómicas a partir de sus colores infrarrojos. Con esta práctica descubriremos el fundamento del método de selección por colores, y lo aplicaremos a una muestra de fuentes reales del cartografiado SWIRE.



1.1 Obtención de los catálogos astronómicos

Para esta práctica utilizaremos un subconjunto del catálogo más reciente del cartografiado infrarrojo SWIRE.
SWIRE observó 6 campos extragalácticos en las 7 bandas infrarrojas del telescopio Spitzer (3.6, 4.5, 5.8, 8.0, 24, 70 y 160µm)
además de fotometría auxiliar desde tierra en las bandas ópticas U,g,r,i,z y en el infrarrojo cercano (J, H, K).

Los campos SWIRE tienen una extensión de varios grados cuadrados cada uno, y una densidad de fuentes de decenas de miles por grado cuadrado. Esto implica que si tomamos el catálogo completo (2 millones de fuentes) nuestra máquina podría no tener memoria suficiente para manipularlo con facilidad, además de que necesitaría un tiempo sustancial para descargarlo y para realizar cada una de las operaciones que hagamos sobre los datos. Por todo ello, limitaremos la selección de la muestra a utilizar en la práctica a una pequeña región circular de la bóveda celeste, con un ángulo sólido aproximado de 1 grado cuadrado.

Seleccionamos la muesta con TopCat, como sigue:

File > Load Table > Cone Search

En el campo Keywords ponemos la clave "SWIRE" y clickamos en Submit Query

Aparecerá una lista de catálogos que contienen la clave SWIRE. Buscamos y seleccionamos el que tiene por título:
"Revised SWIRE photometric redshifts (Rowan-Robinson+, 2013)"

Obteniendo el catálogo con la función Cone Search

Abajo ponemos las coordenadas del centro del cono, Ascensión Recta (RA) y Declinación (DEC).
Para que el cono esté incluído en el campo ELAIS N1, debemos escoger un valor de RA y DEC que esté dentro del retículo rojo en la siguiente figura, a ser posible no muy próximo al borde. Por ejemplo: RA = 16:10:00 DEC=55:20:00.

Area cubierta por SWIRE en el campo ELAIS N1  en cada una de la bandas de Spitzer
Como radio de búsqueda pondremos 0.56 grados. Esto implica que el ángulo sólido será π ~1 deg²
El tamaño del campo equivale a aproximadamente 5  veces el ángulo sólido que subtiende la luna llena y 1/40000 de toda la bóveda celeste.

En catálogo obtenido contendrá del orden de 30000 fuentes. Si el número es mucho menor es probable que hayamos elegido unas coordenadas demasiado próximas a los bordes del campo ELAIS N1. En tal caso hay que probar con otras coordenadas más próximas al centro del campo, que está situado en RA=16h11m y DEC=55d00m.

1.2 Conversión de flujos a magnitudes

Los flujos de las fuentes del catálogo en cada una de las 7 bandas infrarrojas de Spitzer estan dados en microJansky (µJy). Para convertir de µJy a magnitud AB utilizamos la fórmula:

fnu [µJy] = 10^(23.9 - AB)/2.5

TopCat nos facilita convertir entre ambos utilizando las funciones janskyToAb( ) y abToJansky( ).

Para la selección por colores utilizaremos las 4 bandas observadas con el instrumento IRAC, que son las de longitud de onda más corta: 3.6, 4.5, 5.8 y 8.0 µm. Creamos una nueva columna en la tabla para cada una de ellas, que contenga el flujo medido en magnitudes AB. Las llamaremos, por ejemplo, mag36, mag45, mag58 y mag80. En la figura se representan las magnitudes correspondientes a la bandas 3.6 y 4.5µm para una muestra del campo ELAIS N1.

magnitudes en las bandas de 3.6 y 4.5µm representadas una frente a la otra
Debemos poner especial cuidado en la conversión de flujos a magnitudes para las fuentes que no están detectadas en alguna de las bandas. El catálogo SWIRE identifica las no detecciones con valores de flujo igual a cero. Esto no significa que el flujo de la fuente realmente sea 0 µJy en esa banda, sino que está por debajo del umbral de detección. La magnitud correspondiente para un flujo de 0 µJy es infinito, y ese es el valor que devuelve la función janskyToAb( ). Sin embargo, esto no tiene sentido físico, pues lo único que sabemos es que la fuente es demasiado débil para ser detectada. Cuando apliquemos los criterios de selección, debemos descartar todas aquellas fuentes que no estén detectadas en alguna de las bandas que intervienen en los criterios de selección.

1.3 Cálculo de índices de color

En astronomía llamamos índice de color, o a menudo símplemente color, a la diferencia entre las magnitudes que tiene una fuente en dos bandas diferentes. Por convenio, el primer término de la resta es siempre la banda de longitud de onda más corta de las dos. Por ejemplo, el color U-g (se lee u menos g)  es la diferencia entre la magnitud en la banda U y la magnitud en la banda g. Si el índice de color es un número positivo, significa que la fuente es más brillante en la banda de longitud de onda más larga, mientras que si es negativo, implica que es más brillantes en la más corta. Si el índice de color es 0, la fuente es igual de brillante en ambas bandas. Por analogía con lo que ocurre en luz visible, decimos que una fuente con índice de color positivo es "roja", mientras que una con índice de color negativo es "azul". Una misma fuente puede ser roja para determinados índices de color y azul en otros.


Los índices de color tienen las propiedades aritméticas que podemos esperar de una diferencia de números reales, por ejemplo:

U = g + (U-g)   # la magnitud en la banda U es igual a la magnitud g más el índice de color U-g
U-r = (U-g)+(g-r) # el color entre las bandas U y r es igual al color (U-g) más el color (g-r)

Las bandas infrarrojas del instrumento IRAC no tienen nombres estandarizados, y a menudo se las identifica mediante la longitud de onda entre corchetes: [3.6], [4.5], [5.8], [8.0] o bien irac3.6, irac4.5, irac5.8, irac5.8, o incluso: IRAC1, IRAC2, IRAC3, IRAC4.

Calculamos los 6 índices de color que corresponden a todas las combinaciones posibles de las 4 bandas de IRAC:

c12 = mag36-mag45 # color [3.6]-[4.5]
c23 = mag45-mag58 # color [4.5]-[5.8]
c34 = mag58-mag80 # color [5.8]-[8.0]
c13 = mag36-mag58 # color [3.6]-[5.8]
c24 = mag45-mag80 # color [4.5]-[8.0]
c14 = mag36-mag80 # color [3.6]-[8.0]

Es fácil comprobar que no todos los colores son independientes entre sí (de hecho, sólo 3 lo son). Por ejemplo:

c24 =  mag45-mag80 = (mag45-mag58) + (mag58-mag80) = c23+c34

La siguiente figura representa dos índices de color, uno frente al otro. Es lo que se denomina un diagrama color-color. Los diagramas color-color son una de las herramientas de análisis más básicas en astrofísica, y también de las más utilizadas.

ejemplo de diagrama color-color con bandas de IRAC

1.4 Colores de un cuásar en función de z

La distribución espectral de energía (SED, por Spectral Energy Distribution) de los AGN varía en función de si tenemos una linea de visión directa hacia el disco de acreción que rodea al agujero negro supermasivo (AGN de tipo 1), o por el contrario éste queda oculto por la estructura toroidal de gas y polvo (el toro) que lo rodea (AGN de tipo 2). Esta distinción es muy importante en el óptico y ultravioleta, donde los AGN de tipo 2 son casi invisibles, al quedar oculto el disco de acreción, y sólo se identifican por la observación de determinadas líneas estrechas de átomos áltamente ionizados en el espectro.

Sin embargo, el polvo caliente contenido en el toro es muy brillante en el infrarrojo, por lo que los AGN de tipo 1 y 2 tienen SEDs más parecidas en este rango.  La figura siguiente muestra la SED de un cuásar (AGN de tipo 1 muy luminoso), obtenida combinando espectros en el UV, óptico, IR cercano e IR medio. Es interesante que la SED infrarroja, a partir de 1µm, es prácticamente una recta cuando se representa en escala logarítmica, es decir: la relación entre longitud de onda y flujo es una ley de potencias.

UV to mid-IR spectrum of a typical quasar

Una característica muy interesante de las leyes de potencia es que el desplazamiento al rojo no modifica el exponente, de modo que los índices de color infrarrojos del AGN cambian poco con z. En la figura siguiente podemos ver cómo varían los colores [3.6]-[4.5], [4.5]-[5.8] y [5.8]-[8.0] que se obtienen con la SED del cuásar anterior en función del desplazamiento al rojo al que esté situado.

dependencia de los colores IRAC de un cuásar con z

Denominamos traza (track) del cuásar en el diagrama color-color a la línea de puntos que representa su evolución con z.  Los valores necesarios para dibujar esta traza están disponibles en esta tabla.
Vemos que los cuásares que tengan esta SED aparecerán en la esquina superior derecha del diagrama para cualquier desplazamiento al rojo en el intervalo 0 < z < 3.5, aunque a z > 3.5 se mueven rápidamente haca la izquierda del diagrama.  Esto se debe a que a z muy alto el desplazamiento al rojo hace que en la banda de 3.6µm de IRAC empecemos a ver la emisión en el óptico del sistema en reposo del AGN, donde la pendiente de la SED cambia.

traza de la SED AGN en diagrama color-color en función de z

Puesto que la mayoría de las fuentes de la muestra tienen colores IRAC sustancialmente distintos a los del quásar, podemos utilizar éstos para seleccionar fuentes candidatas a ser cuásares (que luego habría que confirmar por otros medios, por ejemplo, obteniendo un espectro óptico).
El "locus" de los cuásares (la región del diagrama color-color en la que se desarrolla la traza), y las galaxias están en posiciones diferentes en cada uno de los diagramas color-color que se pueden realizar con las bandas de IRAC. En la literatura se han publicado distintos métodos para seleccionar AGN con la fotometría de IRAC (o combinando IRAC y óptico) que utilizan diferentes criterios de color. Véanse, por ejemplo, Stern et al. (2005) y Lacy et al. (2007).

1.5 Correlación con catálogos de AGN conocidos

No todos los cuásares estarán necesariamente sobre la traza. Las incertidumbres en la fotometría, el solapamiento de fuentes, y la variabilidad hacen que la SED observada no sea exactamente idéntica a la real. Además, no todos los cuásares tienen una SED igual a la del que hemos usado como modelo para generar la traza: diferencias en la luminosidad, orientación, cantidad de polvo, etc, hacen que no haya dos AGN con espectros idénticos. Esto implica que debemos considerar la traza sólamente como un indicador aproximado de la zona del diagrama color-color en la que esperamos encontrar los AGN.

Para conocer qué dispersión respecto a la traza podemos esperar en los AGN de nuestra muestra, podemos utilizar un catálogo que contenga fotometría IRAC de cuásares conocidos. Utilizaremos el catálogo de cuásares SDSS/SWIRE (fuentes SWIRE confirmadas espectroscópicamente como cuásares por el  Sloan Digital Sky Survey), que está disponible en VizieR a traves de TopCat, de la siguiente manera:

File > Load Table > VizieR

En lugar de Cone Selection marcamos la opción All Rows, que nos permite descargar el catálogo entero (no es muy grande). En Catalogue Selection clickamos el botón By Keyword e introducimos la clave "SWIRE quasar" y pinchamos en Search Catalogues. El que nos interesa es el que está marcado en la imagen:


selección de un catálogo de cuásares en VizieR

Una vez descargado el catálogo, procedemos a calcular las magnitudes en las bandas IRAC e índices de color de igual forma que hicimos para el primer catálogo. Cuando los tengamos, podemos representarlos en diagramas color-color como el de la figura:

Diagrama color-color con la posición de los cuásares SDSS/SWIRE
En el caso de esta combinación de colores en concreto, es evidente que hay un buen número de cuásares, especialmente a z~2 que son más rojos (índice de color más alto) que el modelo, tanto en el color [3.6]-[4.5] como en el [4.5]-[5.8]. Para otros colores, las desviaciones pueden ser en otro sentido.

1.6 Selección de candidatos AGN con criterios de color

Ahora que conocemos con mayor precisión en qué zonas de los diagramas color-color se encuentran los AGN,  podemos definir los criterios de selección que utilizaremos para escoger nuestra muestra de candidatos a AGN.

Los criterios de selección definirán un polígono dentro de un diagrama color-color (o más bien un poliedro en un espacio multidimensional, en el que cada coordenada es un color). El interior del polígono (poliedro) es la región de selección, y las fuentes que se encuentren en su interior serán los candidatos.

Para definir el poliedro utilizamos una combinación de desigualdades aplicables a cada índice de color, o a combinaciones lineales de ellos. Por ejemplo:

c23 > -0.1
c23 > 2*c12 - 0.8
c23 < 2*c12 + 0.8
c23 < 0.9

Define el interior del paralelogramo rosa de la siguiente figura. Este criterio de selección encontraría prácticamente todos los cuásares SDSS/SWIRE, salvo tres que quedan ligeramente fuera del borde. Sin embargo, muchas fuentes que no son AGN se cuelan en la selección, especialmente en la esquina inferior izquierda del paralelogramo. Llamamos a estas fuentes, cuando no son AGN, contaminantes.

Ejemplo de región de selección
Si estamos dispuestos a desechar los cuásares a z>3.5, o mejor aún, buscar un criterio de selección específico para ellos, entonces una buena forma de reducir la cantidad de contaminantes, en este caso concreto, sería cortar la esquina inferior izquierda del paralelogramo añadiendo una nueva condición, por ejemplo:

c12 > -0.05

Con esto dejamos fuera también los cuásares por encima de z > 3.5, pero quizás podamos encontrar unos criterios que permitan separarlos de las galaxias. Lo dejamos como ejercicio opcional.

1.7 Identificación de contaminantes

No todas las fuentes que están próximas al "locus" de los cuásares lo son. Algunas son galaxias o estrellas con SEDs muy diferentes a la del cuásar, pero cuyos colores -en un diagrama color-color determinado- pueden ser similares a los de un cuásar. Es importante destacar que las galaxias y estrellas próximas al locus de los cuásares son diferentes en cada uno de los posibles diagramas color-color, de modo que una galaxia que en un diagrama color-color aparece en el locus, puede quedar muy lejos en otro. Esto permite identificar y eliminar contaminantes utilizando varios diagramas color-color.

Otra forma de eliminar contaminantes es utilizando el "stellar flag" (columna mst del catálogo). Esta etiqueta indica si la fuente es puntual (estelar) o extendida (galaxia). Los cuásares son fuentes puntuales, de modo que para seleccionarlos podemos eliminar todas las fuentes que son extendidas. Sin embargo, si nos interesan AGN de tipo 2, no podemos descartar las fuentes extensas ya que, al no ser el AGN visible en el óptico, vemos la galaxia en su lugar.

1.8 Completitud y eficiencia de selección

Cualquier criterio de selección que utilicemos perderá algunos AGN, y también seleccionará algunas fuentes que no lo son (falsos positivos). Definimos la completitud como la fracción de los AGN verdaderos que son seleccionados (por ejemplo, utilizando como referencia la muestra de cuásares SWIRE confirmados).
La eficiencia de selección será la fracción de fuentes seleccionadas que resultan ser verdaderos AGN, es decir, los que no son falsos positivos.
Nuestro objetivo al elegir un criterio de selección es que tanto la completitud como la eficiencia de selección sean lo más altas posibles, pero siempre tendremos que llegar a un compromiso, pues una de ellas incrementa a expensas de la otra.
Por lo tanto, se trata de intentar maximizar el número de AGN confirmados de la muestra SDSS/SWIRE que entran en nuestro criterio de selección, a la vez que se minimiza el número de fuentes de nuestro cono que cumplen ese mismo criterio.

La eficiencia de selección no podemos calcularla sin saber qué candidatos son verdaderos AGN y cuáles son falsos positivos, pero para nuestros propósitos podemos suponer que un 0.1% de toda la muestra SWIRE son cuásares, y que la muestra SDSS/SWIRE es representativa de todos los cuásares SWIRE.
Por tanto, el número de candidatos verdaderos que esperamos encontrar con nuestro criterio de selección será: N = 0.001*NS*Comp, donde NS es el total de fuentes en nuestro cono de 1 grado cuadrado, y Comp es la completitud del criterio de selección.

Ejemplo:

Diseñamos un criterio de selección por colores en el que las condiciones que imponemos para la selección se verifican en 230 de los 278 AGN del catálogo SDSS/SWIRE, frente a sólo 63 de las 30000 fuentes en nuestro cono del catálogo SWIRE.

La completitud será:  230/278 = 83%

Como sólo una de cada 1000 fuentes es un cuásar, esperamos que nuestro cono contenga 30 cuásares. La completitud del 83% implica que nuestro criterio encontrará: 30 * 0.827 ~ 25 cuásares, mientras que otros ~5 se perderán (no verificarán el criterio de selección).

Como nuestro criterio selecciona 63 fuentes, de las cuales sólo 25 esperamos que sean verdaderos cuásares, la eficiencia de selección es: 25/63 = 40%

1.9 Verificación de candidatos

Una vez tengamos la lista final de candidatos a cuásar, guardaremos una tabla conteniendo sólo los candidatos seleccionados.
Podemos buscar información adicional sobre estas fuentes en el Nasa Extragalactic Database (NED).

Para buscar la información disponible para cada fuente, vamos a la primera columna (OBJECTS) y pulsamos sobre la opción "Near position".

Rellenamos el formulario con las coordenadas RA y DEC de la fuente, y ponemos un radio de búsqueda pequeño, por ejemplo 0.1 arcmin.
Pulsando sobre el botón "Near Position Search" aparecerá un lista de fuentes dentro del radio de búsqueda. Si nuestras coordenadas son precisas (y lo son) la fuente que buscamos es la primera de la lista.

Entre la información que podemos encontrar en NED está la distribución espectral de energía (SED) y clasificación espectral, si la hay. En la sección BASIC DATA (casi al final de la página) podremos ver si la fuente es un cuásar conocido (QSO), o ha sido identificado previamente como candidato a cuásar pero aún no confirmado (Candidate QSO). Recopilamos la información disponible en el campo Spectral type para cada una de las fuentes, como se detalla en la figura:

clasificación espectral para uno de los candidatos

1.10 Memoria de la práctica

Se elaborará una memoria de la práctica, de 6-8 páginas de extensión (valor orientativo).

La memoria incluirá los siguientes apartados:

- Objetivos
- Fundamento teórico
- Metodología
- Resultados
- Discusión
- Conclusiones