Selección de AGN
utilizando criterios de color en el infrarrojo
Para la realización de
esta práctica es imprescindible disponer de un Java Runtime Environment
(JRE) v1.5 o posterior, así como la aplicación TopCat.
La conexión a internet es necesaria para descargar los catálogos, pero
no para el resto de la práctica.
Ver aquí las
instrucciones de instalación del JRE y TopCat, tutoriales, y otros
recursos.
Índice
1.0 Introducción
1.1 Obtención de los
catálogos astronómicos
1.2 Conversión de
flujos a magnitudes
1.3 Cálculo de índices
de color
1.4 Colores de un
cuásar en función de z
1.5 Correlación con
catálogos de AGN conocidos
1.6 Selección de candidatos AGN con criterios de color
1.7 Identificación de
contaminantes
1.8 Completitud y eficiencia de selección
1.9 Verificación de
candidatos
1.10 Memoria de la práctica
1.0 Introducción
Los núcleos galácticos activos (AGN, del inglés Active Galactic Nuclei)
son fuentes muy compactas y extremadamente luminosas que se encuentran
en el núcleo de algunas galaxias (aproximadamente el 5%). El origen de
la luminosidad del AGN es el acrecimiento por parte de un agujero negro
supermasivo (106-108 Msol) de material
procedente de la galaxia que lo rodea. El material forma un disco de
acreción en torno al agujero negro, que se calienta por viscosidad
hasta temperaturas de millones de Kelvin, emitiendo radiación muy
energética, principalmente rayos X y ultravioleta. Rodeando el disco de
acreción se encuentra una estructura mucho mayor, de forma
probablemente toroidal, que contiene gas y polvo a temperaturas
moderadas (desde ~100 K hasta ~1500 K). Este toro se calienta
indirectamente por la radiación del AGN, y emite principalmente en el
infrarrojo.
Los primeros AGN en ser descubiertos, los cuásares (QSO, por
cuasi-stellar objects) son muy luminosos en el visible y ultravioleta,
hasta el punto de deslumbrar la galaxia que los rodea e impedir su
observación salvo con telescopios espaciales. Otros AGN fueron
descubiertos por su emisión en radio: las radiogalaxias. Sin embargo,
hoy día sabemos que la mayoría de AGN luminosos son indetectables tanto
en radio como en el visible/ultravioleta, debido (en el segundo caso) a que la orientación
del toro nos impide una visión directa del disco de acreción. Una
alternativa para seleccionar AGN independientemente de su orientación
es mediante la emisión en rayos X, que es capaz de atravesar el toro
(salvo en casos extremos). En los últimos años, y gracias a la
disponibilidad de grandes cartografiados multibanda en el infrarrojo,
primero con Spitzer y luego con WISE, se han desarrollado nuevas
técnicas de selección, que buscan identificar directamente la emisión
infrarroja del toro.
Una de las técnicas más sencillas y potentes es el uso de diagramas
color-color, que permite separar los AGN de otras fuentes astronómicas
a partir de sus colores infrarrojos. Con esta práctica descubriremos el
fundamento del método de selección por colores, y lo aplicaremos a una
muestra de fuentes reales del cartografiado SWIRE.
1.1 Obtención de los catálogos
astronómicos
Para esta práctica utilizaremos un subconjunto del catálogo más
reciente del cartografiado infrarrojo SWIRE.
SWIRE observó 6 campos extragalácticos en las 7 bandas infrarrojas del
telescopio Spitzer (3.6, 4.5, 5.8, 8.0, 24, 70 y 160µm)
además de fotometría auxiliar desde tierra en las bandas ópticas
U,g,r,i,z y en el infrarrojo cercano (J, H, K).
Los campos SWIRE tienen una extensión de varios grados cuadrados cada
uno, y una densidad de fuentes de decenas de miles por grado cuadrado.
Esto implica que si tomamos el catálogo completo (2 millones de
fuentes) nuestra máquina podría no tener memoria suficiente para
manipularlo con facilidad, además de que necesitaría un tiempo
sustancial para descargarlo y para realizar cada una de las operaciones
que hagamos sobre los datos. Por todo ello, limitaremos la selección de
la muestra a utilizar en la práctica a una pequeña región circular de
la bóveda celeste, con un ángulo sólido aproximado de 1 grado cuadrado.
Seleccionamos la muesta con TopCat, como sigue:
File > Load Table > Cone Search
En el campo Keywords ponemos la clave "SWIRE" y clickamos en Submit
Query
Aparecerá una lista de catálogos que contienen la clave SWIRE. Buscamos
y seleccionamos el que tiene por título:
"Revised SWIRE photometric redshifts (Rowan-Robinson+, 2013)"

Abajo ponemos las coordenadas del centro del cono, Ascensión Recta (RA)
y Declinación (DEC).
Para
que el cono esté incluído en el campo ELAIS N1, debemos escoger un
valor de RA y DEC que esté dentro del retículo rojo en la siguiente
figura, a ser posible no muy próximo al borde. Por ejemplo: RA =
16:10:00 DEC=55:20:00.

Como radio de búsqueda pondremos 0.56 grados. Esto implica que el
ángulo sólido será π r² ~1 deg²
El tamaño del campo equivale a aproximadamente 5 veces el ángulo
sólido que subtiende la luna llena y 1/40000 de toda la bóveda celeste.
En catálogo obtenido contendrá del orden de 30000 fuentes. Si el número
es mucho menor es probable que hayamos elegido unas coordenadas
demasiado próximas a los bordes del campo ELAIS N1. En tal caso hay que
probar con otras coordenadas más próximas al centro del campo, que está
situado en RA=16h11m y DEC=55d00m.
1.2 Conversión de
flujos a magnitudes
Los flujos de las fuentes del catálogo en cada una de las 7 bandas
infrarrojas de Spitzer estan dados en microJansky
(µJy). Para convertir de µJy a magnitud AB utilizamos la fórmula:
fnu [µJy] = 10^(23.9 - AB)/2.5
TopCat nos facilita convertir entre ambos utilizando las funciones
janskyToAb( ) y abToJansky( ).
Para la selección por colores utilizaremos las 4 bandas observadas
con
el instrumento IRAC, que son las de longitud de onda más corta: 3.6,
4.5, 5.8 y 8.0 µm. Creamos una nueva columna en la tabla para cada una
de ellas, que contenga el flujo medido en magnitudes AB. Las
llamaremos, por ejemplo, mag36, mag45, mag58 y mag80. En la figura se
representan las magnitudes correspondientes a la bandas 3.6 y 4.5µm
para una muestra del campo ELAIS N1.

Debemos poner especial cuidado en la conversión de flujos a magnitudes
para las fuentes que no están detectadas en alguna de las bandas. El
catálogo SWIRE identifica las no detecciones con valores de flujo igual
a cero. Esto no significa que el flujo de la fuente realmente sea 0 µJy
en esa banda, sino que está por debajo del umbral de detección. La
magnitud correspondiente para un flujo de 0 µJy es infinito, y ese es
el valor que devuelve la función janskyToAb( ). Sin embargo, esto no
tiene sentido físico, pues lo único que sabemos es que la fuente es
demasiado débil para ser detectada. Cuando apliquemos los criterios de
selección, debemos descartar todas aquellas fuentes que no estén
detectadas en alguna de las bandas que intervienen en los criterios de
selección.
1.3 Cálculo de índices de
color
En astronomía llamamos índice de color, o a menudo símplemente
color, a
la diferencia entre las magnitudes que tiene una fuente en dos bandas
diferentes. Por convenio, el primer término de la resta es siempre la
banda de
longitud de onda más corta de las dos. Por ejemplo, el color U-g (se
lee u menos g) es la
diferencia entre la magnitud en la banda U y la magnitud en la banda g.
Si el índice de color es un
número positivo, significa que la fuente es más brillante en la banda
de longitud de onda más larga, mientras que si es negativo, implica que
es más brillantes en la más corta. Si el índice de color es 0, la
fuente es igual de brillante en ambas bandas. Por analogía con lo que
ocurre en luz visible, decimos que una fuente con índice de color
positivo es "roja", mientras que una con índice de color negativo es
"azul". Una misma fuente puede ser roja para determinados índices de
color y azul en otros.
Los índices de color tienen las propiedades aritméticas que podemos
esperar de una diferencia de números reales, por ejemplo:
U = g + (U-g) # la magnitud en la banda U es igual a la
magnitud g más el índice de color U-g
U-r = (U-g)+(g-r) # el color entre las bandas U y r es igual al color
(U-g) más el color (g-r)
Las bandas infrarrojas del instrumento IRAC no tienen nombres
estandarizados, y a menudo se las identifica mediante la longitud de
onda entre corchetes: [3.6], [4.5], [5.8], [8.0] o bien irac3.6,
irac4.5, irac5.8, irac5.8, o incluso: IRAC1, IRAC2, IRAC3, IRAC4.
Calculamos los 6 índices de color que corresponden a todas las
combinaciones posibles de las 4 bandas de IRAC:
c12 = mag36-mag45 # color [3.6]-[4.5]
c23 = mag45-mag58 # color [4.5]-[5.8]
c34 = mag58-mag80 # color [5.8]-[8.0]
c13 = mag36-mag58 # color [3.6]-[5.8]
c24 = mag45-mag80 # color [4.5]-[8.0]
c14 = mag36-mag80 # color [3.6]-[8.0]
Es fácil comprobar que no todos los colores son independientes entre sí
(de hecho, sólo 3 lo son). Por ejemplo:
c24 = mag45-mag80 = (mag45-mag58) + (mag58-mag80) = c23+c34
La siguiente figura representa dos índices de color, uno frente al
otro. Es lo que se denomina un diagrama
color-color. Los diagramas color-color son una de las herramientas
de análisis más básicas en astrofísica, y también de las más utilizadas.

1.4 Colores de un cuásar en función de
z
La distribución espectral de energía (SED, por Spectral Energy
Distribution) de los AGN varía en función de si tenemos una linea de
visión directa hacia el disco de acreción que rodea al agujero negro
supermasivo (AGN de tipo 1), o por el contrario éste queda oculto por
la estructura toroidal de gas y polvo (el toro) que lo rodea (AGN de
tipo 2). Esta distinción es muy importante en el óptico y ultravioleta,
donde los AGN de tipo 2 son casi invisibles, al quedar oculto el disco
de acreción, y sólo se identifican por la observación de determinadas
líneas estrechas de átomos áltamente ionizados en el espectro.
Sin embargo, el polvo caliente contenido en el toro es muy brillante en
el infrarrojo, por lo que los AGN de tipo 1 y 2 tienen SEDs más
parecidas en este rango. La figura siguiente muestra la SED de un
cuásar (AGN de tipo 1 muy luminoso), obtenida combinando espectros en
el UV, óptico, IR cercano e IR medio. Es interesante que la SED
infrarroja, a partir de 1µm, es prácticamente una recta cuando se
representa en escala logarítmica, es decir: la relación entre longitud
de onda y flujo es una
ley de potencias.

Una característica muy interesante de las leyes de potencia es que el
desplazamiento al rojo no modifica el exponente, de modo que los índices de color infrarrojos del AGN
cambian poco con z.
En la figura siguiente podemos ver cómo varían los colores [3.6]-[4.5],
[4.5]-[5.8] y [5.8]-[8.0] que se obtienen con la SED del cuásar
anterior en función
del desplazamiento al rojo al que esté situado.

Denominamos traza
(track) del cuásar en el diagrama color-color a la línea de puntos que
representa su evolución con z. Los valores necesarios para
dibujar esta traza están disponibles en esta tabla.
Vemos que los cuásares que tengan esta SED aparecerán en la esquina
superior derecha del diagrama para cualquier desplazamiento al rojo en
el intervalo 0 < z < 3.5, aunque a z > 3.5 se mueven
rápidamente haca la izquierda del diagrama. Esto se debe a que a
z muy alto el desplazamiento al rojo hace que en la banda de 3.6µm de
IRAC empecemos a ver la emisión en el óptico del sistema en reposo del
AGN, donde la pendiente de la SED cambia.

Puesto que la mayoría de las fuentes de la muestra tienen colores IRAC
sustancialmente distintos a los del quásar, podemos utilizar éstos para
seleccionar fuentes candidatas a ser cuásares (que luego habría que
confirmar por otros medios, por ejemplo, obteniendo un espectro
óptico).
El "locus" de los cuásares (la región del diagrama color-color en la
que se desarrolla la traza), y las galaxias están en posiciones
diferentes en cada uno de los diagramas color-color que se pueden
realizar con las bandas de IRAC. En la literatura se han publicado
distintos métodos para seleccionar AGN con la fotometría de IRAC (o
combinando IRAC y óptico) que utilizan diferentes criterios de color.
Véanse, por ejemplo, Stern et al. (2005) y Lacy et al. (2007).
1.5 Correlación con catálogos de AGN conocidos
No todos los cuásares estarán necesariamente sobre la traza. Las
incertidumbres en la fotometría, el solapamiento de fuentes, y la
variabilidad hacen que la SED observada no sea exactamente idéntica a
la real. Además, no todos los cuásares tienen una SED igual a la del
que hemos usado como modelo para generar la traza: diferencias en la
luminosidad, orientación, cantidad de polvo, etc, hacen que no haya dos
AGN con espectros idénticos. Esto implica que debemos considerar la
traza sólamente como un indicador aproximado de la zona del diagrama
color-color en la que esperamos encontrar los AGN.
Para conocer qué dispersión respecto a la traza podemos esperar en los
AGN de nuestra muestra, podemos utilizar un catálogo que contenga
fotometría IRAC de cuásares conocidos. Utilizaremos el catálogo de
cuásares SDSS/SWIRE (fuentes SWIRE confirmadas espectroscópicamente
como cuásares por el Sloan Digital Sky Survey), que está
disponible en VizieR a traves de TopCat, de la siguiente manera:
File > Load Table > VizieR
En lugar de Cone Selection marcamos la opción All Rows, que nos permite
descargar el catálogo entero (no es muy grande). En Catalogue Selection
clickamos el botón By Keyword e introducimos la clave "SWIRE quasar" y
pinchamos en Search Catalogues. El que nos interesa es el que está
marcado en la imagen:

Una vez descargado el catálogo, procedemos a calcular las magnitudes en
las bandas IRAC e índices de color de igual forma que hicimos para el
primer catálogo. Cuando los tengamos, podemos representarlos en
diagramas color-color como el de la figura:

En el caso de esta combinación de colores en concreto, es evidente que
hay un buen número de cuásares, especialmente a z~2 que son más rojos
(índice de color más alto) que el modelo, tanto en el color [3.6]-[4.5]
como en el [4.5]-[5.8]. Para otros colores, las desviaciones pueden ser
en otro sentido.
1.6 Selección de candidatos AGN con criterios de color
Ahora que conocemos con mayor precisión en qué zonas de los diagramas
color-color se encuentran los AGN, podemos definir los criterios
de selección que utilizaremos para escoger nuestra muestra de
candidatos a AGN.
Los criterios de selección definirán un polígono dentro de un diagrama
color-color (o más bien un poliedro en un espacio multidimensional, en
el que cada coordenada es un color). El interior del polígono
(poliedro) es la región de selección, y las fuentes que se encuentren
en su interior serán los candidatos.
Para definir el poliedro utilizamos una combinación de desigualdades
aplicables a cada índice de color, o a combinaciones lineales de ellos.
Por ejemplo:
c23 > -0.1
c23 > 2*c12 - 0.8
c23 < 2*c12 + 0.8
c23 < 0.9
Define el interior del paralelogramo rosa de la siguiente figura. Este
criterio de selección encontraría prácticamente todos los cuásares
SDSS/SWIRE, salvo tres que quedan ligeramente fuera del borde. Sin
embargo, muchas fuentes que no son AGN se cuelan en la selección,
especialmente en la esquina inferior izquierda del paralelogramo.
Llamamos a estas fuentes, cuando no son AGN, contaminantes.

Si estamos
dispuestos a desechar los cuásares a z>3.5, o mejor aún, buscar un
criterio de selección específico para ellos, entonces una buena forma
de reducir la cantidad de contaminantes, en este caso concreto, sería
cortar la esquina inferior izquierda del paralelogramo añadiendo una
nueva condición, por ejemplo:
c12 > -0.05
Con esto dejamos fuera también los cuásares por encima de z > 3.5,
pero quizás podamos encontrar unos criterios que permitan separarlos de
las galaxias. Lo dejamos como ejercicio opcional.
1.7 Identificación de
contaminantes
No todas las fuentes que están próximas al "locus" de los cuásares lo
son. Algunas son galaxias o estrellas con SEDs muy diferentes a la del
cuásar, pero cuyos colores -en un diagrama color-color determinado-
pueden ser similares a los de un cuásar. Es importante destacar que las
galaxias y estrellas próximas al locus de los cuásares son diferentes
en cada uno de los posibles diagramas color-color, de modo que una
galaxia que en un diagrama color-color aparece en el locus, puede
quedar muy lejos en otro. Esto permite identificar y eliminar
contaminantes utilizando varios diagramas color-color.
Otra forma de eliminar contaminantes es utilizando el "stellar flag"
(columna mst del catálogo). Esta etiqueta indica si la fuente es
puntual (estelar) o extendida (galaxia). Los cuásares son fuentes
puntuales, de modo que para seleccionarlos podemos eliminar todas las
fuentes que son extendidas. Sin embargo, si nos interesan AGN de tipo
2, no podemos descartar las fuentes extensas ya que, al no ser el AGN
visible en el óptico, vemos la galaxia en su lugar.
1.8 Completitud y eficiencia de selección
Cualquier criterio de selección que utilicemos perderá algunos AGN, y
también seleccionará algunas fuentes que no lo son (falsos positivos).
Definimos la completitud como la fracción de los AGN verdaderos que son
seleccionados (por ejemplo, utilizando como referencia la muestra de
cuásares SWIRE confirmados).
La eficiencia de selección será la fracción de fuentes seleccionadas
que resultan ser verdaderos AGN, es decir, los que no son falsos
positivos.
Nuestro objetivo al elegir un criterio de selección es que tanto la
completitud como la eficiencia de selección sean lo más altas posibles,
pero siempre tendremos que llegar a un compromiso, pues una de ellas
incrementa a expensas de la otra.
Por lo tanto, se trata de intentar maximizar el número de AGN
confirmados de la muestra SDSS/SWIRE que entran en nuestro criterio de
selección, a la vez que se minimiza el número de fuentes de nuestro
cono que cumplen ese mismo criterio.
La eficiencia de selección no podemos calcularla sin saber qué
candidatos son verdaderos AGN y cuáles son falsos positivos, pero para
nuestros propósitos podemos suponer que un 0.1% de toda la muestra
SWIRE son cuásares, y que la muestra SDSS/SWIRE es representativa de
todos los cuásares SWIRE.
Por tanto, el número de candidatos verdaderos que esperamos encontrar con nuestro criterio de selección será: N = 0.001*NS*Comp, donde NS es el total de fuentes en nuestro cono de 1 grado cuadrado, y Comp es la completitud del criterio de selección.
Ejemplo:
Diseñamos un criterio de selección
por colores en el que las condiciones que imponemos para la selección
se verifican en 230 de los 278 AGN del catálogo SDSS/SWIRE, frente a
sólo 63 de las 30000 fuentes en nuestro cono del catálogo SWIRE.
La completitud será: 230/278 = 83%
Como sólo una de cada 1000 fuentes es
un cuásar, esperamos que nuestro cono contenga 30 cuásares. La
completitud del 83% implica que nuestro criterio encontrará: 30 * 0.827
~ 25 cuásares, mientras que otros ~5 se perderán (no verificarán el
criterio de selección).
Como nuestro criterio selecciona 63
fuentes, de las cuales sólo 25 esperamos que sean verdaderos cuásares,
la eficiencia de selección es: 25/63 = 40%
1.9 Verificación de
candidatos
Una vez tengamos la lista final de candidatos a cuásar, guardaremos una
tabla conteniendo sólo los candidatos seleccionados.
Podemos buscar información adicional sobre estas fuentes en el Nasa Extragalactic
Database (NED).
Para buscar la información disponible para cada fuente, vamos a la
primera columna (OBJECTS) y pulsamos sobre la opción "Near position".
Rellenamos el formulario con las coordenadas RA y DEC de la fuente, y
ponemos un radio de búsqueda pequeño, por ejemplo 0.1 arcmin.
Pulsando sobre el botón "Near Position Search" aparecerá un lista de
fuentes dentro del radio de búsqueda. Si nuestras coordenadas son
precisas (y lo son) la fuente que buscamos es la primera de la lista.
Entre la información que podemos encontrar en NED está la distribución
espectral de energía (SED) y clasificación espectral, si la hay. En la
sección BASIC DATA (casi al final de la página) podremos ver si la
fuente es un cuásar conocido (QSO), o ha sido identificado previamente
como candidato a cuásar pero aún no confirmado (Candidate QSO).
Recopilamos la información disponible en el campo Spectral type para
cada una de las fuentes, como se detalla en la figura:

1.10 Memoria de la práctica
Se elaborará una memoria de la práctica, de 6-8 páginas de extensión (valor orientativo).
La memoria incluirá los siguientes apartados:
- Objetivos
- Fundamento teórico
- Metodología
- Resultados
- Discusión
- Conclusiones