Nociones HTML

Nociones básicas de HTML

Conceptos generales

HTML describe el formato de un documento a base de la inserción de etiquetas, palabras reservadas del lenguaje rodeadas de los símbolos < >. Las etiquetas pueden ser de tres tipos:

Pareadas, cuando siempre aparece una etiqueta de inicio y otra de final. La etiqueta de final es como la de inicio, salvo que utiliza los símbolos </ >. De esta forma, se puede controlar el formato de bloques de texto.

<H1>Esto es un título</H1>

Sin parear, cuando la etiqueta representa la inserción de un elemento, como una imagen, un salto de línea

<IMG>

Opcionales, son etiquetas pareadas en las cuales no es necesario emplear la etiqueta de final. El final de un elemento viene dado por el inicio de otro. Ejemplos de este tipo son los párrafos o los elementos de una lista.

Esto es un párrafo Y esto otro.

Un elemento muy importante del lenguaje HTML son los atributos de cada etiqueta, que representan opciones que modifican su comportamiento por defecto. Los atributos se incluyen junto con la etiqueta correspondiente, dentro de los símbolos <>. Las etiquetas de final nunca incluyen atributos.

Los atributos pueden tener asignado un valor característico, que se incluye con el formato nombre="Σ". Este valor puede ser una opción dentro de una lista de posibilidades prefijadas, un nombre de fichero, un número, etc. Por lo general, siempre se debe incluir el valor entre dobles comillas, de forma que se respete la integridad de la información (por ejemplo los cambios de mayúsculas y minúsculas en un nombre de fichero o los espacios en blanco). Sin embargo, cuando el valor es una opción de una lista prefijada o un número, es posible prescindir de las comillas.



<IMG SRC="FotoGrande.gif">
<HR NOSHADE> HTML no distingue entre mayúsculas y minúsculas, por lo que las etiquetas podrán escribirse con cualquier combinación de caracteres, buscando siempre la mejor legibilidad del documento. Sin embargo, determinados valores de atributos en los que sea importante respetar los cambios mayúscula/minúscula deben ir entrecomillados.

A la hora de presentar un documento en pantalla, los clientes Web no respetan el posible formato que se aplique a los documentos (espacios entre líneas o palabras adicionales, tabuladores, etc.), sino que deben ser las propias etiquetas de HTML las que controlen este formato.

Anidamiento de etiquetas

HTML permite anidar etiquetas, es decir, agruparlas de forma que el efecto de presentación conseguido sea la suma de los efectos de cada etiqueta por separado.

Esto es negrita e itálica Existen unas reglas estrictas que indican en qué forma se pueden anidar las etiquetas. Los diferentes estándares de HTML recogen estas reglas, ya que no todas las combinaciones están permitidas.

En ningún caso se deben solapar las etiquetas, es decir, que el final de una etiqueta aparezca antes que el de otra insertada después de ella. Se verá mas claro con un ejemplo:

Prohibido

<ETI1> <ETI2> </ETI2> </ETI1> Correcto

Corrección sintáctica de los documentos

Como cualquier lenguaje de programación, HTML tiene un conjunto estricto de reglas, que fijan la sintaxis correcta de un documento; estas reglas se centran en tres aspectos principales: estructura general de un documento, etiquetas y atributos de las mismas, y posibles formas de combinar (anidar) etiquetas.

Para garantizar la corrección de un documento, y su adecuada interpretación por un browser, los editores HTML obligan al autor a seguir un conjunto mínimo de reglas sintácticas, que garanticen la correcta interpretación de un documento. Algunos editores ayudan al programador en estas labores, pero por lo general, y dado la enorme cantidad de documentos que circulan por Internet, es imposible garantizar la corrección de un alto porcentaje de la información disponible.

Por ello, los clientes Web están implementados de forma que sean capaces de mostrar documentos sintácticamente incorrectos, siguiendo unas sencillas reglas.

Si se encuentra una etiqueta desconocida o mal escrita, es ignorada. El subsiguiente texto se muestra como si la etiqueta no estuviese presente.
Si se encuentra un atributo desconocido, o con un valor erróneo o fuera de rango, se ignora, y el mencionado atributo toma el valor por defecto del mismo.
Si se encuentra una combinación de etiquetas anidadas no permitida, se presenta el efecto conjunto, siempre que entre dentro de las capacidades del browser. En caso contrario, sólo se representará la primera etiqueta procesada.
Sin embargo, los errores sintácticos se pueden representar de una forma arbitraria por parte de un cliente, por lo siempre deben ser evitados, para evitar la arbitraria interpretación de un documento.
Como problema más grave, los errores sintácticos pueden producir fallos en la ejecución del cliente, mientras éste trata de presentar la combinación no permitida.

Estructura de un documento HTML

Un documento HTML es un fichero de texto plano, que utiliza una serie de directivas o palabras reservadas para indicar los atributos de formato y estructura de la información que contiene.

Para que un cliente Web entienda que fichero contiene información HTML, se le debe dar un nombre que termine en .htm, o .html, (las dos extensiones más comunes de estos ficheros), o cualquier otra que se recoja en la definición MIME de esta clase de ficheros en un entorno particular.

<HTML>
<HEAD>
<TITLE>Información del cabecero del documento </TITLE>
</HEAD>
<BODY>
Contenido visible de la página
</BODY>
</HTML> Toda la información incluida dentro del documento HTML debe estar rodeada por las etiquetas <HTML> </HTML>. Dentro ellas, se pueden identificar dos partes, denominadas encabezado y cuerpo, con diferentes cometidos:

En el encabezado <HEAD> </HEAD>, se incluye información variada sobre características del documento. Sus contenidos no se presentan directamente en el documento.
En el cuerpo <BODY> </BODY>, está la descripción de los elementos que componen el propio documento, es decir, los datos que se presentarán en la pantalla. <BODY> permite controlar algunos atributos sobre la apariencia global del documento, que se verán más adelante. Por ahora se utilizará sin parámetros.

Dentro del encabezado existe una única etiqueta de inclusión obligatoria, denominada <TITLE> </TITLE>. La cadena incluida entre las etiquetas especifica el título mostrado en la ventana del cliente Web cuando se accede al documento. También se utiliza como referencia al añadir un bookmark. La cadena no debe contener etiquetas de formato.

A la hora de asignar un título a un documento, se debe incluir una descripción breve y concisa información del contenido del mismo, y el ámbito en que se sitúa, evitando nombres demasiado genéricos como Pagina principal, Bienvenidos, Indice.

<HTML>
<HEAD>
<TITLE>Mi primera página HTML</TITLE>
</HEAD>
<BODY>
Todavía no sabemos que poner....
</BODY>
</HTML>