Nociones
básicas de HTML
Conceptos
generales
HTML describe el formato de un documento a base
de la inserción de etiquetas, palabras reservadas del lenguaje
rodeadas de los símbolos < >. Las etiquetas pueden ser de tres
tipos:
-
Pareadas, cuando siempre aparece una etiqueta
de inicio y otra de final. La etiqueta de final es como la de inicio, salvo
que utiliza los símbolos </ >. De esta forma, se puede controlar
el formato de bloques de texto.
<H1>Esto es un título</H1>
-
Sin parear, cuando la etiqueta representa
la inserción de un elemento, como una imagen, un salto de línea
<BR> <IMG>
-
Opcionales, son etiquetas pareadas en las
cuales no es necesario emplear la etiqueta de final. El final de un elemento
viene dado por el inicio de otro. Ejemplos de este tipo son los párrafos
o los elementos de una lista.
<P>Esto es un párrafo <P>Y esto
otro.
Un elemento muy importante del lenguaje HTML son
los atributos de cada etiqueta, que representan opciones que modifican
su comportamiento por defecto. Los atributos se incluyen junto con la etiqueta
correspondiente, dentro de los símbolos <>.
Las etiquetas de final nunca incluyen atributos.
Los atributos pueden tener asignado un valor característico,
que se incluye con el formato nombre="Σ".
Este valor puede ser una opción dentro de una lista de posibilidades
prefijadas, un nombre de fichero, un número, etc. Por lo general,
siempre se debe incluir el valor entre dobles comillas, de forma que se
respete la integridad de la información (por ejemplo los cambios
de mayúsculas y minúsculas en un nombre de fichero o los
espacios en blanco). Sin embargo, cuando el valor es una opción
de una lista prefijada o un número, es posible prescindir de las
comillas.
<P ALIGN="right">
<P ALIGN=left>
<IMG SRC="FotoGrande.gif">
<HR NOSHADE>
HTML no distingue entre mayúsculas y minúsculas,
por lo que las etiquetas podrán escribirse con cualquier combinación
de caracteres, buscando siempre la mejor legibilidad del documento. Sin
embargo, determinados valores de atributos en los que sea importante respetar
los cambios mayúscula/minúscula deben ir entrecomillados.
-
A la hora de presentar un documento en pantalla, los
clientes Web no respetan el posible formato que se aplique a los documentos
(espacios entre líneas o palabras adicionales, tabuladores, etc.),
sino que deben ser las propias etiquetas de HTML las que controlen este
formato.
Anidamiento
de etiquetas
HTML permite anidar etiquetas, es decir, agruparlas
de forma que el efecto de presentación conseguido sea la suma de
los efectos de cada etiqueta por separado.
<B><I>Esto
es negrita e itálica</I></B>
Existen unas reglas estrictas que indican en qué
forma se pueden anidar las etiquetas. Los diferentes estándares
de HTML recogen estas reglas, ya que no todas las combinaciones están
permitidas.
En ningún caso se deben solapar
las etiquetas, es decir, que el final de una etiqueta aparezca antes que
el de otra insertada después de ella. Se verá mas claro con
un ejemplo:
<ETI1> <ETI2> </ETI1> </ETI2>
Prohibido
<ETI1> <ETI2> </ETI2> </ETI1>
Correcto
Corrección
sintáctica de los documentos
Como cualquier lenguaje de programación,
HTML tiene un conjunto estricto de reglas, que fijan la sintaxis
correcta de un documento; estas reglas se centran en tres aspectos principales:
estructura general de un documento, etiquetas y atributos de las mismas,
y posibles formas de combinar (anidar) etiquetas.
Para garantizar la corrección de un documento,
y su adecuada interpretación por un browser, los editores
HTML obligan al autor a seguir un conjunto mínimo de reglas sintácticas,
que garanticen la correcta interpretación de un documento. Algunos
editores ayudan al programador en estas labores, pero por lo general, y
dado la enorme cantidad de documentos que circulan por Internet, es imposible
garantizar la corrección de un alto porcentaje de la información
disponible.
Por ello, los clientes Web están implementados
de forma que sean capaces de mostrar documentos sintácticamente
incorrectos, siguiendo unas sencillas reglas.
-
Si se encuentra una etiqueta desconocida o mal escrita,
es ignorada. El subsiguiente texto se muestra como si la etiqueta no estuviese
presente.
-
Si se encuentra un atributo desconocido, o con un
valor erróneo o fuera de rango, se ignora, y el mencionado atributo
toma el valor por defecto del mismo.
-
Si se encuentra una combinación de etiquetas
anidadas no permitida, se presenta el efecto conjunto, siempre que entre
dentro de las capacidades del browser. En caso contrario, sólo
se representará la primera etiqueta procesada.
-
Sin embargo, los errores sintácticos se pueden
representar de una forma arbitraria por parte de un cliente, por lo siempre
deben ser evitados, para evitar la arbitraria interpretación de
un documento.
-
Como problema más grave, los errores sintácticos
pueden producir fallos en la ejecución del cliente, mientras éste
trata de presentar la combinación no permitida.
Estructura
de un documento HTML
Un documento HTML es un fichero de texto plano,
que utiliza una serie de directivas o palabras reservadas para indicar
los atributos de formato y estructura de la información que contiene.
Para que un cliente Web entienda que fichero contiene
información HTML, se le debe dar un nombre que termine en .htm,
o .html, (las dos extensiones más comunes de estos ficheros), o
cualquier otra que se recoja en la definición MIME de esta clase
de ficheros en un entorno particular.
<HTML>
<HEAD>
<TITLE>Información
del cabecero del documento </TITLE>
</HEAD>
<BODY>
<P>Contenido visible de la
página<P>
</BODY>
</HTML>
Toda la información incluida dentro del documento
HTML debe estar rodeada por las etiquetas <HTML>
</HTML>. Dentro ellas, se pueden identificar
dos partes, denominadas encabezado y cuerpo, con diferentes
cometidos:
-
En el encabezado <HEAD>
</HEAD>, se incluye información
variada sobre características del documento. Sus contenidos no se
presentan directamente en el documento.
-
En el cuerpo <BODY>
</BODY>, está la descripción
de los elementos que componen el propio documento, es decir, los datos
que se presentarán en la pantalla.
<BODY>
permite controlar algunos atributos sobre la apariencia global del documento,
que se verán más adelante. Por ahora se utilizará
sin parámetros.
Dentro del encabezado existe una única etiqueta
de inclusión obligatoria, denominada <TITLE>
</TITLE>. La cadena incluida entre
las etiquetas especifica el título mostrado en la ventana del cliente
Web cuando se accede al documento. También se utiliza como referencia
al añadir un bookmark. La cadena no debe contener etiquetas
de formato.
-
A la hora de asignar un título a un documento,
se debe incluir una descripción breve y concisa información
del contenido del mismo, y el ámbito en que se sitúa, evitando
nombres demasiado genéricos como Pagina principal, Bienvenidos,
Indice.
<HTML>
<HEAD>
<TITLE>Mi primera página
HTML</TITLE>
</HEAD>
<BODY>
Todavía no sabemos que poner....
</BODY>
</HTML>
