Para ser visualizados en Internet, los documentos son salvados en formato texto y contienen las marcas necesarias para informar al navegador (Netscape, MsIe o Explorer) al respecto. En otras palabras, el navegador visulizará en cualquier caso los documentos con texto salvados en formato .htm, pero si éstos carecen de marcas HTML aparecerán sin formato de ningún tipo: sin separación de líneas o párrafos, sin texto alineado, sin negritas, cursivas, etc.
La finalidad del HTML es dotar, mediante unos comandos denominados marcas , de formato al documento, así como insertar imágenes y otros elementos multimedia (filmaciones, apliques, etc.). El trabajo que un editor web realiza en el documento HTML está dirigido a proporcionar al navegador toda la información necesaria para interpretar correctamente la página.

Un documento HTML se divide en dos partes fundamentales: el encabezamiento o cabecera y el cuerpo del documento.
Es fácil comprender que el cuerpo del documento contiene todos los elementos de la página: el texto, las imágenes, los apliques (applet) Java, el código Javascript y todo lo que es visualizado materialmente por el navegador.
Por el contrario, la cabecera contiene una serie de datos que el navegador necesita para interpretar correctamente el documento, pero que no se visualizan dentro del mismo. La cabecera tiene, por tanto, una función no visible pero fundamental. Entre los elementos facilitados por la cabecera podemos citar: el título de la página, los términos clave para los buscadores, el tipo de HTML soportado y los enlaces base de referencia.
Aquí analizaremos sólo algunos elementos, omitiendo por el momento el estudio de aquéllos que no resultan inmediatamente necesarios para la comprensión del HTML:
  • HTML
  • DOCTYPE
  • HEAD
  • TITLE
  • META
A continuación describiremos detalladamente las peculiaridades más relevantes de cada uno de los elementos anteriores.
<HTML>

Todos los elementos y el contenido de un documento HTML están encerrados dentro de las marcas <HTML></HTML> cuya función es servir de apertura y cierre al archivo. Las marcas <HTML></HTML> indican al navegador que el documento está marcado en HTML, si bien los navegadores más recientes (Netscape 3 y 4, MsIe 3,4 y 5) consiguen interpretar igualmente las marcas sucesivas. Dicho esto, existen en cualquier caso dos razones para introducir siempre la marca <HTML></HTML> dentro del documento:
·  HTML no es el único lenguaje de marcado presente en el WWW (piénsese, por ejemplo, en el XML) y corremos el riesgo de que el navegador malinterprete las marcas, confundiéndolas con otros lenguajes de marcado.
·  Los usuarios de viejos navegadores corren el riesgo de visualizar un documento pésimamente formateado.
DOCTYPE

Siguiendo las indicaciones del W3C (consorcio internacional que se ocupa de normalizar el uso del HTML) Doctype debería ser el primer elemento que abriera un documento. Esto quiere decir que iría colocado antes de <HTML>.
Se trata de una marca que no precisa de cierre y cuya función es proporcionar información al servidor de web anfitrión de la página. Los datos que facilita DOCTYPE se refieren al tipo de documento visualizado además de ser necesarios para la comunicación entre navegador y servidor. DOCTYPE se debe escribir de una forma estándar:

<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">

Esta línea proporciona algunos datos sobre el documento:
·  HTML PUBLIC: el documento es público
·  IETF: el tipo de HTML público está gestionado por la Internet Engineering Task Force
·  DTD HTML 4.0: la versión de HTML soportada es la 4.0
·  EN: el idioma del documento es el inglés

El uso de DOCTYPE no es obligatorio y puede omitirse. Ciertamente, su utilización ayuda al servidor de web a interpretar correctamente el documento, pero su falta no condiciona la correcta visualización.

Tal y como puede observarse fácilmente DOCTYPE es una marca que no prevé elemento de cierre (no se escribe de esta manera: <!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN"></DOCTYPE>)
<HEAD>

Los elementos <HEAD></HEAD> se colocan inmediatamente después de la apertura de la marca <HTML> y cierran el encabezamiento propiamente dicho del documento; es decir toda la información que necesita el navegador, el servidor de web y los motores de búsqueda. Se trata del primer elemento que lee el navegador y, por ello, es el mejor lugar para insertar sintaxis script . Dentro de <HEAD></HEAD> se introduce el título del documento y otros datos. He aquí la sintaxis HTML de un documento con los comandos hasta ahora examinados:

<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">
<HTML>

<HEAD></HEAD>

</HTML>
<TITLE>

El elemento <TITLE></TITLE> es el más utilizado dentro de la marca <HEAD>, dado que sirve para dar título a la página. El título suele ser visualizado por los navegadores en la cabecera de página. La que figura a continuación es la imagen del TITLE de HTMLpoint (el texto es: HTMLpoint - el sitio italiano sobre el Web publishing):



En caso de que el URL se guarde con "agrega a favoritos" (para MsIe) Y "agrega a marcapáginas" (para Netscape) la marca TITLE da nombre a la conexión. En otras palabras, cuando se guarda la dirección, el navegador asigna al mismo lo que aparece dentro de <TITLE></TITLE>. La imagen que sigue muestra el efecto en MsIe (idéntico para Netscape):

El contenido que aparece entre las marcas <TITLE></TITLE> es utilizado también por algunos buscadores para indicizar la página y buscar palabras clave. Altavista constituye probablemente el ejemplo más eclatante. Por ello, es recomendable proporcionar en el TITLE una descripción detallada aunque sintética de la página, con todas las palabras clave que los buscadores pueden indicizar.
Un consejo que conviene tener presente es el de no exagerar con la longitud del texto, teniendo presentes las exigencias de quienes añaden el sitio al marcapáginas y de los buscadores.

La sintaxis correcta de la marca TITLE es la siguiente:

<TITLE>Mi primera portada con la guía de HTMLpoint</TITLE>
META

Los buscadores representan un recurso indispensable para quienes buscan información en la red, y sitios como Altavista, Yahoo, Lycos y Excite se cuentan entre los más visitados de Internet.
Figurar en dichos motores de búsqueda es fundamental para quien crea páginas web y quiere mayor visibilidad. Es necesario, antes de nada, señalar las propias páginas a estos buscadores, lo que se efectúa mediante pequeños formularios presentes en las páginas web bajo la frase "Add your site". Periódicamente estas arañas (spider) supervisan los millones de páginas contenidos en sus bases de datos verificando las eventuales modificaciones.

Además de ser incluidos en los buscadores, es importante figurar en los primeros puestos de la lista que aparece al efectuar la búsqueda (a menudo, sobre todo cuando los términos que se buscan son de uso frecuente y de carácter general, aparecen en las listas miles de sitios). Para ello, debemos adoptar algunas sencillas medidas.
Fundamentales por lo que se refiere a este objetivo resultan las marcas de metainformación (META), cadenas de códigos que figuran en la cabecera del documento, entre <HEAD></HEAD> y que son las primeras que leen los buscadores.
Las palabras clave (keywords) son los términos que, de manera resumida, describen el contenido de una página web. Si, por ejemplo, el sitio se ocupa de la realización de páginas web, las palabras clave serán:

HTML
realización páginas web
portada
buscadores
precios módicos
.......

La marca META deberá impostarse como sigue:

<META name="keywords" Content="HTML, realización páginas web, portada, buscadores, precios módicos">

La coma divide unos términos de otros. No se escriben comas dentro de las frases que constan de más de un vocablo para que el buscador puede encontrarlas tal y como aparecen escritas.

Naturalmente, si vuestro sitio es multilingüe será recomendable incluir palabras clave en todos los idiomas del sitio, prestando siempre mucha atención para evitar usar términos demasiado genéricos. En el caso de que se tratara de nombres propios, es aconsejable incluir la forma singular y plural. El buscador considera el número de veces que se repite un término dentro de la página y de las palabras clave; sin embargo, repetir exageradamente la misma palabra en la marca META tiene el efecto contrario al deseado ya que la mayor parte de las arañas cancelan estos sitios de las propias bases de datos. Por ello, insistimos en no exagerar con el número de términos incluidos en las palabras clave.

Otras marcas de metainformación se refieren al autor de la página web:

<META name="author" content="Nombre Apellidos">

el título que aparecerá tras la búsqueda:

<META name="description" content="Mi primera portada con la guía de HTMLpoint">

y el nombre del editor con el que se ha generado el documento HTML:

<meta name="GENERATOR" content="BLOC DE NOTAS Win95">

Si por cualquier razón quieres que una de tus páginas NO sea indicizada en los motores de búsqueda, deberás incluir la siguiente marca de metainformación:

<META NAME="ROBOTS" CONTENT="NOINDEX">

Otra marca META es la que permite el "refresh" de la página. Esto significa que la misma página u otra diferente puede lanzarse automáticamente tras un cierto número de segundos determinado por nosotros mismos.
He aquí el código:

<META HTTP-EQUIV="Refresh" CONTENT="5; url=pippo.htm">

Donde CONTENT="5 es el número de segundos en los que la nueva página será cargada, mientras que url=pippo.htm" es el archivo que será cargado.
RESUMEN DE LA LECCIÓN

A continuación figura una página HTML impostada según cuanto hemos visto en esta lección. Esta página constituirá también un punto de referencia para las lecciones siguientes:

<!DOCTYPE HTML PUBLIC ="-//IETF//DTD HTML 4.0//EN">
<HTML>

<HEAD>

<META name="keywords" Content="HTML, realización páginas web, portada, buscadores, precios módicos">
<META name="description" content="Mi primera portada con la guía de HTMLpoint">
<meta name="GENERATOR" content="BLOC DE NOTAS Win95">
<META name="author" content="Nombre Apellidos">

<TITLE>Mi primera portada con la guía de HTMLpoint</TITLE>

</HEAD>

</HTML>
Axact

Moosh Redacción

Este artículo es exclusiva responsabilidad del equipo periodístico de Moosh, Inc. Cualquier parecido con la realidad es pura y mera coincidencia. Algunos nombres han sido cambiados por motivos de derechos de autor.

Comenta: