Founder of MalwareIntelligence, a site dedicated to research on all matters relating to anti-malware security, criminology computing and information security in general, always from a perspective closely related to the field of intelligence.

sábado, 17 de noviembre de 2007

¿QUÉ SON URL Y URI?
Se ha generalizado el uso de la expresión URL para hacer referencia a todas las direcciones Web, aunque en la actualidad se recomienda utilizar la expresión URI en su lugar. En este artículo se analiza estas expresiones y se estudia la diferencia.

¿Qué es un URL?
Los URLs (Uniform Resource Locator) son identificadores que permiten acceder a recursos (páginas) web. En la misma forma en que los humanos utilizamos direcciones para identificar y encontrar ubicaciones, los URLs le sirven al navegador (y otros sistemas) para encontrar una página o recurso Web en el vasto mundo del Internet.

¿Cuál es la diferencia entre URL y URI?
Aunque se acostumbra llamar URLs a todas las direcciones Web, URI es un identificador más completo y por eso es recomendado su uso en lugar de la expresión URL.

Un URI (Uniform Resource Identifier) se diferencia de un URL en que permite incluir en la dirección una subdirección, determinada por el "fragmento. Esto se comprende mejor analizando la estructura de un URI.

Estructura de un URI
ESQUEMA : PARTE JERARQUICA ? SOLICITUD # FRAGMENTO

Ejemplo:
http : //www.hispamedios.com/ ? pagina=2 # inicio

Esquema
El esquema identifica el protocol que se va a usar. Aunque el protocolo más común es sin duda el http, existe una variedad de esquemas registrados para variedad de funciones como por ejemplo ftp para transferencia de archivos. Esta es la lista completa de esquemas registrados: cid, data, dav, fax, ftp, file, gopher, http, https, imap, ldap, mailto, mid, news, nfs, nntp, pop, pres, sip, sips, snmp, tel, telnet, urn, wais, xmpp.

Existe también en uso una gran variedad de esquemas no registrados, por ejemplo irc para canales de conversación y ssh para establecer conexiones seguras.

Parte jerárquica de un URI
La parte jerárquica de la dirección contiene la información del dominio o IP para acceder al servidor y la ruta en el servidor para acceder al recurso. Por ejemplo:

//www.servidor.com/ruta/para/recurso.html

Las dos barras inclinadas al principio ( // ) indican que la dirección debe ser pasada al recurso para que éste la interprete. El servidor puede ser un IP o un nombre de dominio (como en el ejemplo) y puede llevar parámetros como el puerto e información de control de acceso, como en este caso:

http://usuario:clave@miembros.sitio.com:80/

Existen caracteres conocidos como ‘reservados’ que se utilizan para delimitar la dirección y su uso será interpretado como tal. Por ejemplo, el más común de los caracteres reservados es la barra inclinada ( / ) que indica jerarquía, de igual forma que en una estructura de carpetas en un sistema de archivos. Estos son los caracteres reservados:
/ : ? # [ ] @ ! $ & ' ( ) * + , ; =

Los caracteres no reservados son los que no tienen un significado asignado y se pueden utilizar en la construcción de la ruta. Estos son: letras, números y los caracteres - . _ ~

NOTA: Desde el punto de vista de mercadeo electrónico, a fin de que los buscadores indexen las palabras clave en la dirección, se recomienda solo el uso de letras, números, el punto y el guión medio para separar palabras; es decir, no usar el guión bajo ni la “tilde” ( ~ ).

Solicitud
La solicitud indica variables que se pasan al recurso (página) Web. Está separada de la ruta mediante el signo de interrogación y termina donde empieza el fragmento delimitado por el caracter numeral ( # ) si lo hubiere, por ejemplo:

/miruta.html?variable=valor&variable2=valor2

Fragmento
Permite indicar una subdirección dentro del recurso al que apunta la dirección. Esta delimitado por el caracter numeral ( # ) y se extiende hasta donde se termina el URI. Por ejemplo:

/miruta.html#subdireccion

Este fragmento es la diferencia entre un URL y un URI. Los URLs no identifican fragmentos y por esto se recomienda utilizar la expresión URI cuando se hable de direcciones completas. Sin embargo, el uso de la expresión URL se ha generalizado al punto de que por ella se entiende cualquier dirección Web sin tener en cuenta los detalles técnicos.

Uso de mayúsculas y minúsculas
De acuerdo al estándar STD66, las partes de un URI se comportan de diferente forma:
El esquema y el dominio son insensibles a mayúsculas y por lo tanto se generalizan como minúsculas. La ruta en cambio sí es sensible, al igual que la solicitud y el fragmento. Claro, esta sensibilidad depende también del servidor que esté procesando la dirección, ya que dicho servidor puede estar configurado para normalizar todo a minúsculas. Sin embargo, la mayoría de los servidores, en particular Apache, respetan el uso de mayúsculas en las partes apropiadas. Ejemplos:

Correcto:
http://www.dominio.com/carpeta/definir-URL-URI.html

Incorrecto (o se normalizará a minúsculas):
HTTP://www.DOMINIO.com/

Fuente: http://www.hispamedios.com/articles/id34-url-y-uri

0 comentarios:

Publicar un comentario