~sergio

ARTIGOS

Ler unha URL para identificar si é real ou falsa

30-01-2024

Saber como ler unha URL é unha habilidade que estos días ten que ter todo o mundo e non solo os admins de rede ou os programadores web. Xa que así é como a maioría de estafadores e phishers atacan ás súas víctimas.

Estructura de unha URL

Unha URL ten a seguinte estructura:

http://www.exemplo.com:80/ruta/o/arquivo.html?var1=valor1&var2=valor2#LugarNoDocumento
-1--   ------2-------- 3 -------4------------ ----------5------------ --------6-------

Sendo:

  1. Esquema. Informa ó navegador do protocolo que ten que usar para acceder a esa URL, sendo normalmente para web http ou https.
  2. Dominio.
  3. Porto.
  4. Localización de un recurso. Comeza con unha "/". Nos primeiros tempos da web, representaba a localización física de un arquivo no servidor web. Hoxe en día, tamén pode ser unha abstracción manexada polo servidor web sin necesidade de representar unha realidade física.
  5. Parámetros extra proporcionados ó servidor web. Comezan con unha "?". Esos parámetros son un listado de pares chave/valor separados polo símbolo "&". O servidor web pode usar esos parámetros antes de enviar o recurso ó que se apunta en 4. Cada servidor web ten as súas propias reglas con respecto ós parametros e a única maneira de saber si un determinado servidor web está usando certos parámetros é preguntándolle ó propietario do servidor web.
  6. Anchor ou anclaxe. Comeza con un "#". Apunta e enlaza a algún lugar no recurso en sí mesmo. É unha especie de «marcador» dentro do recurso, indicándolle ó navegador as direcciós a tomar para chegar ó punto «marcado». En un documento HTML, por exemplo, o navegador vai facer scroll ata que chegue a ese punto.

Atopar o dominio raíz

Vemos no apartado anterior donde se ubica o dominio(2) dentro dunha URL pero o máis importante é saber cal é o dominio raíz, xa que é donde realmente vai estar aloxada esa URL, o que nos permitirá saber si unha URL é falsa ou non. O dominio raíz será "eff" en "eff.org" ou "wikipedia" en "wikipedia.org".

Aquí tes unhos pasos a seguir para identificar o dominio raíz:

  1. Busca o símbolo "/" máis alonxado da dereita, mirando de dereita a esquerda será o último que atopes (que non sexa o pertencente ó separador entre o esquema e o dominio, é decir o "://"). Si non atopas ningún empeza a mirar o seguinte paso desde o carácter máis á dereita.
  2. Ahora, a seguinte sección será o tipo de dominio: .gal, .es, .com, .net e así. Á esquerda do tipo de dominio vai haber un ".".
  3. Á esquerda do tipo de dominio está o dominio raíz. Terá un "." a cada lado.
  4. Seguindo á esquerda do dominio raíz estarán os subdominios ou nada.

Exemplos:

  1. www.eff.org
    • .org é o tipo de dominio (tamén se lle chama TLD ou Top Level Domain).
    • eff será o dominio raíz.
    • www é un subdominio.
  2. https://es.wikipedia.org/wiki/Aaron_Swartz
    • /wiki/Aaron_Swartz é a ruta ó recurso
    • .org é o TLD
    • wikipedia é o dominio raíz
    • es é un subdominio
  3. login.tu-empresa.es.80df11bc-0c51-4ea9-a4f4-b512a003884a.free-hosting.net/3ab9/4326/8619/login.php?email=foo@tu-empresa.es
    • ?email=foo@tu-empresa.es son os parámetros da URL
    • /3ab9/4326/8619/login.php é o recurso
    • .net sería o TLD
    • free-hosting é o dominio raíz
    • o resto hacia a esquerda é un encadenado de subdominios para intentar enmascarar o dominio raíz e facer crer que login.tu-empresa.es é o dominio correcto.

Trucos que usan os estafadores nas URLs

O truco principal e mais usado é comprar e usar un dominio raíz que semelle o dominio real. Usando algún destes trucos:

Despóis de atopar o dominio raíz fíxate ben na palabra para comprobar que é a que pensas que é.

Os atacantes intentaran facer os nomes de dominio super largos e complexos para que non busques o dominio raíz. Poden agregar centos de carácteres a un dominio ou subdominio. Non importa o largo que sexa, seguindo as reglas anteriores deberías poder identificar cal é o dominio raíz.

Recapitulando

Mira na URL que che ofrezan de dereita a esquerda ata que atopes a última "/" e teña un TLD (.com, .es, .net) á súa esquerda, así atoparás o dominio raíz. Da igual como de larga sexa a URL.

Recorda, busca sempre o dominio raíz antes de pinchar en unha URL.