2 recursos para acceder al contenido de webs que no funcionan o que incluso han cambiado

Dos trucos para acceder al contenido de webs que no funcionan o que incluso han cambiadoEn Internet hay tanta información que la única manera que hay localizar lo que se desea encontrar (si no se sabe dónde está) es empleando buscadores (en el caso de una imagen se puede intentar encontrar también buscando no con palabras clave sino con un fichero).

A pesar de las continuas mejoras en los algoritmos de búsqueda, no siempre los primeros resultados son los que necesitamos. Eso implica tener que visitar más de una página web y el proceso requiere su tiempo. Hay pocas cosas más frustrantes que creer encontrar la información deseada y que la página dé un error por una u otra razón.

Ante esta situación, existe un recurso muy interesante que normalmente está disponible, tanto si se usa Google como Bing, y que consiste en ver la versión almacenada “En caché” (y que no es más que el contenido de la página en los servidores del buscador utilizado) desplegando un pequeño menú al lado del resultado.

Resultados de Google en caché

Resultados de Google en caché

De esta manera, tanto si la web funciona como si no, se pueden leer al menos los contenidos (sin imágenes ni documentos, solo el texto). En el caso de Bing además resalta en color cada una de las palabras de la consulta para que sean fáciles de localizar visualmente (hasta hace poco Google también lo hacía y me parecía una función utilísima).

Resultados de Bing en caché

Resultados de Bing en caché

Pero ¿qué pasa si queremos acceder a un contenido de una página que ya ha cambiado sustancialmente y eliminó una o más secciones? ¿Y si quisiese ver cómo era esa página en el pasado?

Volver atrás en el tiempo (en la web)

Para ello existe (en mi opinión) una de las mejores herramientas (gratuitas) de Internet: el archivo de Internet (Internet archive) y en particular su máquina del tiempo (Wayback Machine) disponible en este enlace http://www.archive.org/web/web.php.

Wayback machine

Wayback machine

Es, además, muy fácil de utilizar: Solo hay que introducir la dirección de la página web y darle a “Take me back”. Inmediatamente aparece un calendario con todas las instantáneas de la página almacenadas.

Instantáneas de este blog en Wayback machine

Instantáneas de este blog en Wayback machine

Haciendo clic en cualquiera de ellas se visualiza la página (en este caso sí se incluyen las imágenes normalmente) exactamente tal y como estaba en esa fecha. Incluso se puede navegar por la web. Muy útil para encontrar informaciones antiguas y así demostrar que se había publicado un cierto dato o, incluso, para curiosear cómo eran algunas páginas web hace años (incluyo algunas capturas de pantalla de servicios famosos al final del post).

Imagen del blog el 6 de marzo de 2012 en Wayback machine

Imagen del blog el 6 de marzo de 2012 en Wayback machine

Aquí un vídeo sobre esta herramienta:

Algunas páginas de empresas famosas en sus orígenes:

Google – Enlace a Wayback el 2 de diciembre de 1998

Google el 2 de diciembre de 1998

Google el 2 de diciembre de 1998

YouTube – Enlace a Wayback el 28 de abril de 2005

YouTube el 28 de abril de 2005

YouTube el 28 de abril de 2005

Apple – Enlace a Wayback el 22 de octubre de 1996

Web de Apple el 22 de octubre de 1996

Web de Apple el 22 de octubre de 1996

 

11 Responses to 2 recursos para acceder al contenido de webs que no funcionan o que incluso han cambiado

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Seguir a ChristianDvE en Twitter
 TwitterFacebook YouTubePinterestInstagramFeed
Recibe por correo electrónico los nuevos contenidos para no perderte ninguno (frecuencia muy baja). Responsable: Blog de ChristianDvE. Finalidad: enviar nuevos artículos y novedades por email. Legitimación: su consentimiento. Destinatarios: los datos los custodiará Mailrelay. Derechos: acceder, rectificar, limitar y suprimir sus datos
Sígueme (si quieres) también en Feedly
Archivos
Creative Commons
Los contenidos de este blog se encuentran bajo una Licencia Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported.
Hosting por Raiola.