Wayback Machine y Cloudflare quieren respaldar la Web

La web es descentralizado y fluido por diseño, pero todo ese caos y lo efímero puede hacer que sea difícil mantener un sitio activo y en línea sin interrupciones. Eso es lo que ha hecho que la función Wayback Machine de Internet Archive sea tan valiosa a lo largo de los años, manteniendo un historial de páginas olvidadas. Ahora, su memoria profunda ayudará a garantizar que los sitios que visite nunca se caigan, a través de una asociación con la empresa de infraestructura de Internet Cloudflare.

Desde 2010, Cloudflare ofrece una función llamada Always On, que almacena en caché una versión estática de los sitios que puede servir a los visitantes en caso de tiempo de inactividad. Always On fue uno de los originales de CloudFlare ofrendas; John Graham-Cumming, director de tecnología de la compañía, dice que la infraestructura que la impulsa debía ser reestructurada. Al pensar en cómo modernizarlo, el equipo tuvo una idea: ¿Por qué no usar Wayback Machine, el gigante de rastreo y almacenamiento en caché existente, para encender Always On? Internet Archive ya ofrecía una interfaz de programación de aplicaciones que facilitaría a Cloudflare extraer lo que necesitaba.

«Trabajamos con ellos para asegurarnos de que estaban de acuerdo con que lo usáramos de esta manera», dice Graham-Cumming. «Es una de esas cosas en las que es como, sí, esto funciona para todos, así que hagámoslo. Si vienes a un sitio web que usa Cloudflare y está fuera de línea, mostraremos la última versión que está en el archivo de Wayback Machine».

Internet Archive dice que agradeció la oportunidad de colaborar con Cloudflare para Always On. Y la organización ha ampliado recientemente su enfoque en la confiabilidad del sitio web y la integridad técnica en la web. En febrero, Anunciado un proyecto con el navegador Brave para ofrecer un caché reciente de un sitio web si los usuarios se encuentran con un error 404. Algunas extensiones de navegador han proporcionado esta funcionalidad a lo largo de los años, pero Internet Archive dice que integrarlo completamente en un navegador y ofrecerlo a través de Always On es un paso positivo.

La asociación con Cloudflare también permitirá a Wayback Machine encontrar aún más sitios web para rastrear, una bendición para Internet Archive. Durante más de dos décadas, Wayback Machine ha archivado la mayor cantidad posible de la web pública, agregando más de mil millones de URL al día al corpus. En total, el archivo contiene más de 468 mil millones de páginas web y más de 45 petabytes de datos. Pero incluso con todas las señales, listas y fuentes que usa Wayback Machine para rastrear a lo largo y ancho, Internet Archive siempre está buscando formas de encontrar los sitios que se ha perdido. Always On ofrece uno, debido a la amplia y lejana base de clientes de Cloudflare.

Cloudflare sirve a más de 25 millones de sitios y los operadores de dominio deberán optar por usar Always On con Wayback Machine. El servicio siempre ha sido gratuito para los usuarios de Cloudflare y seguirá siéndolo. Pero el fundador de Internet Archive, Brewster Kahle, y el director de Wayback Machine, Mark Graham, dicen que su infraestructura podrá manejar las consultas adicionales y la extracción de datos de Always On.

«Simplemente nos gustaría que la Web sea más confiable», dice Kahle. «Queremos una infraestructura sólida y podemos ser parte de ella, pero no lo somos todos. Queremos que varios participantes trabajen juntos de diferentes maneras. No seríamos una red de distribución de contenido muy buena y tal vez Cloudflare no sería necesariamente el mejor archivo de la web «.

Kahle dice que la asociación con Cloudflare ha sido muy constructiva en las primeras pruebas y le gustaría ver más colaboraciones que crucen lo que él llama «el límite de .com, .org».

Sin embargo, Graham, de Wayback Machine, enfatiza que, en última instancia, cualquier colaboración o proyecto debe cumplir la misión principal de Internet Archive. «Siempre estamos buscando más formas en las que podamos hacer un mejor trabajo de archivar más de la web pública», dice. «Esta es otra fuente de recursos web que podemos preservar y poner a disposición, con suerte para siempre, sin duda durante toda nuestra vida. Mientras estemos cerca, vamos a seguir así».

Probablemente el tipo de dedicación poco común que desea como póliza de seguro para su sitio web.


Más historias geniales de WIRED

.

Deja un comentario

Cart
Your cart is currently empty.