Internet Archive (Archivo de Internet) es una organización sin ánimo de lucro que, desde hace 20 años, intentan preservar todo el trabajo digital publicado por la humanidad y, además, crear una enorme colección a la que se puede acceder a través de la página web archive.org.
Con sede en San Francisco, Internet Archive tiene una importante tarea ya que, además de páginas webs, intenta recopilar libros, programas de televisión, archivos de audio, música, revistas, programas de software…
No están todas las páginas Web archivadas, es decir, puede que la página esté disponible pero si es demasiado grande y muy dinámica resulta imposible guardar todas sus representaciones. Un ejemplo de esto es YouTube. Está página durante 2015 recibía al día más de 300 horas de video por minuto por lo que sería
muy difícil guardar cada uno de estos videos.
Internet Archive selecciona la información y la priorizacaptando todo aquello que cree que resultará importante y popular. Para captar la Web utiliza crawlers, es decir, programas informáticos que rastrean la página de manera sistemática para encontrar e indexar la información.
Navegar por de Internet Archive, no es una tarea fácil. No se trata de buscar como en Google. En el caso de las páginas webs, el usuario puede introducir la dirección y navegar por un calendario que marca que día se capturó esa página. En el caso de otros materiales, la búsqueda se lleva a cabo a través de datos como el autor o el título de la obra.
Uno de los problemas que puede girar en torno a Internet Archive son los derechos de autor. La entidad intenta hacer frente a este inconveniente de varias maneras. Por una parte, el propietario de la página Web puede solicitar que su página no se archive por lo que se le proporciona unas instrucciones que evitarán que los “crawlers” la rastren. Por otro lado, algunos materiales archivados están en formato de préstamo, por lo que solo se puede acceder si estas registrado.
Alexis Rossi, directora de medios y acceso, ha afirmado que no quieren “dañar el modelo de negocio de nadie” únicamente buscan cumplir con el papel de biblioteca, pero con respeto.