Navigation – Plan du site

Jean-Christophe Peyssard et Véronique Ginouvès

Internet Archives

Notice créée le 16/12/2009, révisée le 17/12/2009
internet-archives

Internet Archive est une bibliothèque virtuelle multimédia ouverte et universelle. Ce projet à but non lucratif de mise à disposition, et d'archivage des contenus culturel se découpe en quatre grands groupes :

- La Waybackmachine  / onglet Web (http://web.archive.org/) : la Waybackmachine est en quelque sorte un dépôt légal des sites web avant la lettre. Elle archive uniquement les sites publics et vous permet, en y indiquant l'adresse URL d'un site, d'en retrouver les évolutions au fil des ans. Vousa accédez ainsi à un index en trois dimensions indiquant la chronologie, l'url et le contenu. Lors de notre visite en décembre 2009, Internet Archive conservait plus de 150 billions de pages web archivées depuis 1996, soit plus de 3 petabytes de données. Toujours dans l'esprit de coopération et de préservation de la connaissance humaine Internet Archive partage avec la bibliothèque d'Alexandrie (Egypte) la conservation de cette archive du web par la mise en place d'un site mirroir  : http://archive.bibalex.org/. L'internaute peut signaler des sites à archives à la Waybackmachine, l'image du site -si il est retenu- s'affiche 6 à 12 mois après sa capture. La fréquence de ces instantanés est variable et n'est pas systématisée. Depuis 2007, Archive-Its propose un service  professionnel, immédiat et pérenne d'archivage, moyennant un abonnement. En décembre 2009, ce service archivait 1 269 859 442 URLs issues de 886 collections publiques.

 - Les images animées / onglet Moving Images : ce groupe contient 236,842 films regroupés dans 16 collections dont certains titres se retrouvent dans les autres supports : Animation & Cartoons, Arts & Music, Computers & Technology, Cultural & Academic Films, Ephemeral Films, Home Movies, Movies, News & Public Affairs, Open Source Movies, Prelinger Archives, Spirituality & Religion, Sports Videos, Videogame Videos, Vlogs, Youth Media. Certains corpus diffusent aussi sur des sites indépendants comme la chaîne de reportages d'informations Mosaic Middle East News. Des collections scientifiques présentent de nombreux documents historiques de la Méditerranée comme la collection de films de l'University of Pennsylvania Museum of Archaeology and Anthropology, où vous trouverez des images depuis les années 1950 sur la Tunisie, le Maroc, l'Egypte ou le Moyen-Orient. Les formats de fichiers proposés sont multiples (DivX, MPEG4,...) les vidéos sont parfois disponibles en flux (stream) au format Quick Time.

- Les textes / onglet Texts : cette section est divisée en 8 collections qui proposent  1 817 401 références. Les textes se présentent au format Djvu ou txt. Vous pouvez par exemple lire sur le « Project Gutenberg », plus de 20 000 ouvrages au format txt ainsi que des livres audio en flux au format mp3 ou encore des premières éditions d'ouvrages issus de la littérature jeunesse du 19ème siècle. Une recherche sur "Marseille" vous indique 338 références (en décembre 2009) et vous pouvez ainsi feuilleter L'histoire de Marseille d'Augustin Fabre (1829) ou celle d'Amédée Boutin (1852).

- Les documents sonores / onglet Audio : 12 collections sont réunies dans ce groupe.  la musique s'y taille part belle avec par exemple « Live music archive » et ses 72 000 concerts. Vous y trouverez aussi des cours et des conférences sur de multiples thémes : l'université d'été du Cléo/Revues.org y a déposé la totalité de sa formation de septembre 2009. Dans la collection "News & Public Affairs" vous pourrez écouter les discours des président des Etats Unis ainsi que les « enregistrements secrets » de la Maison Blanche effectués entre 1940 et 1973 ou des émissions radiophoniques sur la vie politique ou les droits de l'homme. Les fichiers sont proposés en téléchargement ou en stream, au format MP3 et ogg.

- Les logiciels / onglet Software : 33 635 logiciels peuvent être téléchargés librement, actuellement organisés en 7 collections. A noter en particulier, la collection USGS maps qui offre les cartes de 50 Etats américains qui peuvent être utilisées avec un GIS. Celle collection a été créée en collaboration avec le projet de Jared Benedict dans le cadre du Libre Map Project.


Chaque ressource ou document fait l’objet d'une notice détaillée. Elle est parfois accompagnée d'une documentation de niveau professionnel (noms des serveurs de conservation, cheksum des fichiers sons, données xml,...). Les internautes peuvent commenter chaque document par l'utilisation de la fonction « Write a review ».

Internet Archive propose un calcul de taux d'audience original pour chacune des ressources qu'elle publie intitulé le « Batting Average » qui est un pourcentage calculé sur le nombre de visiteurs ayant téléchargé, visualisé, écouté un document après en avoir consulté la fiche signalétique. Des flux de syndication sont disponibles pour chaque projet. Un moteur de recherche efficace permet de rechercher sur l’ensemble du site ou sur l'un des nombreux sous-projets.

Internet Archive n'est pas toujours facile d'utilisation pour les internautes : il s’apparente à un gigantesque hangar multimédia. La diffusion et la médiation des contenus qu'il archive fait  l'objet de projets dont la vocation sera d’aider les citoyens de l'Internet à l'utiliser au mieux.

Internet Archive a été créée en 1996. Brewster Kahle, son co-fondateur, le dirigeait en 2009. L'interface du site est uniquement en langue anglaise mais les documents sont présents dans toutes les langues du monde.

Nouveautés du site

S'abonner à ce flux
  • > The Fourth Generation Petabox

    Behind all the cool stuff users see on archive.org is some serious hardware. I was curious about the ongoing development of data storage here at Internet Archive. I spent a little time with Mario, Master of the Machines, while he gave me a tour of the newest generation of our staff designed and built Petabox [...]

  • > Then and Now

    With the continued difficulties in the economy and the comparison often heard to the Great Depression I thought I’d search the Archive for some perspective. While unquestionably there was hardship and suffering, I was heartened to see footage from two places that show daily life. The first is a series by Ivan Besse of life [...]

  • > Eels as party favors?

    I was in Mexico City a couple of weeks ago, and we went to Plaza Garibaldi where all of the mariachi hang out, waiting to be hired.  There are great bars on the plaza where you can sip tequila (NOT shoot it – don’t get me started!) and listen to mariachi music all evening.  If [...]

  • > Millions of books get digitized for the disabled

    Thanks to By Stephanie Steinberg at USA TODAY  for the nice writeup about the books for the disabled service at openlibrary.org: Millions of books get digitized for the disabled “For those who are blind, dyslexic or have diseases like multiple sclerosis and have difficulty turning book pages, reading the latest best seller just got easier. [...]

  • > New Support for HTML5 audio tag!

    We just rolled out the [audio] tag support option for our audio files (which is similar to our [video] tag support that we have had as an option for a bit). So patrons can now opt to not use our flash plugin for audio file playback with relatively modern browsers (Safari v4+, Firefox v3.5+, Chrome, [...]

  • > Want to discuss the Wayback Machine or Internet Archive’s web archive?

    Over on the web group’s blog is a post inviting input on the Wayback Machine and Internet Archive’s web archive. You can post comments and suggestions. There’s also some useful links. Check it out at http://iawebarchiving.wordpress.com/2010/07/06/wayback-machine-web-archiving-open-thread-july-2010/ -Jeff Kaplan

  • > October 1962…Camelot in Crisis

    Being a fan of MadMen and also being old enough to have experienced “duck and cover”, these recordings are just a revelation: http://www.archive.org/details/dictabelt_cassette_a http://www.archive.org/details/dictabelt_cassette_b There’s the Mississippi University Crisis and the Cuban Missile Crisis. Hey, there’s Bobby Kennedy, then the Attorney General. Also, Archibald Cox who was later fired by Richard Nixon (well, Robert Bork [...]

  • > Small Moves: Open Library Integrates Digital Lending

    Today, the Internet Archive is pleased to announce 2 new borrowing options through Open Library: Borrowing ebooks through OverDrive – an ebook through your local library We have worked with the team at OverDrive to import about 70,000 new ebook editions into Open Library. All loans via OverDrive are managed through the OverDrive system. Once [...]

  • > New Firefox Add-on for searching the Wayback Machine

    Fellow time travelers, We have a new Firefox add-on that allows you to search the Wayback Machine from your browser. You can get it at: https://addons.mozilla.org/en-US/firefox/addon/162148/. For those who have yet to travel back in time, the Internet Archive Wayback Machine allows you to browse through over 150 billion web pages archived from 1996 to [...]

  • > Please help again…Senate to vote on bill to preserve jobs at Internet Archive

    Friends of Internet Archive, I’m back to ask your help again in getting S. 4213 passed this week to preserve and create jobs at the Archive. The bill would extend the JobsNow program. The House passed there version of it last week and this week, maybe today, the Senate will vote to determine if it [...]

Pour citer cet article

Référence électronique

Jean-Christophe Peyssard et Véronique Ginouvès, « Internet Archives », Bibenligne, Collections numériques, 2007, [En ligne], mis en ligne le 16 décembre 2009 13h23. URL : http://www.bibenligne.org/index6339.html. Consulté le 30 juillet 2010.