AAC > Appel à contributions

Le web : source et archive

 

 

Introduction générale – positionnement scientifique 

 

C’est à condition de faire l’objet de pratiques d’archivage que le web devient corpus de recherche (Beaudouin, Pehlivan, 2016 : 15). Support d’inscription éphémère de signes, codes et données qui circulent à travers les réseaux numériques, le web comme matériau scientifique interroge les chercheurs en tant que source ou terrain de recherche et questionne les professionnels de l’information et de la documentation en tant qu’archive. 

De 2013 à 2016, le projet « Le devenir en ligne du patrimoine numérisé : l’exemple de la Grande Guerre » a le premier utilisé une collection des archives de l’internet pour lui appliquer des méthodes d’analyse globales. Un corpus de sites avait alors été spécifiquement délimité pour procéder à la collecte qui allait permettre d’analyser les pratiques amateurs autour des contenus patrimoniaux numérisés et mis à disposition par les bibliothèques. Au printemps 2022, le Datasprint organisé dans le cadre du projet Respadon a confirmé que la mobilisation des archives du web pouvait être complémentaire à l’étude du web vivant. L’exploration du web comme source ou comme terrain s’avère désormais indispensable à de nombreuses disciplines : histoire contemporaine, sciences politiques, sociologie, histoire des sciences, sciences de l’information et de la communication. Et parce qu’il permet de faire l’histoire d’un domaine académique et d’inscrire ses travaux dans une tradition, le web est devenu une source nécessaire à de nombreuses démarches scientifiques. 

Or, les infrastructures scripturales (Denis, 2018) qui permettent la production de données et leur circulation à travers le web sont paradoxalement fragiles et les contenus volatiles. C’est la raison pour laquelle les institutions culturelles et patrimoniales comme la Bibliothèque Nationale de France (BnF) et l'Institut National de l'Audiovisuel (INA) se sont très tôt intéressées à l’archivage de l’Internet. Dès 1996, Internet Archive commence à constituer une archive internationale du web. En France c’est la loi dite « DADVSI » de 2006 (Droits d’Auteurs et Droits Voisins dans la Société de l’Information) qui étend le dépôt légal aux « signes, signaux, écrits, images, sons ou messages de toute nature faisant l’objet d’une communication au public par voie électronique ». Elle contribue à définir l’espace du web français comme un patrimoine national représentatif de la production éditoriale de son temps (Bermès, 2019 ; Ilien et al., 2011). 

De nombreux autres pays se sont dotés d’un cadre légal similaire et sont réunis dans le cadre du consortium IIPC (International Internet Preservation Consortium). En parallèle les chercheurs qui ont commencé à étudier les archives web comme objet se sont structurés en réseaux avec WARCnet et RESAW (Schafer, Musiani, Borelli, 2016 ; Brügger, 2018).
Inscrit dans la lignée des objectifs du projet Respadon (Réseau de partenaires pour l’exploration et l’analyse de données numériques) qui consiste à rendre les archives web plus accessibles pour les chercheurs de nombreuses disciplines, ce colloque propose de questionner les pratiques scientifiques où le web peut être saisi comme source et comme archive.

Cet événement propose de réunir à la fois des exemples concrets des usages scientifiques des archives web en lien avec leur rôle de source et de terrain, et des réflexions heuristiques sur la nature de ces archives et leurs modalités de préservation et de mise à disposition par les institutions patrimoniales et les établissements documentaires.

 

Les propositions de communication attendues porteront sur les thématiques suivantes reliées aux 3 axes principaux du colloque, décrits ci-dessous :

  • Présentations de projets scientifiques mobilisant les corpus web et les humanités numériques
  • Présentations de retours d'expérience de projets de recherche utilisant le web comme source : obstacles rencontrés, “success stories”
  • Réflexions autour des pratiques professionnelles et académiques impliquant la collecte et la préservation de données issues du web
  • Présentation d'expérimentations et de dispositifs favorisant l'accès aux archives numériques et aux corpus web
  • Réflexions méthodologiques et épistémologiques sur les besoins d’accès à des données en ligne dans différentes disciplines et de préservation de ces données.



Axe 1         Le web à l’intersection de la mémoire et du savoir : enjeux épistémologiques

Le web comme terrain scientifique implique de considérer le matériau disponible en ligne comme gisement de traces de la mémoire collective. Comment élaborer un discours scientifique à partir d’une source par essence volatile ? De quelle mémoire s’agit-il lorsqu’elle est « distribuée » sur le web ? Quel est le statut des sources web dans les pratiques scientifiques qui élaborent un nouveau savoir et contribuent à l'émergence de sciences désormais assistées par le numérique ? Il s’agit ici de se questionner collectivement sur les méthodes, les modalités et le statut des résultats produits lorsque des données en ligne entrent en jeu dans la recherche, quelle que soit la discipline concernée (histoire contemporaine, sciences politiques, sociologie, histoire des sciences, sciences de l’information et de la communication, informatique…). Seront appréciées les approches et propositions qui illustrent des travaux scientifiques utilisant le Web et ses traces ainsi que des réflexions sur la nature des archives et des données utilisées dans la recherche scientifique contemporaine. 

 

Axe 2         Politiques, pratiques et techniques archivistiques et archives web : du document aux corpus

La communauté professionnelle a développé depuis plusieurs années des définitions techniques de l’archive numérique et des dispositifs associés. Cette pratique questionne la notion de « lieux des archives » et de préservation des corpus : l’offre de service autour des archives web doit permettre de faire émerger le terrain de travail avec les chercheurs, en prenant en compte des questionnement divers :

  • En matière de souveraineté informationnelle, comment la diversité des initiatives privées et publiques existantes se concrétise-t-elle dans les politiques de constitution des archives ?
  • En matière d’accès aux archives, quelle définition de la granularité, de l’unité de sens, de la cohérence du fonds archivistique, pour que les archives web soient exploitables par la recherche ?
  • Comment développer des pratiques scientifiques efficientes dans le respect du cadre juridique et des contraintes liées à la notion de dépôt légal ? Comment faire évoluer ce cadre pour favoriser la recherche ?

 

Pour éclairer ces enjeux, on pourra imaginer de mobiliser l’histoire de l’archivistique ou une approche comparative des cadres internationaux.




Axe 3         Relations entre dispositif technique et données scientifiques : l'archive web en réseau 

Une approche prospective de l’étude des sources web implique de les envisager non pas de manière isolée, mais en lien avec les différents types de données et de sources mobilisées dans le cadre de la démarche scientifique. Les approches méthodologiques qui mobilisent les matériaux numériques sont plurielles. Les analyses de traces, l’analyse de réseau, la visualisation de données (approches quantitatives) peuvent être complétées par des approches qualitatives en ethnographie numérique qui cherchent à questionner la relation des traces aux utilisateurs. En lien avec les enjeux des données de la recherche, les pratiques de constitution des corpus par les chercheurs peuvent s’appuyer sur les savoir-faire archivistiques : cycle de vie des données, éditorialisation et documentation des sources, préservation des dispositifs techniques liés aux données, préservation des données de la recherche. On s’intéressera ici aux limites légales et techniques actuelles à la constitution de l’archive du web considérée comme une archive incomplète : l’archivage de certains objets-limites impliquant une interactivité technologique (ex. jeux vidéo en ligne, réseaux sociaux, logiciels) conduit à questionner la nature documentaire du web. A contrario, les technologies d’archivage numérique peuvent être mobilisées pour collecter et préserver des objets documentaires accessibles en ligne que l’on n’assimile pas habituellement aux archives web (presse quotidienne, articles scientifiques). Cet axe portera donc sur tous les enjeux, méthodes et réflexions permettant d’envisager le web comme source et archive non pas isolée, mais liée avec d’autres corpus et collections.

 

        Etapes importantes 

Consulter la page dédiée

 

        Procédure d'évaluation 

Les contributions anonymisées seront évaluées en double-aveugle

Comité scientifique

Déposer une contribution

 

       Références 

 

Emmanuelle BERMES (2019) « Quand le dépôt légal devient numérique : épistémologie d’un nouvel objet patrimonial », Quaderni [En ligne], 98 | Hiver 2018-2019, URL : http://journals.openedition.org/quaderni/1455 ; DOI : https://doi.org/10.4000/quaderni.1455

Niels BRÜGGER (2018) The archived web : Doing history in the digital age. MIT Press.

Valérie GAME, Gildas ILLIEN (2006) « Le Dépôt légal d’Internet à la Bibliothèque nationale de France », in Bulletin des bibliothèques de France (BBF), n°3, p. 82-85. En ligne, URL : http://bbf.enssib.fr/consulter/bbf-2006-03-0082-013. ISSN 1292-8399.

Valérie BEAUDOUIN, Philippe CHEVALLIER, Lionel MAUREL (2018) Le web français de la Grande Guerre. Réseaux amateurs et institutionnels. Presses universitaires de Paris Nanterre.

Valérie BEAUDOUIN, Zeynep PEHLIVAN (2016) « Cartographie de la Grande Guerre sur le Web : Rapport final ». Bibliothèque nationale de France ; Bibliothèque de documentation internationale contemporaine ; Télécom ParisTech.

Jérôme DENIS (2018) Le travail invisible des données. Éléments pour une sociologie des infrastructures scripturales, Presses des Mines, 208 p. 

Gildas ILLIEN, Pascal SANZ, Sophie SEPETJAN, Peter STIRLING (2011) « La situation du dépôt légal de l’internet en France : retour sur cette nouvelle législation, sur sa mise en pratique depuis cinq ans, et perspectives pour le futur ». Actes du 77e congrès de la Fédération internationale des associations de bibliothécaires et d’institutions (IFLA). En ligne, URL : http://conference.ifla.org/past-wlic/2011/193-stirling-fr.pdf 

Emily MAEMURA (2021) « Data Here and There: Studying Web Archives Research Infrastructures in Danish and Canadian Settings ». University of Toronto, Faculty of Information, Doctoral Paper.

MAEMURA, Emily, BECKER, Christoph, et MILLIGAN, Ian (2016) « Understanding computational web archives research methods using research objects ». In : IEEE International Conference on Big Data, p. 3250-3259, DOI : 10.1109/BigData.2016.7840982 

Frédéric MARTIN (2017), « Les archives de l’internet comme axe de coopération nationale ». In : Webcorpora. En ligne, URL: https://webcorpora.hypotheses.org/394

Francesca MUSIANI (ed.) (2019) Qu’est-ce qu’une archive du web ? OpenEdition Press. En ligne, URL : https://doi.org/10.4000/books.oep.8713

Jean-Charles PAJOU (2016) « L’Observatoire du dépôt légal : un certain regard sur l’édition », Bulletin des bibliothèques de France (BBF), n° 9, p. 134-144.

En ligne, URL : https://bbf.enssib.fr/consulter/bbf-2016-09-0134-002 ISSN 1292-8399.

Nick RUEST, Jimmy LIN, Ian MILLIGAN, Samantha FRITZ (2020)  « The Archives Unleashed Project: Technology, Process, and Community to Improve Scholarly Access to Web Archives ». IEEE/ACM Joint Conference on Digital Libraries, Wuhan, Chine. 

En ligne, URL : https://doi.org/10.1145/3383583.3398513 

Valérie SCHAFER, Francesca MUSIANI, Marguerite BORELLI (2016) « Negotiating the web of the past ». French Journal for Media Research, La toile négociée/Negotiating the web, http://frenchjournalformediaresearch.com/lodel/index.php?id=963 

Peter STIRLING (2017) « Le dépôt légal de l’internet dans le projet Corpus ». In : Webcorpora, URL : https://webcorpora.hypotheses.org/111



 

 

Personnes connectées : 2 Vie privée
Chargement...