lundi 13 décembre 2010

Visibilité en ligne et connaissance de l'internet grand public : pourquoi j'utilise Google.

S’il est une firme dont l’emprise sur la société contemporaine et l’aspect tentaculaire et monopolistique peuvent faire peur, c’est bien Google.
Alors que son moteur de recherche tend de plus en plus à devenir la référence unique sur le web – au point que, comme le note Patrick Leary[1], to google est devenu le terme générique pour désigner le fait d’effectuer une recherche en ligne sur un moteur généraliste –, l’entreprise amasse au jour le jour une quantité effrayante d’informations sur ses usagers. Sujets de prédilection, données personnelles, tout y passe. Et lorsqu’on l’accuse de porter atteinte à la vie privée des internautes, le fondateur de la firme répond que seule une personne qui a quelque chose à se reprocher a intérêt à protéger ses données personnelles[2]. En soi, ces raisons éthiques et morales seraient suffisantes pour refuser d’utiliser Google. D’autant que, pour les historiens que nous sommes, les algorithmes du moteur de recherche de référence sont, à part lorsqu’on recherche une information simple et immédiate, rarement efficaces, puisque leurs critères de pertinence ne sont pas les nôtres, loin s’en faut. Pourtant, même si je sais que cela ne m’apportera pas les réponses que j’attends en tant qu’historien, chacune de mes recherches en ligne commence sur google.fr, et je vais de ce pas vous expliquer pourquoi.

Ce choix, dont nous avons brièvement débattu récemment dans le cadre du séminaire d’histoire numérique de Christian Henriot, s’est heurté aux réticences de plusieurs de mes interlocuteurs, soulevant plusieurs objections, la plupart extrêmement pertinentes. Je n’ai pas changé d’avis pour autant.
Le lecteur retrouvera certainement ici le « populisme intellectuel » de mon article sur la télévision, ou, si l’on préfère cette volonté de voir l’historien s’engager dans la société et, partant, la connaitre et la comprendre. En effet, lorsque je recherche sur le web des informations sur un sujet historique, je me pose en permanence la question : « qu’aurait trouvé un amateur ? ». Or il est fort probable que ledit amateur utilise Google (ou Bing, ou Yahoo, là n’est pas l’objet de ce billet). Si nous nous fixons comme objectif d’agir dans la société – et pour elle – par la promotion d’une culture historique de qualité, culture que nous jugeons indispensable à toute compréhension fine du monde actuel, il importe donc de repérer les pièges du web grand public et à terme d’apprendre à les déjouer.
Utiliser Google, c’est donc avant tout apprendre à connaitre notre « environnement » en tant qu’historien numérique. C’est comprendre la structure tentaculaire au sein de laquelle s’inscrit notre action. C’est ainsi par la pratique qu’on parviendra à la maîtrise du mode de fonctionnement de Google, notamment en ce qui concerne le référencement des pages et le tri des résultats d’une recherche. En effet, quel intérêt peut avoir la tenue d’un blog ou la création d’un site adressé au grand public, si celui-ci ne peut pas y accéder, ou plutôt s’il est dans l’impossibilité de connaitre son existence ? N’est-il donc pas essentiel d’accepter dans une certaine mesure de nous plier aux règles imposées par Google et ses concurrents, même si l’on rejette par ailleurs ce que représente la firme américaine (ou ses concurrents, une fois de plus) ? Sans pour autant inviter l’historien à se prostituer aux multinationales du net, je défends donc un « entrisme raisonné ».
Si j’utilise le terme d’entrisme, je ne me fais pas d’illusions pour autant. Le but n’est pas ici de modifier le mode de fonctionnement de Google – les historiens auraient bien de la peine à réussir là où les dirigeants chinois ont échoué – mais d’atteindre une meilleure visibilité en « infiltrant » les mécanismes de tri des données des moteurs de recherche. Ainsi, dans le cas de Google, leader du secteur, on peut par exemple utiliser Blogger ou Google Docs, la firme ayant tendance à privilégier les pages issues de ses propres serveurs. De plus, le blogueur peut essayer de saupoudrer sa prose de mots clefs, c'est-à-dire de termes susceptibles d’être entrés dans la barre de recherche par un curieux. Ainsi, préciser en les reformulant de différentes manières les thématiques principales d’un site sur une page d’accueil peut permettre d’être mieux référencé. Par exemple, dans le cas de mon M1, intitulé Lyon, Herriot, les droites.1953-1956, je tente de faire apparaître le plus possible les « tags » que sont les mots « droite », « droites », « Lyon », « lyonnais », « lyonnaise », etc sur la page où mon mémoire est publié en ligne.

Même si ma réflexion sur ce point n’en est qu’à ces débuts et que les techniques que j’ai fait émerger sont encore rudimentaires, je suis persuadé que la connaissance poussée des mécanismes de l’internet grand public est une des clefs de l’histoire numérique. Les historiens ne doivent pas commettre avec internet la même erreur qu’avec la télévision. Il est absolument nécessaire d’occuper le terrain de la vulgarisation et de la culture historique grand public, sous peine de le voir confisquer par des amateurs maladroits, des idéologues ou, pire peut-être, de laisser là aussi la mémoire prendre le pas sur l’histoire.

PS : J'aimerais bien savoir qui a commenté mon billet sur Herriot et les pièges du net, le commentaire était intéressant et j'aurais bien poursuivi la discussion en privé.


[1] Patrick Leary, “Googling the Victorians”, Journal of Victorian Culture 10:11, 72-86,
[2] Lors d’une interview sur CNBC, voir la vidéo sur Youtube.


lundi 6 décembre 2010

Premiers pas : Edouard Herriot et les pièges du net

« Premiers pas » : ça aurait pu être le nom d’une nouvelle couche Pampers, mais non, c’est une rubrique d’histoire numérique, que j'ai décidé de mener cette semaine sur le ton de l'humour. Le principe : tenter de déjouer les pièges du net pour trouver des informations sur un objet historique. Pour ce premier essai, j’ai donc choisi – roulements de tambour – Edouard Herriot. Oui, je sais, c’est pour le moins inattendu. Rentrons donc sans attendre dans le vif du sujet.

Premier humour

Prenons donc un historien amateur débutant. Pour plus de facilité, nous l’appellerons Lucas – c’est un clin d’œil au public des couches Pampers, qui a sans doute été un peu déçu après un titre prometteur. Lucas désire donc trouver des informations sur son idole, la légende du radicalisme lyonnais, Edouard Herriot. Oui, Lucas est un jeune homme fantasque. Aidons donc Lucas dans ses recherches…

Homonymie

Première étape, Lucas veut découvrir qui est Edouard Herriot. En effet, il ne connait pour l’instant de son idole que le visage moustachu accompagné d’une liste impressionnante de titres – de « maire de Lyon » à « Président de la Chambre » en passant par « Président du Conseil » – qui semble jaillir du mur d’enceinte du cimetière de Loyasse. Suffisant pour faire naître une passion dévorante, mais un peu léger pour assouvir la soif de connaissance qui s’ensuit. Comme tout internaute qui se respecte, Lucas ouvre donc son navigateur faisant apparaitre sa page d’accueil : lequipe.fr Google. Là, sûr de son fait, il tape dans la barre de recherche : « Herriot ». Sans le savoir, Lucas vient de tomber dans un des pièges les plus redoutables du web : l’homonymie. En effet, au lieu de lui proposer une biographie de celui qui fut maire de Lyon de 1905 à 1957 – exception faite, bien sûr, des années de l’Occupation –, son navigateur n’a d’yeux que pour James Herriot, célèbre vétérinaire et écrivain anglais de la fin du siècle dernier. Lucas apprend de son échec l’importance de la précision de la requête, surtout lorsqu’on recherche un nom propre. Il retente donc sa chance en écrivant cette fois « Edouard Herriot ». Bien sûr, il lui reste à faire le tri entre l’homme et les divers établissements qui portent son nom, mais la plupart des réponses sans rapport avec le leader radical ont disparu.

Pertinence, référencement et vérité vraie : Wikipédia ou les malheurs de la vertu historienne…

Comme nous l’avons dit, Lucas est un débutant. Il est donc normal qu’il fasse dans un premier temps des erreurs de débutant. Il est en effet une sirène au chant si doux que même le plus vaillant des chercheurs se laisse parfois tenter : Wikipédia. Ne versons pas ici dans la critique facile. Il est vrai que plusieurs témoins affirment avoir trouvé sur la célèbre encyclopédie en ligne des articles justes, précis, bien documentés et citant leurs sources. Sur Cristiano Ronaldo, notamment. Mais dans le cas qui nous intéresse, pas de chance, l’article sur Herriot est plein d’erreurs (environ autant que de dollars sur le compte en banque de Bill Gates). Au point que j’en ai même été choqué, et que je n’en tire qu’une conclusion : n’utilisez Wikipédia que si vous êtes sûr de pouvoir vous-même écrire l’article que vous désirez consulter.
Heureusement, nous sommes là pour guider Lucas, et nous lui expliquons que le référencement d’une page sur Google ne dépend en rien de sa qualité et de sa légitimité, mais seulement du nombre de fois où elle a été vue, or Wikitruc jouit malheureusement d’une très grande réputation chez les internautes. Pour une première approche biographique, nous conseillons donc à Lucas de tourner vers des articles dont on sait, à défaut d’en connaître l’auteur, qu’ils ont été vérifiés par des personnes compétentes. C’est le cas –on peut du moins l’espérer – des bases bibliographiques de l’Assemblée Nationale , des Archives de Lyon et de l’Académie Française. On trouve, notamment pour le premier des trois sites susnommés, de très bonnes indications biographiques, incluant même, toujours pour le site de l’Assemblée Nationale, une vidéo.
Cette vidéo nous donne l’idée de conseiller à Lucas d’aller faire un tour sur Google Images et Google Vidéos. D’une part, cela permet de mieux se représenter l’homme derrière la fonction, de mettre un visage et une voix sur le nom Edouard Herriot. D’autre part, les vidéos, notamment, donnent une bonne idée de l’aura du personnage dans les dernières années de sa vie. Sur ce point, Google nous redirige d’ailleurs sur le site de l’INA, ce qui est une très bonne chose, puisqu’on y trouve de très nombreuses vidéos d’archive sur Herriot.

Doudou : un homme rare et discret

Lucas l’a remarqué, Herriot est un homme discret, au sens où il est difficile de trouver des informations à son sujet sur le net sans savoir où chercher. Après l’avoir laissé patauger un moment, donnons-lui quelques pistes…
Sur Herriot, on trouve avant tout en ligne des références bibliographiques. Ainsi, le moyen le plus efficace d’obtenir des informations est sans doute de chercher des titres sur un catalogue en ligne comme celui du SUDOC (à condition d’avoir accès aux bibliothèques universitaires) ou de la Bibliothèque municipale de Lyon. On pourra aussi chercher des articles sur des sites comme revues.org, Persée ou Cairn, qui mettent en ligne les articles concernés.
Deuxième type d’informations, les archives accessibles en ligne. En effet, les Archives municipales de Lyon ont mis gratuitement à disposition des internautes les archives des délibérations des Conseils municipaux. Les archives du Bulletin officiel de la ville devraient suivre bientôt.
Troisièmement, internet permet d’entrer en contact avec des personnes qui connaissent bien le sujet, notamment l’association des Amis d’Edouard Herriot et le Cercle Edouard Herriot, qui en est l’émanation.
Enfin, j’ose en toute modestie signaler que mon mémoire de M1, Lyon, Herriot, les droites. 1953-1956, est disponible en ligne au format PDF ici.

En résumé

Lucas a donc appris à se méfier des pièges de Google et de Wikipédia. Nous publions en accord avec lui les pistes de recherche qu’il a retenues :

Herriot sur le net, c’est :
  •      Des biographies sommaires, sur le site de l’Assemblée Nationale notamment et en évitant Wikipédia.
  •      Des images et vidéos d’archives, accessibles soit par les moteurs dédiés de Google, soit directement sur le site de l’INA, pour les vidéos.
  •     Des références bibliographiques sur des catalogues en ligne d’ouvrages ou d’articles.
  •     Des archives en ligne, sur le site des Archives municipales de Lyon, notamment.
  •     Des personnes qui s’intéressent au sujet et créent des sites dédiés.
  •     Des travaux publiés en ligne. Même si pour l’instant il n’y a que mon mémoire de M1, la mise en place prochaine d’un site d’histoire de Lyon pourrait améliorer la situation.


Comme quoi, malgré le faible nombre de résultats pertinents sur Google, on peut, même pour un sujet « rare » en ligne comme Herriot, trouver beaucoup de choses lorsqu’on sait où chercher. N'est-ce pas, Lucas ?

TagCrowd + Google Timeline

Au programme cette semaine, deux objets très différents. Tout d’abord, nous nous pencherons sur TagCrowd, un outil qui permet de créer des « nuages de tags » à partir d’une page, d’un texte ou d’un site. Ensuite, nous nous intéresserons plus brièvement à Google Timeline, la page qui retrace l’histoire du géant du net.

TagCrowd

Pour ce premier test, je me suis posé la question suivante : Dans quelle mesure cet outil peut-il enrichir un projet d’histoire en ligne (site ou blog) ?

TagCrowd est un outil qui permet de créer des « nuages de tags », comme on en trouve sur de nombreux sites, c'est-à-dire de présenter une accumulation de mots présents sur une page web, la taille du caractère utilisé variant selon le nombre d’occurrences. Sur le principe, l’idée est bonne et a fait ses preuves : un mot qui apparait plusieurs fois a une probabilité forte d’être un point important d’un sujet. Le nuage de tags suggère ainsi à l’internaute d’autres sujets, auxquels il n’avait pas forcément pensé en entrant sur la page, ce qui l’incite à naviguer à l’intérieur du site (ou du blog, dans notre cas), à l’inverse de la plupart de liens hypertextes inclus dans les articles, qui envoient souvent l’internaute vers d’autres sites. Pour les sites commerciaux, l’intérêt sera de garder le visiteur sur le site, plus de temps passé et de pages vues impliquant un meilleur rendement (publicité, vente de produits…). Pour nous, le nuage de tags offre à l’internaute l’opportunité de découvrir d’autres articles, d’autres pans de la connaissance historique.
Au départ, l’idée est donc bonne, puisqu’elle peut nous permettre de donner, par cette invitation à la navigation en interne, une nouvelle profondeur à un projet d’histoire numérique.

Rapidement, on se heurte cependant à quatre problèmes principaux.
Tout d’abord, les tags du nuage créé avec TagCrowd ne comportent pas, contrairement à ce qu’on voit souvent, de lien vers les articles où se trouvent ces mots. Autrement dit, si je clique sur le mot « Google », qui est le nuage créé à partir de mon blog, il ne se passe rien. Je ne suis pas redirigé vers une liste des articles contenant ce mot. C’est là un défaut regrettable, car il ôte au nuage de tags une grande part de son intérêt.
Deuxième problème, TagCrowd n’est pas très efficace lorsqu’il s’agit de traiter des textes en français. Alors qu’en anglais, il regroupe les mots de la même famille (singulier et pluriel d’un même mot, conjugaisons d’un même verbe…), il en est incapable dans la langue de Molière (qui est aussi celle de Corneille et de Racine, mais nous n’avons malheureusement pas le temps de débattre de ce point ici, bien que la confiscation d’une langue par un auteur, fût-il aussi talentueux que l’auteur du Misanthrope, soit sans doute un des plus grands scandales de notre histoire, nous y reviendrons). Le programme ne fait pas non plus le tri des mots importants, même si on peut définir une liste de mots à ne pas retenir (typiquement, les articles, prépositions, etc.). Ainsi, un système de reconnaissance des substantifs aurait été d’un intérêt certain.
Troisième point négatif, le nuage de tags créé ne se met pas à jour. Il est donc nécessaire d’en créer un nouveau à chaque mise à jour du site. D’autant que, sauf erreur de ma part, les listes de mots non pris en compte s’effaçant au bout d’une semaine, le travail sera à chaque fois fastidieux.
Enfin, dernier problème, je n’ai pas réussi à faire fonctionner l’export en html. En même temps, comme les trois premiers problèmes cités avaient ôté à peu près tout l’intérêt de TagCrowd, je n’avais pas vraiment l’intention de m’en servir.

Conclusion

On est donc face à une très bonne idée, malheureusement desservie par un programme souffrant de nombreux défauts. Si le nuage de tags est un objet très intéressant par les opportunités de navigation interne transversale au site qu’il offre, il faudra, pour en créer un, se tourner vers un système plus efficace que TagCrowd.

Les  + :
L’idée.

Les moins :
Le traitement des textes, surtout en français. Le nuage de tags « statique » (sans mises à jour ni liens hypertextes). L’export en html.

Edit : Je me rends compte à la lecture du billet de François-Xavier que je n'ai pas pris en compte la possibilité d'utiliser TagCrowd comme outil d'analyse de texte... Mea culpa. On jettera donc utilement un coup d'oeil à son article sur le sujet.

Post-scriptum : Google Timeline

Pour finir, jetons un œil du côté de Google Timeline. Avec cette page amusante, qui fonctionne comme une frise chronologique (timeline) interactive, Google apporte sa pierre à l’histoire numérique, cette fois-ci non pas en proposant un outil, mais en nous présentant sa propre saga.
Google Timeline se présente donc comme une frise qu’un curseur en bas de page nous permet de faire défiler (on remarque d’ailleurs un bug : les dates de la barre de navigation et de la frise concordent mal). Pour les premières années, chaque « case » de la frise représente un an, puis diminue pour arriver à un trimestre en 2004. En tête de chacune de ces cases, apparaît aléatoirement un « doodle », c’est-à-dire l’une des nombreuses variantes conjoncturelles du logo du groupe créées pour célébrer des événements particuliers. Sur la frise, des événements qui ont marqué l’histoire de Google apparaissent, ainsi que des informations sur l’évolution du groupe. Les différentes catégories d’informations (statistique, anecdote, etc.) sont identifiées par des pictogrammes. Lorsqu’on survole un événement avec le pointeur, un encart apparaît, donnant plus de détails et proposant éventuellement des liens vers des archives (articles de revues mentionnant un tournant dans l’histoire du groupe, captures d’écran d’une ancienne page d’accueil…).
Bien sûr, les événements sont sélectionnés avec soin. Nulle part, il n’est fait mention de la première condamnation du groupe pour atteinte à la vie privée, concurrence déloyale, etc. Mais l’aspect ludique et interactif, et la volonté d’appuyer le propos par des archives peuvent être de bonnes pistes d’inspiration pour créer des sites éducatifs en histoire.

samedi 4 décembre 2010

Edouard Herriot en vidéo

Je me suis amusé à chercher quelques vidéos d'Edouard Herriot sur le site de l'INA. La playlist est disponible ICI.

samedi 27 novembre 2010

Mémoire en ligne

Mon mémoire de master 1, Lyon, Herriot, les droites. 1953-1956, réalisé sous la direction de Bruno Benoit, est maintenant disponible en ligne au format PDF

mardi 23 novembre 2010

Rapport méthodologique : Création d'une bibliographie avec Zotero

Comme nous l’utilisons dans le cadre du séminaire et que le peu de temps dont je dispose ne m’autorise pas à multiplier inutilement les tests d’outils similaires, j’ai choisi de travailler avec Zotero, même si, j’en suis bien conscient, nous serons certainement nombreux dans ce cas. Afin de ne pas faire de doublons avec le travail que j’ai déjà accompli, j’ai décidé de rechercher des ouvrages sur un point assez marginal de mon sujet, l’étude de la caricature. Mes recherches m’amènent en effet à analyser bon nombre de dessins satiriques du milieu du XXe siècle.

La démarche

En utilisant Zotero, j’ai recensé les ouvrages et articles traitant de la caricature politique à l’époque contemporaine présents dans les bases de données SUDOC et Persée. Dans les deux cas, j’ai arrêté de chercher lorsque j’en sui arrivé à parcourir trois pages consécutives sans référence intéressante. Il est à noter que le catalogue de la bibliothèque municipale de Lyon, que j’ai tenté d’utiliser, n’est pas compatible avec Zotero.

Forces et faiblesses

Pour moi, le principal attrait de Zotero réside dans son fonctionnement assez simple, au moins pour ses fonctions les plus basiques : on peut très facilement enregistrer dans un dossier créé pour l’occasion toutes les références présentes sur une page, avec un certain nombre de détails (marqueurs SUDOC, localisation…), ce qui évite un long travail de recopiage (à la main ou par copier-coller). Il permet ensuite facilement de faire le tri dans les références sélectionnées, de les localiser (si un lieu a été renseigné sur la base de données), de faire des recherches à l’intérieur de la bibliographie. On obtient ainsi assez facilement une bibliographie bien organisée et aisément manipulable.  On peut ensuite facilement exporter cette bibliographie en format texte (voir exemple). Il n’est en revanche pas possible d’exporter directement une bibliographie hiérarchisée à partir de dossiers contenant des sous-dossiers. Dans l’ensemble, à part ce dernier point, l’utilisation de bibliographies créées sous Zotero est donc facile et efficace, du moins lorsque les documents sont bien référencés.
C’est en effet le premier problème auquel on se heurte : le mauvais référencement de certains éléments empêche de les utiliser correctement. Ainsi, dans l’exemple donné, on remarque que le titre de la huitième référence est simplement « L. ». On aurait normalement du trouver l’article « L’histoire croquée sur le vif » de Laurence Bertrand-Dorléac (Vingtième siècle. Revue d’histoire, 1990, numéro 27, pp. 110-111). Et cet exemple n’est pas le seul : en fait, il semble que le moteur de détection de références de Zotero se bloque lorsqu’il rencontre une apostrophe. On rencontre d’ailleurs le même problème avec Office, qui butte sur les apostrophes et les deux points lorsqu’il détecte automatiquement le titre d’un document à enregistrer.
Autre faiblesse, Zotero ne sonde les pages qu’une par une. Sonder toutes les pages de réponse d’une recherche serait certes colossal dans certains cas, mais cela permettrait de travailler encore plus efficacement. Dans ce domaine, l’idéal serait même de pouvoir directement effectuer une recherche depuis l’interface Zotero à l’intérieur d’un certain nombre de bases de données sélectionnées. Nul doute, d’ailleurs, que les créateurs du programme se penchent déjà sur ce type d’évolutions.

Conclusion

Si quelques bugs et manques viennent encore limiter l’efficacité de Zotero, il n’en demeure pas moins qu’on tient là une avancée formidable à même de bouleverser notre manière de créer des bibliographies. Si le logiciel ne remplace pas encore totalement le travail de recherche personnel et d’investigation dans diverses bibliothèques, il nous permet déjà, pour les bases de données compatibles, un gain de temps énorme. Une fois que ses défauts auront été corrigés, Zotero sera sans doute un outil de base de l’historien, au même titre que le stylo et le bloc-notes.

Les + :
Gain de temps, localisation, bibliographies exportables et très facilement manipulables

Les - :
Bugs, seulement compatible avec Firefox, pas de système de recherches intégré, compatible seulement avec certains catalogues

vendredi 19 novembre 2010

Présentation critique : Texas Slavery Project

Le Projet

Le Texas Slavery Project est, comme son nom l’indique, un projet d’histoire numérique de l’esclavage au Texas (on parle ici de la République du Texas historique, et non pas de l’actuel Etat américain), entre 1837 et 1845. Il comporte trois pôles distincts, qui sont trois axes de travail.
Le premier est la numérisation de sources primaires. Des textes de lois, archives publiques et articles de périodiques sont mis en ligne sur le site au format texte.
Le second est la création d’une base de données des effectifs d’esclaves, du nombre d’esclavagistes, etc., par comté et par an.
Enfin, le troisième pôle est celui de l’exploitation des données rassemblées. Des graphes et surtout une carte interactive du Texas, accompagnée d’un outil de création de courbes de population sont tirés des données de la base.

Forces et faiblesses

Le site se distingue donc par la présence de plusieurs étapes de la réflexion historique : collecte de sources brutes, classement des données récoltées, exploitation de ces données. Il demeure cependant un simple outil de la réflexion, puisque les sources sont triées, explicitées par des graphiques et des cartes, mais ne font l’objet sur le site d’aucune analyse critique. Comme on peut le lire dans le texte de présentation du projet, le but su site est avant tout de fournir aux historiens des outils, très bien construits d’ailleurs, sur un sujet précis.
Et c’est bien là que le bât blesse. D’une part, le sujet choisi, l’esclavage dans la République du Texas entre 1837 et 1845, est extrêmement étroit et n’intéresse a priori qu’un nombre limité d’historiens. Utilisons une comparaison un peu provocante : c’est un peu comme si j’avais créé un site pour mettre en ligne ma base de données des résultats des élections lyonnaises entre 1951 et 1956.
D’autre part, si le site est bien construit, il tend à orienter les lecteurs, à capter exclusivement leur attention. Le risque est grand, en effet, devant un outil si bien construit, d’oublier que d’autres sources que celle que le projet a traité sont peut-être – certainement – disponibles quelque part au Texas. Ainsi, par exemple, le site n’indique ne met pas en ligne les sources dont sont tirés les chiffres présents dans la base de données, même si leur provenance est mentionnée (les registres recensant le nombre d’esclave de chaque planteur, l’esclave étant une propriété imposable).
Enfin, c’est plus un commentaire personnel, le Texas Slavery Project me semble être la parfaite illustration de la culture du chiffre brut dont nous sommes souvent les victimes consentantes. C’est en effet une tendance lourde de la société contemporaine que de livrer au public des données brutes et vierges de toute analyse, comme si les chiffres parlaient d’eux-mêmes.
Dernier point, et on pénètre ici dans le monde de l’étrange et du paranormal, le site est financé par la Summerlee Foundation, une organisation de défense des animaux. Comme je me refuse à y voir un relent fétide du racisme le plus abject, je me contenterais d’être pour le moins dubitatif…

Conclusion

Si le travail de mise en ligne et de traitement des sources effectué est important, et permet aux équipes de chercheurs potentielles travaillant sur le sujet de disposer à distances de leurs sources, le projet Texas Slavery vise un public limité et souffre de plusieurs faiblesses. Il convient néanmoins de noter la grande qualité du moteur de création de cartes et de graphes, très ergonomique et interactif.

Les + :
Interface claire, base de données et moteur de carte très ergonomiques et fonctionnels, travail de qualité.

Les - :
Pas d’état des autres sources (risque que le site agisse « comme des œillères »), public potentiel assez limité, données livrées sans analyse, soutiens financiers pour le moins étonnants

Edit (comme on dit quand on est branché) : J'avais oublié de chercher des sites similaires... En voila trois. Aucun n'atteint le niveau de perfectionnement du projet Texas Slavery, mais ils ont en commun la mise en ligne d'archives sur un sujet précis d'histoire locale...
http://lesfillesduroy-quebec.org/ : La société d'histoire des Filles du Roy tente de retracer l'histoire des femmes envoyées au Québec sous la monarchie pour épouser les premiers colons français.
http://www.shanghailanders.net/ : Un site d'histoire "personnelle" qui tente de réunir des informations sur la vie d'un grand-oncle parti vivre dans la concession française de Shanghai. Je me suis dit que ça plairait à un certain nombre de nos camarades du séminaire...
http://www.histoirenormantromorantin.com/ : Enfin, un site où un passionné met en ligne les travaux qu'il a réalisés après la fin de son M2, dans la droite ligne de ses travaux sur l'usine emblématique de sa ville natale.

lundi 8 novembre 2010

Regardez la télé !

J'inaugure ici une nouvelle rubrique du blog, où je donnerai mon avis sur des sujets de société, mais toujours en rapport avec l'histoire et la culture, et sans prise de position politique. C'est une opinion personnelle qui vaut ce qu'elle vaut, et vos commentaires sont les bienvenus.

Ce soir, France 3 diffuse un énième documentaire le général de Gaulle (De Gaulle : la dernière bataille, de René-Jean Bouiller, à 20h35 ce lundi 8 novembre, voir la fiche du programme sur le site de la chaine), suivi d’un débat en direct. Demain, c’est France 5 qui remet le couvert avec une émission qui fait intervenir des Français qui ont vécu le gaullisme des années 1950 et 1960 et leur propose d’apporter leur témoignage, leurs archives personnelles, leur vision des événements (C’est notre histoire, présenté par Marie Drucker et Fabrice d’Almeida, mardi 9 novembre à 20h35, voir la fiche du programme). Une fois de plus, la mémoire semble prendre le pas sur l’histoire. Mais ce n’est pas là l’objet de notre billet. En cette année de soixante-dixième anniversaire de l’appel du 18 juin et de cinquantenaire de la mort du général, on nous aura servi du de Gaulle à toutes les sauces. On frôle le gavage. Durant les cinq mois qui ont séparé les deux anniversaire, le grand Charles a fait la une de l’actualité. Pas un mot, en revanche, sur le 10 juillet. Trop proche du 14, sans doute. Mais là encore, ce n’est pas notre sujet. Non, après avoir brièvement noté les défauts et la surabondance de cette histoire-mémoire télévisée dont on abreuve nos mirettes, je voulais vous dire : regardez la télé !

C’est un fait, la tendance, dans la jeunesse intellectuelle au sens large – c'est-à-dire incluant les étudiants de second cycle universitaire et, surtout, le peuple grouillant des classes prépa littéraires, que j’ai côtoyé pendant trois ans et que je côtoie encore – est au zéro télé. On se gargarise de ne pas posséder et de regarder le moins souvent possible ce petit écran, ce miroir aux alouettes où le peuple – le vulgus – se vautre dans la médiocrité de programmes abêtissants, dans sa médiocrité et sa bêtise. Pourtant, cette élite en gestation dont je fais partie ne doit pas se couper de la société. Et la société actuelle, qu’on le veuille ou non, c’est la télé. L’intellectuel, et je le dis modestement, simple étudiant d’une université de province, doit être dans le domaine culturel, sinon un pasteur, au moins un exemple. Et un berger ne méprise pas les moutons. Oui, je sais, la comparaison est très méchante et très incorrecte. Je suis méchant et incorrect.

Alors bien sûr, d’un coté j’appelle à regarder la télé, et de l’autre je suis le premier à m’insurger, en tant qu’historien, contre le type de documents qu’on nous servira justement ce soir, où la mémoire prend le pas sur l’histoire, où le témoin est mieux considéré que l’historien, où la victime est le témoin suprême, telle Rama Yade répondant à Edwy Plenel sur le plateau de Laurent Ruquier qu’il n’a aucun titre à la contredire à propos du racisme, puisqu’elle en a été victime (mais, comme je l’ai déjà dit, ce n’est pas notre sujet). Pourtant, j’ose dire aussi que, si l’on se coupe sciemment de la télévision, on ne peut en aucun cas prétendre la juger. Or la télévision est un pilier incontournable de la société actuelle. Malgré le « formatage » des opinions, la simplification, la médiocrité de certains programmes de divertissement, les biais de programmes culturels qui recherchent plus l’audimat et la rentabilité que la vérité, et, surtout, la dictature de l’émotion, celui qui prétend construire une pensée sociale (et j’inclus le culturel dans le social) ou politique a le devoir de connaitre la télévision, donc de la regarder. Surtout lorsque la prétendue élite intellectuelle porte aux nues un certain nombre de séries américaines, de How I met your mother à Desperate housewives, séries qui, pour être regardées en V.O. (j’y reviendrai certainement), n’en sont pas moins éloignées de la légitimité culturelle dont se réclame cette partie de leur public. Les intéressés se reconnaitront, s’ils me lisent, dans cette petite pique mesquine – je suis petit et mesquin – qui met un point final à notre billet du soir.

Dans la machine à remonter le temps : catalogue automne-hiver 1899-1900

La mission du jour : retrouver en ligne des versions numérisées de livres vendus sur le catalogue automne-hiver 1899-1900 d’Eaton…

J’ai choisi sept ouvrages, soit parce que je les ai lus, soit parce que ce j’apprécie leurs auteurs. J’ai d’abord cherché sur Google books (certainement un effet du quasi monopole de Google sur les mentalités), en essayant de trouver une édition suffisamment ancienne pour être celle du catalogue, puis, en cas d’échec, sur le projet Gutenberg et enfin, lorsque je n’avais toujours pas trouvé, sur archive.org. Je précise que cet ordre est totalement arbitraire. Il faut bien commencer quelque part…

Victor Hugo, Les Misérables, traduction de Charles Wilbour et Lascelles Wraxall : On trouve bien sûr très facilement une traduction anglaise des Misérables sur Google books. La traduction de Wraxall revue par Wilbour semble être la référence et est disponible gratuitement sur Google books (lien vers le second volume : http://books.google.fr/books?id=8i5AAAAAYAAJ&printsec=frontcover&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false).

Rudyard Kipling, The Seven Seas : On trouve là aussi très facilement cette œuvre poétique majeure de Kipling, qui n’est cependant pas disponible gratuitement sur Google books. On la trouve en revanche sur le projet Gutenberg (http://www.gutenberg.org/ebooks/27870) et sur archive.org.

Samuel Lover, Irish Legends and Stories : Partiellement disponible sur Google books sous le titre Legends and Stories of Ireland, le livre est accessible sur archive.org, mais pas sur le projet Gutenberg.

Oliver Goldsmith, The Vicar of Wakefield : Comme on pouvait s’y attendre pour un auteur populaire, le livre est disponible sur Google books (http://books.google.fr/books?id=4zgqAAAAYAAJ&printsec=frontcover&dq=the+vicar+of+wakefield&hl=fr&ei=QNPXTOv4DZWSjAfE-bXQCQ&sa=X&oi=book_result&ct=result&resnum=1&ved=0CDoQ6AEwAA#v=onepage&q&f=false)


Sir Walter Scott, Ivanhoe : Un des livres qui ont bercé mon enfance… Comme c’est un grand classique, on le trouve sur les trois sites et dans un grand nombre d’éditions (sans parler des traductions dans toutes les langues). Il est en revanche difficile de trouver quelle édition était vendue par Eaton. Le lien vers une édition de 2008 sur Google books : http://books.google.fr/books?id=AzOFjbOYaUMC&printsec=frontcover&dq=scott+ivanhoe&hl=fr&ei=79TXTKDTL9fPjAf-vd3FCQ&sa=X&oi=book_result&ct=book-thumbnail&resnum=1&ved=0CDAQ6wEwAA#v=onepage&q&f=false. Pour le plaisir, l’édition de 1910 : http://www.archive.org/stream/ivanhoe02unkngoog#page/n4/mode/1up et la traduction de Dumas (volume 2) : http://www.archive.org/stream/ivanhoe00scotgoog#page/n8/mode/1up trouvée sur archive.org.

John Ruskin, The Queen of the Air : Là encore, un classique. Etonnamment, alors qu’il est disponible sur le site du projet Gutenberg et sur archive.org (en plusieurs versions), le livre n’est pas accessible dans son intégralité sur Google books. Le lien vers une édition newyorkaise de 1893 : http://www.archive.org/stream/queenofair00rusk#page/n7/mode/2up.

Conclusion

Alors qu’on aurait pu s’attendre à tout trouver sur Google books, tant le groupe américain communique sur son projet de bibliothèque mondiale exhaustive, il n’en est rien. Si tous les livres que nous avons cherchés ont, comme nous nous y attendions pour des auteurs classiques, été numérisés par Google, le groupe n’a pas été autorisé à tous les diffuser pour autant. En revanche, archive.org ou le projet Gutenberg, dont les motivations sont moins économiques, mettent à disposition presque tous ces ouvrages. Il est à noter que la situation aurait cependant été différente avec des publications plus récentes : je me suis amusé à chercher « Guillaume Musso » et là, seul Google donne un accès (limité) aux best-sellers de l’auteur (limité ?).
Pour ce qui est de la littérature anglophone libre de droits, le travail de numérisation accompli est néanmoins impressionnant. En effet, même si – à part Samuel Lover – les auteurs des livres choisis jouissent tous d’une renommée mondiale, notre choix ne s’est pas forcément porté sur leurs œuvres majeures. Pourtant, elles sont pour la plupart non seulement disponibles gratuitement en ligne, mais dans plusieurs éditions différentes.

Edit 10 minutes après la publication : au passage, j'ai remarqué une faiblesse sur archive.org : contrairement à Google books, il est impossible de faire des recherches dans le texte, ce qui est pourtant très pratique.

dimanche 7 novembre 2010

Markup, le crayon à papier du web (eHub)

Markup est un outil d’annotation de pages web. Il permet, comme beaucoup de logiciels semblables, de laisser sur une page des commentaires sous formes de notes (en texte, donc en utilisant son clavier) ou de « coups de crayon » à la souris pour entourer, souligner, rayer…

Installation

Markup n’est pas à proprement parler un logiciel ou un plugin pour navigateur internet. C’est un processus java qui s’ajoute à la page sur laquelle on travaille – un peu à la manière du bandeau de recherche de Google Images – en entrant l’URL de l’outil dans la barre d’adresse. Pour simplifier son utilisation, le site http://markup.io nous propose d’ajouter cette URL, qui est très longue et compliquée, dans la barre de favoris, mais ce n’est pas une obligation. Il est donc a priori possible d’utiliser Markup sur n’importe quel ordinateur, y compris un ordinateur public, à un détail près : l’outil ne semble pas fonctionner avec Internet Explorer (les annotations n’apparaissent pas), ce qui, admettons-le, est souvent le cas. Une astuce au passage, pour utiliser Markup depuis un ordinateur public, on pourra par exemple stocker le lien sur une boite mail.

Utilisation

Je tiens avant toute chose à signaler ici un problème d’ergonomie qui ne concerne pas seulement Markup, mais tous les outils proposant de « dessiner » sur une page à l’aide du curseur : ces fonctions sont difficilement exploitables sur un ordinateur portable sans souris, à moins d’être un virtuose du pavé tactile – ce que je ne suis pas. La souris branchée, passons donc aux choses sérieuses…
On distingue dans l’utilisation de Markup trois volets principaux : l’annotation, l’enregistrement (bien sûr) et le partage. L’annotation, une fois dépassé l’obstacle de la souris, est très facile et très intuitive dans son utilisation. On a en fait un logiciel de dessin très simplifié, à ceci près qu’au lieu d’un fond blanc, on dessine et on crée des zones de texte non pas sur un fond blanc mais sur une page web. Plusieurs formes de dessin sont proposées (trait, ligne droite, cercle) et on peut choisir la couleur utilisée. On peut éventuellement déplacer les zones de texte crées. Un gros déficit, cependant, Markup ne permet pas d’annoter des PDF ouverts depuis un navigateur.
L’enregistrement et le partage sont là aussi très faciles. Le bouton « Publish » de l’outil Markup permet d’obtenir une URL de la page annotée, URL qu’on peut soit enregistrer (par exemple dans ses favoris), pour retrouver ses notes, soit partager en l’envoyant à un contact. Cette solution, si elle a l’avantage d’être simple et rapide, comporte cependant des inconvénients. A la différence, par exemple, d’un Google Documents, on ne dispose pas d’un espace utilisateur, d’un bureau où seraient centralisées toutes les URL des pages annotées. La perte de l’URL signifie donc la perte du travail, contrairement à un système avec identifications où d’une part on n’a qu’un seul ensemble identifiant-mot de passe à retenir et d’autre part on peut, même en cas de perte, retrouver son mot de passe.

Un outil au service de l’historien

L’utilité pour l’historien est assez évidente (on aurait pu dire : « pas besoin de faire un dessin ») : Markup est un peu aux documents publiés sur internet ce que le porte-mine est au format papier. Il permet d’annoter ses lectures afin de pouvoir ensuite rédiger plus simplement y revenir pour une synthèse, une fiche, un compte-rendu de lecture. S’il n’est certainement pas le premier du genre, c’est un outil utile, assez ergonomique et bien conçu, d’autant que ce n’est qu’une version beta, donc en cours d’amélioration.

Les + : outil indispensable de la prise de notes, facilité d’utilisation, ergonomie (avec une souris), facilité de partage
Les - : incompatible avec le format PDF et Internet explorer, ergonomie (sans souris), pas d’espace de stockage personnalisé / de « bureau » à la Google Documents

En bonus : le lien à coller dans la barre d’adresse pour annoter une page : ♒ MarkUp. Comme ça, plus besoin de le stocker sur une boite mail, il vous suffira de venir sur mon blog…

vendredi 22 octobre 2010

Google documents, un outil au service de l'historien ?

Pour commencer ce blog, j’ai choisi de m’intéresser à ce que j’appellerai un outil de travail collaboratif (je ne sais pas si le terme est exact, mais il me semble approprié), Google documents. Le géant américain du Web, s’il pose parfois problème en raison de sa situation quasi monopolistique sur certains marchés (la publicité, les moteurs de recherche…), propose plusieurs outils appréciables. Je précise que le test des fonctionnalités de Google documents a été réalisé avec Rémi Fédière, qui publiera sans doute un article sur le même sujet sur son blog (http://histoirenumeriquefediere.blogspot.com/).

Google documents est donc un outil de travail en ligne. Il propose un traitement de texte, un tableur, un outil de dessin, un outil de création de présentations (type Powerpoint) et un outil de création de questionnaires. Ces fonctionnalités sont accessibles sur internet au moyen d’un simple navigateur, sans que l’installation d’une suite logicielle de bureautique (Microsoft Office, OpenOffice…) ne soit requise. Si elle est utile, cette dimension ne suffit cependant pas à rendre Google documents incontournable, tous les ordinateurs ou presque étant équipés de logiciels de bureautique. Son intérêt réside en fait dans la possibilité offerte à l’utilisateur, au moyen d’un compte Google, de stocker et de partager en ligne des documents et, surtout, de travailler à plusieurs sur lesdits documents.
            Google documents permet en effet de collaborer en ligne. Ainsi, plusieurs personnes peuvent agir, et même interagir sur le document. Non seulement, les personnes autorisées à l’éditer peuvent modifier le document, mais elles peuvent le faire en même temps, les modifications s’affichant en direct sur les écrans des différents utilisateurs en ligne. Un code de couleurs permet de voir qui est en train d’écrire. Différents utilisateurs peuvent donc accéder, depuis n’importe quel ordinateur, aux documents sur lesquels ils travaillent, et travailler en collaboration en direct. Cette possibilité ouvre d’ailleurs des perspectives de travail collaboratif très intéressantes si on les couple par exemple avec un logiciel de visioconférence comme Skype.
Il faut en outre noter que le nombre d’utilisateurs pouvant modifier ou voir un document n’est pas limité. Les auteurs peuvent choisir qui a le droit de modifier, ou seulement de voir le document, allant même jusqu’à rendre possible une ouverture au web dans son entier, sans qu’un compte Google soit nécessaire pour modifier le document.

Les intérêts pour l’historien sont donc multiples, le premier étant de pouvoir travailler ensemble à distance.
A ce titre, l’outil de dessin peut être très utile lors de la construction d’une réflexion : il peut être utilisé comme un « tableau blanc » du type de celui que propose scriblink.com. Insistons une nouvelle fois sur les possibilités offertes par une utilisation couplée avec un logiciel de discussion par visioconférence. Google documents permet donc de réfléchir ensemble à distance, ou d’illustrer en direct une réflexion par des schémas. Si elle est moins « frappante » en termes d’avancée technologique, l’utilisation d’un tableau blanc virtuel peut bien sûr se faire aussi en différé.
Au-delà de cette construction de la pensée en direct par plusieurs utilisateurs distants, Google documents permet aussi un partage des tâches à distance. Prenons l’exemple d’un tableau de données réalisé à partir de fiches de recensement. Vingt-six utilisateurs peuvent se répartir les lettres de l’alphabet et remplir le même tableau en ligne. On évite ainsi plusieurs obstacles :
1)    La nécessité pour un des utilisateurs de centraliser les tableaux de ses différents collaborateurs et de les réunir en un seul document, ce qui multiplie le risque d’erreur.
2)    Le risque d’avoir des tableaux construits de manière différente, puisque chacun remplit ici le même modèle.
Ces obstacles peuvent bien sûr être évités par des précautions prises en amont, mais Google documents facilite ici le travail, d'autant plus lorsque le partage consiste par exemple à dépouiller des sources distantes.
De même, on peut envisager le cas d’un recueil d’articles écrits par différents auteurs sur un sujet donné. Si chaque auteur permet aux autres d’accéder à son article en cours d’écriture (pas nécessairement de le modifier, mais de le voir et, peut-être, de l’annoter), on peut éviter les redites, commenter certains points, faire des remarques et des suggestions. Si cette méthode de travail peut se heurter à des problèmes d’égo, elle semble assez prometteuse.

Si nous n’avons fait ici qu’entamer le déblaiement du terrain, ces quelques pistes de réflexion méthodologique montrent donc que Google documents peut être, pour l’historien, un outil utile et pertinent. Il multiplie en effet les possibilités de travail collaboratif, en permettant de s’affranchir de l’obstacle de la distance pour travailler à plusieurs hors des réunions et colloques occasionnels, que ce soit pour réfléchir ensemble ou pour se partager les tâches.

En résumé :

Les + : collaboration en direct, utilisation comme tableau blanc, ergonomie (code de couleurs), écriture collaborative, partage du travail, stockage en ligne, export et import depuis des suites bureautiques, suivi des modifications possible, gratuit
Les - : la barrière de la langue subsiste, il peut être fastidieux de retrouver quelque-chose qui a été effacé par un autre utilisateur, limite de stockage (1 Go, beaucoup pour du texte mais peu pour des présentations contenant des images), possibilités limitées par rapport à une suite logicielle comme Microsoft Office

Si j'en ai le temps, je mettrai peut-être des liens vers des exemples de travail collaboratif en commentaire. En attendant, vos remarques, idées, commentaires, compliments, etc. sont les bienvenus.

vendredi 15 octobre 2010

Quelques mots d'introduction...

Avant toute chose, bienvenue !

Créé dans le cadre du séminaire "L'Histoire à l'ère du numérique" de Christian Henriot, ce blog a pour vocation d'accueillir mes réflexions et travaux liés audit séminaire. Au delà de ce but premier, il pourra aussi accueillir divers articles touchant à mes travaux personnels, portant sur les rapports entre Edouard Herriot et les droites lyonnaises entre 1905 et 1957, et, pourquoi pas, à d'autres de mes dadas d'(apprenti) historien.

Je conçois avant tout ce blog comme un lieu d'échanges, un chantier de construction de la réflexion historique, et vos commentaires, en rapport avec le sujet bien sûr, sont donc les bienvenus.

Bonne lecture et à bientôt pour les premiers articles...