Numérisation des Œuvres de Frédéric Bastiat

Si vous souhaitez participer un tant soit peu à la numérisation des textes de Frédéric Bastiat, cette page est conçue pour vous.

1 Mettre Bastiat dans le PGDP?

Un truc vraiment sympa serait de mettre les œuvres complètes de Frédéric Bastiat à relire par le PGDP Europe.

Je recommande d'y mettre au fur et à mesure qu'ils sont complétés et dans cet ordre de priorité les volumes 7, 3, 1, 2, 5, 4, 6, tels que téléchargeables depuis la BNF ou depuis mon site ftp://numerisons@bastiat.mine.nu (mot de passe bastiat).

Ce n'est pas très compliqué et ça peut rapporter très gros, mais ça demande du temps et de la patience. Y a-t-il un volontaire pour s'en charger?

Pour le reste, vous pouvez utiliser la méthode traditionnelle, ici décrite.

2 Le processus de numérisation

Pour participer, il faut d'abord et surtout être prêt à passer du temps: plusieurs heures pour chaque texte. Le travail n'est pas dur, mais demande de l'application. Il est aussi possible de se faire aider et de travailler à deux (dictée). Les textes sont intéressants, et le travail n'est donc pas ennuyeux.

Le travail se divise en plusieurs étapes, qui ne sont pas nécessairement accomplies par la même personne. Si vous ne pouvez ou ne voulez accomplir que l'une d'entre elle, ce n'est pas grave, vous êtes aussi le bienvenu.

Les étapes cruciales sont la saisie et la relecture: je suis plus ou moins en mesure d'effectuer toutes les autres pour vous. Contactez-moi juste sur la liste de diffusion numeriseurs@bastiat.net.

Une étape supplémentaire est pour l'éditeur (i.e. votre serviteur) de gommer les erreurs restantes et de tout rendre conforme aux standards du site, avant de publier le texte sur Bastiat.org.

À titre indicatif, moi qui suis un habitué de la numérisation et un informaticien chevronné, je numérise à la vitesse de croisière de 10 pages par heure, effectuant toutes les étapes, mais avec une seule lecture du texte. Votre vitesse sera sans doute plus lente, surtout au début, et je vous recommande de vous chronométrer sur des textes plus courts, pour pouvoir planifier une activité de numérisation dans votre emploi du temps, compte tenu de la pagination textes disponible sur la table des matières des œuvres complètes de Frédéric Bastiat.

3 Choisir un texte

La première chose à faire est de choisir un texte ou plusieurs textes à numériser parmi ceux qui ne l'ont pas encore été. Pour cela, le plus simple est de consulter la liste des œuvres complètes de Frédéric Bastiat sur Bastiat.org, et d'en choisir une non encore publiée. Si le choix vous embarasse, n'hésitez pas à poser la question sur la liste de diffusion numeriseurs@bastiat.net, et nous vous conseillerons. Les textes non encore numérisés des tomes 4, 5, 6 sont des choix sûrs.

Avant de passer plusieurs heures sur un texte, il peut être utile de vérifier que le texte que vous voulez numériser n'est pas déjà en train de l'être par quelqu'un d'autre. Pour cela, contactez-nous à numeriseurs@bastiat.net et annoncez votre intention. (Je peux vous inscrire ou vous désinscrire de cette liste de diffusion si vous le désirez.) Comme en général tous ne se bousculent pas pour numériser Bastiat, ce n'est toutefois pas indispensable. (D'un autre côté, c'est bien sûr toujours en même temps que se manifestent les nouveaux numériseurs.)

4 Scanner le texte

La plupart des textes de Bastiat ont déjà été scannés et sont publiés par la BNF sur gallica.bnf.fr. Tout est répertorié sur mon sommaire des œuvres complètes. Ne manque que le volume 7 des œuvres complètes, fait de petits inédits collectionnés entre la première et la seconde édition. Cette étape est donc dans la plupart des cas superflue. Il faut toutefois récupérer les textes. J'ai tout préparé pour vous [1], et vous n'avez qu'à télécharger les textes qu'il vous intéresse de numériser ou relire, en pointant votre explorateur sur ftp://numerisons@bastiat.mine.nu avec pour mot de passe bastiat.

Si vous disposez vous-même d'un texte et comptez faire l'ensemble de la numérisation et la relecture, alors l'étape de scanner n'est pas indispensable; elle reste utile pour permettre des relectures supplémentaires par des éventuels tiers, ou un retour à l'édition originale pour d'éventuels chercheurs.

Si vous disposez du texte scanné, c'est parfait, passez à l'étape suivante. S'il n'a pas encore été scanné, et que vous n'avez pas la possibilité de le scanner vous-même, pas de problème: demandez (gentiment) aux autres numériseurs que l'un d'entre eux se dévoue pour scanner le texte et vous l'envoyer; puis, passez à l'étape suivante.

Supposons maintenant que vous disposez d'un texte original non encore scanné (livre ou photocopie) et d'un scanneur. Réglez votre scanneur sur la résolution optique maximale disponible (pour référence, nous scannons les textes à 300ppp; la BNF les a scanné à 200ppp), en mode "ligne" (1 bit par point, noir et blanc). Sauvez chaque page ou feuille séparément dans un fichier TIFF, en utilisant la compression G3 ou G4, si elle est disponible. Mettez toutes les pages dans un seul fichier TIFF ou dans une archive ZIP, que je publierai sur ma machine. Et voilà!

Enfin, si le texte a déjà été scanné, mais que vous avez des difficultés à le récupérer, contactez-moi, et précisez quel format vous préférez: un seul fichier TIFF multipage, une archive avec un fichier TIFF par page, un fichier PDF, ou autre. Si vous ne savez pas, précisez de quels logiciels vous disposez.

5 Numériser automatiquement le texte

J'ai déjà effectué cette étape pour vous pour tous les textes déjà scannés, c'est à dire la grande plupart. Il vous suffit de récupérer le résultat au même endroit que les textes déjà scannés, sur le site ftp://numerisons@bastiat.mine.nu, mot de passe bastiat.

Supposons que vous numérisiez un des textes non scanné par la BNF. Vous disposez maintenant du texte sous forme scannée. Si vous disposez d'un logiciel adéquat, une bonne base de travail pour la numérisation du texte est de le faire reconnaître automatiquement par un logiciel d'OCR (Optical Character Recognition — Reconnaissance Optique de Caractères).

Si vous ne disposez pas d'un tel logiciel, ou que votre logiciel est de trop mauvaise qualité, contactez la liste numeriseurs@bastiat.net, et un autre numériseur mieux équipé le fera pour vous.

Cette étape n'est pas du tout indispensable. Vous préférez peut-être tout retaper vous-même. Mais le résultat de l'OCR peut vous faire gagner du temps, surtout si vous travaillez seul.

6 Saisir le texte

C'est là la partie la plus cruciale. Il n'y a pas de méthode miracle — sinon j'aurais déjà tout fait. Mais heureusement, c'est aussi un travail agréable, puisqu'il permet de découvrir de près les chefs-d'œuvres de Bastiat. Voici des petits conseils pour vous aider.

Supposons que vous disposiez du texte original, sur papier (édition originale, photocopie, imprimé depuis la version scannée), ou sur votre écran (si vous arrivez à supporter la chose). La façon bête et méchante de faire est de retaper tout le texte. Il existe cependant plusieurs méthodes pour vous simplifier la tâche.

Une première façon est d'utiliser un logiciel d'OCR (Reconnaissance Optique de Caractères) qui reconnaît une bonne partie du texte à partir de la version scannée (cf. étape précédente). Une deuxième façon est d'utiliser un logiciel de dictée vocale, qui reconnaît une bonne partie du texte à partir de votre voix. Dans un cas comme dans l'autre, ces logiciels font toutefois de nombreuses erreurs, et il ne faut pas négliger de repasser derrière pour corriger ces erreurs, restaurer la mise en page, etc.

Si les logiciels disponibles de reconnaissance automatiques ne vous satisfont pas, une autre façon est de tout faire à la main. Si vous avez les textes scannés, il peut être utile d'afficher à l'écran la version que vous transcrivez en même temps que l'éditeur de texte dans lequel vous le transcrivez: ceci vous permet d'avoir tout sous les yeux sans avoir à faire les incessants mouvements de cou nécessaires si le texte est à plat sur une table, sans parler des ajustements oculaires dûs aux changements de luminescence entre l'écran et le papier. Une autre façon de faire est de se faire dicter le texte par un parent ou ami — voire par soi-même, via un enregistrement de votre voix. Dans le cas d'une dictée, enregistrer la dictée est de toute façon une bonne idée, car cela facilite l'étape suivante de relecture.

Si cela peut vous aider, notez que certains textes ont déjà été partiellement transcrits, des extraits étant disponibles sur Bastiat.org, ou dans les archives de Bastiat.org — raison de plus de contacter numeriseurs@bastiat.net.

Notez que si vous repérez des erreurs systématiques du logiciel, vous pouvez les réparer semi-automatiquement avec les fonctions de recherche et remplacement de votre éditeur de texte. De bons éditeurs de texte disponibles sur tous les ordinateurs sont XEmacs et VIM. Ils vous aiderons aussi pour la mise en forme du texte, sachant que de toute façon, la mise en page de Word ou d'un éditeur HTML ne me servirait pas beaucoup en tant que tel. (cf. section plus bas).

7 Relecture

La partie la plus longue et fastidieuse consiste en la relecture, armé à la fois du texte original et de l'ébauche numérisée sur un ordinateur. Cette partie n'est pas strictement indispensable si vous avez saisi le texte, car je serai sans aucun doute derrière vous à relire. En fait, comme il fastidieux d'être à la fois transcripteur et relecteur pour le même texte, il est bon que deux personnes différentes effectuent ces travaux différents — ainsi, le relecteur, découvrant le texte, y est plus intéressé, donc plus attentif, et peut corriger des erreurs auquel le transcripteur n'a pas fait attention. Néanmoins, vous pouvez me faire gagner du temps en relisant de votre côté, et/ou en faisant relire par autrui, ou en relisant en tandem. Il est bon aussi que vous relisiez les textes que j'ai transcrits.

Idéalement, trouvez une personne amie pour lire le texte à haute voix en spécifiant la ponctuation et les bizarreries orthographiques, pour contre-vérifier votre texte; ou enregistrez-vous en train de dicter le texte de la sorte. Ou si vous disposez d'un écran assez bon, vous affichez l'original scanné côte-à-côte avec sa transcription (ou l'un au-dessus de l'autre).

Utilisez si vous pouvez un logiciel de correction orthographique. Attention toutefois que certaines erreurs sont d'origine, et qu'il était correct d'écrire certains mots ou certaines expressions de façon différente au milieu du dix-neuvième siècle.

Votre relecture peut se faire pendant, avant, et/ou après l'étape suivante de mise en page du texte. En fait, cela m'aiderait si elle se fait pendant et après, c'est-à-dire si vous vous occupez au moins un peu de la mise en forme du texte.

Si vous relisez un texte déjà numérisé, le plus simple pour moi que vous éditiez le fichier au format Scribe. Remplacez .html par .scr dans l'URL du fichier, et téléchargez ainsi le fichier Scribe, modifiez-le et envoyez-le moi. (Attention: beaucoup d'antivirus refusent l'envoi de fichier en .scr dans l'email. Aussi, renommez le fichier en .txt avant de me l'envoyer.) Sinon, envoyez-moi un fichier où vous aurez mis les fautes en rouge ou accompagnées de XXX. Annotez les fautes avec des XXX dans le texte, et suggérez entre parenthèses une correction, si vous avez regardé l'original. C'est la façon la plus simple pour vous et moi de transmettre les corrections de façon simple à vérifier et à répercuter. Si vous ne pouvez pas mettre du rouge, insérez des XXX dans le texte.

8 Mise en forme

Pour la publication des textes sur Bastiat.org, j'ai défini un format de fichier qui permet simplement de spécifier les italiques, etc., d'une façon à la fois facile à écrire et à lire. Cela me simplifie énormément la vie si vous suivez les consignes suivantes [2]:

9 Remerciements

Les personnes suivantes ont numérisé avec moi des œuvres de Bastiat, qu'elles en soient remerciées: Claude Balança, Gregory Bodylski, Loïc Étienne, André de Guenin, Jean-Michel Leloup, Bertrand Lemennicier, Franck Guérinet, Clément J, Krylenko, Michel Leter, Patrick Madrolle, FP, Bruno Rouchouse, Christophe Vincent.

Nous tenons aussi à remercier tous ceux qui nous ont fourni des textes de Bastiat à numériser: Claus et Marianne Diem et Jacques de Guenin pour leurs photocopies, mais aussi Alain Madelin pour les nombreuses œuvres scannées de Bastiat sur le CD-ROM qu'il a édité, Aux sources des idées libérales[12] et enfin la BNF pour avoir scanné les 6 premiers tomes des œuvres complètes de Frédéric Bastiat [13].

Notes

[1]: Pour les informaticiens que cela intéresseraient, j'ai sauvé dans un shell script get_bastiat_bnf les commandes grâce auxquelles j'ai semi-automatisé toute la préparation.

[2]: Pour que l'édition électronique soit de la meilleure qualité possible, permettre des relectures ultérieures, un retour au texte, etc., il faut que les textes numérisés préservent les informations commes: les italiques, les notes de bas de page, coquilles de l'original et leur correction, etc. Il n'y a pas de moyen universel de communiquer toutes ces informations, et il pour communiquer ensemble, il faut donc s'accorder sur des conventions. Les recommendations qui suivent sont les conventions que j'utilise sur Bastiat.org.

Bien sûr, ces recommendations sont facultatives, au sens où je vous remercie déjà bien assez si vous saisissez et relisez des textes de Bastiat sans suivre ces conventions. Néanmoins, je vous convie vivement à les suivre, d'autant plus qu'elles sont relativement simples.

Pour ceux que la technique intéresse, j'ai d'abord écrit Bastiat.org directement en HTML, mais je me suis lassé de l'horreur qu'impliquaient la gestion des notes de bas de page, sans parler de la lourdeur du tout. Aujourd'hui, j'utilise Scribe (en fait, ma réimplémentation, Exscribe), et j'en suis très satisfait: par exemple, ceci est un exemple de note de bas de page produit automatiquement par Scribe, et si vous avez l'estomac bien accroché, vous pouvez comparer la simplicité relative des instructions qui suivent avec la complexité du HTML à déployer pour obtenir le même résultat — demandez à votre navigateur d'afficher le source HTML de cette page.

Comme Scribe est inutilement compliqué pour les néophytes, de par sa sophistication, j'ai formalisé un format de fichier texte qui est plus facile à taper et à relire, et qui suffit amplement pour les textes dont il s'agit. J'ai un script qui transforme automatiquement les fichiers écrits en ce format en des fichiers Scribe, qui est le format dans lequel je stoque les textes.

Les fichiers au format Word me sont à peu près inutile pour Bastiat.org, car toute leur mise en page est inexploitable. Quand j'en reçois, je m'empresse de le transformer en texte (ce qui ne m'est pas facile non plus), et je perds du coup les italiques, etc. Le HTML est presqu'aussi mauvais (plus simple à visionner et à transformer en texte, mais aussi difficile à exploiter). Vraiment, les fichiers au format de texte indiqué, ou en Scribe, sont ce que j'attends de la part des numériseurs.

[3]: Surtout, pas de Word, ni de RTF, ni même de HTML. Vous pouvez m'envoyer du Scribe si vous voulez.

[4]: À titre indicatif, vous pouvez voir ce que donne à partir du format texte le format Scribe sur lequel je travaille, ou le format HTML obtenu en fin de compte. Si vous devenez co-webmestre de Bastiat.org, vous devrez apprendre le Scribe, mais vous pouvez continuer à saisir les textes numérisés en texte, car il est de toute façon plus simple de les saisir ainsi et de les convertir automatiquement en Scribe. La saisie en HTML est une perte de temps.

[5]: Par contre, conservez les orthographes d'origine, notamment les tirets dans non-seulement ou très-bien, les accents aigus dans priviléges, etc. Ajoûtez un XXX:sic si vous voulez. Ne corrigez que ce qui était une faute à l'époque -- et alors précisez l'original avec sa faute dans un (XXX :EO ...). Cf. plus bas pour toutes les précisions sur ces annotations.

[6]: À l'intérieur d'un paragraphe, les sauts de ligne sans ligne blanche ne comptent pas trop; du coup, j'aime bien les mettre de façon à couper les phrases de façon "logique", c'est-à-dire à la frontière entre deux groupes grammaticaux aussi larges que possible — voir les fichiers d'exemples ci-haut. Outre l'aspect esthétique, qui est je l'avoue discutable, je trouve d'expérience que cela permet de repérer facilement les erreurs qui consistent à effacer ou oublier de transcrire des morceaux de phrase, ou à les transcrire deux fois. De telles erreurs "sautent aux yeux" quand les phrases sont découpées logiquement.

Quant à la ponctuation, je suis les conventions habituelles dans la typographie française pour les fichiers textes: pas d'espace avant les ponctuations :;?!., mais un espace après; pas d'espace juste après l'ouverture de parenthèses ou guillemets, ni juste avant leur fermeture, mais un espace juste avant l'ouverture et juste après la fermeture.

[7]: Pour distinguer des italiques d'emphase celles utilisées pour indiquer une langue étrangère, ou la citation d'un titre, précédez la première barre de division d'une lettre code dans les cas suivants: l/.../ pour le latin, e/.../ pour l'anglais, i/.../ pour l'italien, t/.../ pour le titre d'une publication.

[8]: Si comme c'est souvent le cas, la note de bas de page est juste avant une virgule ou un point, le signe de ponctuation sera donc rejeté jusqu'après le crochet refermant la note de bas de page.

[9]: Mettez des commentaires quand vous avez des doutes sur le texte: si quelque chose vous paraît une coquille, mais vous n'en êtes pas sûr, parce que vous n'avez pas l'original sous les yeux, ou que l'image scannée est floue — ainsi un relecteur ultérieur pourra rapidement s'occuper des passages qui méritent vraiment un coup d'œil. Un (XXX) suffit pour indiquer que quelque chose vous chiffonne à cet endroit.

Mettez aussi une remarque si vous voulez rajouter une note de l'éditeur, rapprocher le texte d'un autre, m'envoyer un message concernant un fragment du texte, etc.

Enfin et surtout, mettez impérativement une remarque si vous corrigez le moins du monde l'original.

[10]: Même s'il n'y a pas d'erreur mais que vous pensez qu'un lecteur pourrait penser que c'en est une, insérez un XXX:sic pour lui épargner d'avoir à regarder l'original ou à mettre lui-même un XXX qui fera regarder un relecteur suivant.

Si vous estimez devoir corriger une erreur, indiquez dans un commentaire l'orthographe de l'édition originale, comme dans cet exemple: Si notre artisan entreprend (XXX :EO entrepndre) un voyage... Je note en général :EO si mon commentaire suit l'erreur, et EO: si mon commentaire précède l'erreur corrigée. De même, j'indique (XXX sic:) si le passage non corrigé suit le commentaire plutôt qu'il ne le précède. Si l'erreur est dans le texte lui-même, surtout ne corrigez pas l'auteur, mais insérez une note de bas de page signée NdEEE (pour "Note de l'éditeur de l'édition électronique"), dans laquelle vous apporter votre contradiction et votre correction. Il est essentiel que les lecteurs aient accès à un texte aussi proche de l'original que possible, et que ceux qui étudieront et citeront le texte puissent accéder au texte exact de l'original.

[11]: Enfin, il est judicieux d'indiquer dans ce commentaire XXX de fin de texte si vous avez ou non relu le texte, et si cette relecture a été extensive et minutieuse, ou si elle a été rapide. Cela permettra d'améliorer le degré de confiance que les (re)lecteurs peuvent accorder au texte numérisé.

[12]: Au cas où il y aurait des mal-comprenants parmi nos lecteurs, non, cela n'implique aucunement de notre part un quelconque engagement ou une quelconque caution concernant l'activité politique de M. Madelin. Nous lui savons gré de son intérêt profond et sincère pour les idées libérales en général et l'œuvre de Frédéric Bastiat en particulier; mais nous nous gardons d'avoir une opinion collective (concept même qui nous répugne profondément) vis-à-vis de l'adéquation de ses options politiques et compromis électoraux. Ainsi, chacun d'entre nous, fort de sa propre opinion, vote (ou s'abstient de voter) selon son cœur et sa raison, comme de bien entendu. Cette remarque ne doit d'ailleurs pas non plus être interprétée comme un dénigrement de la même activité politique. En fait, nous invitons notre lecteur à ne pas considérer le moins du monde nos éventuelles opinions quant à ladite activité politique.

[13]: Et ceci non plus n'implique aucune caution des activités de cette institution en général, de son caractère étatique, etc.

Article écrit pour Bastiat.org par François-René Rideau, numériseur de nombreux textes de F.B., éditeur de Bastiat.org

Bastiat.orgLe Libéralisme, le vraiUn site par François-René Rideau