Persée est un programme de publication électronique de revues scientifiques en sciences humaines et sociales. L’intégralité des collections imprimées de revues est numérisée et mise en ligne sur un portail qui offre un accès à l’ensemble de ces collections et des possibilités avancées d’exploitation de ces corpus numérisés. Les revues font l’objet d’une sélection pour garantir la cohérence de l’offre éditoriale et scientifique du portail.
Un outil de diffusion scientifique et de recherche
Les revues françaises en sciences humaines et sociales constituent un riche patrimoine scientifique. Leur numérisation et leur mise en ligne procèdent d’un triple objectif :
- valoriser les publications scientifiques en langue française ;
- favoriser un accès libre aux résultats de la recherche et au patrimoine scientifique ;
- mettre à disposition de la communauté scientifique un outil de recherche et de consultation.
L’une des ambitions de Persée, au-delà de la numérisation des collections imprimées de revues scientifiques et de leur diffusion en ligne, est d’offrir des services et des outils permettant une exploitation enrichie des documents sans que l’internaute ne perçoive de rupture notable avec ce qui lui est proposé pour l’édition électronique. Ainsi le portail Persée apporte-t-il des plus-values technologiques comparables aux portails d’édition courante de revues. Ces plus-values se traduisent en termes de fonctionnalités pour l’utilisateur final :
- visualiser toutes les revues classées de manière alphabétique et/ou thématique ;
- accéder au sommaire et à la table des matières numériques des numéros de revues ;
- accéder au fac-similé de la revue ;
- feuilleter un document page à page ;
- accéder directement à une page d’un document ;
- modifier l'orientation et la taille de l’image de la page affichée à l’écran ;
- afficher le texte issu de la reconnaissance optique de caractères appliquée au document ;
- rechercher dans les métadonnées et dans le texte intégral des documents ;
- obtenir des références bibliographiques précises (titre, auteur, année, volume, numéro de la revue, pagination, type d’unité documentaire, conditions d’accès à la revue) ;
- afficher le résumé, le plan, la liste des figures ;
- obtenir les références croisées autour de l'article ;
- télécharger et imprimer les documents (génération de PDF à la volée) ;
- bénéficier de services personnalisés après authentification (historique des requêtes et des documents, gestion et partage de documents).
Un Libre accès maîtrisé
Le programme Persée a pour objectif premier de diffuser largement sur l’Internet les revues scientifiques de langue française dans le domaine des sciences de l’homme et de la société. Considérées comme un élément constitutif du patrimoine, les collections sont mises à disposition de tous gratuitement dans une logique d’accès libre et de diffusion non exclusive.
L’éditeur ou le diffuseur de la revue peut déterminer une période récente, de 2 à 5 ans, pendant laquelle les numéros ne sont pas librement diffusés sur l’Internet. Cette barrière mobile est un moyen de garantir la commercialisation de la production courante sous forme « papier » ou électronique.
Le respect du droit des auteurs
La nature même du programme Persée conduit à poser la question du droit des auteurs alors que le contenu de leurs travaux est proposé librement sur l’Internet. En l’absence de contrat faisant explicitement état d’une autorisation de diffusion par voie électronique, les revues partenaires du portail Persée recherchent les auteurs ou leurs ayants droit afin d'obtenir les cessions de droit nécessaires à la numérisation et à la diffusion des collections de revues. Un courrier individuel est ainsi adressé aux auteurs pour lesquels une adresse récente a pu être identifiée.
Une coopération avec les autres portails
Des accords de coopération sont en cours de formalisation avec les principaux portails francophones assurant la diffusion de la production courante de revues scientifiques. L’objectif est d’offrir aux lecteurs une continuité dans la consultation des fonds lorsque la partie patrimoniale de la revue est disponible sur Persée et que la partie courante est accessible sur un autre site.
Les choix documentaires et technologiques
Les choix documentaires et technologiques de Persée dérivent des usages de la communauté scientifique : nécessité d’accéder au texte intégral, intérêt pour l’article et les différents éléments qui le composent, et recherche en langage naturel par exemple.
Persée repose sur un certain nombre de normes et de standards ouverts qui garantissent une réutilisation possible des données dans le futur, une utilisation optimale du site web par tout internaute, l’interopérabilité du portail et des possibilités étendues de mutualisation avec d’autres outils du même type.
Selon la nature des documents primaires fournis par les revues (imprimé ou électronique), les collections de revues sont :
- numérisées en mode image, garantie du strict respect de la maquette originale et de l’identité de la publication. Elles sont également transcrites en mode texte (utilisation d’un logiciel de reconnaissance optique de caractères pour traiter toutes les pages numérisées) ce qui permet d’effectuer des recherches sur le contenu même des articles.
- converties depuis leur format électronique natif vers des formats XML aptes à alimenter le portail et à garantir la pérennité des données.
Le fonds documentaire est structuré et la logique éditoriale des revues est ainsi retranscrite dans le portail PERSEE (norme XML et schéma de données) :
- Description de la revue (titre et changements de titre possibles, segmentation en année, volume et numéro) ;
- Indexation des articles, des recensions et des notes critiques ;
- Indexation des illustrations présentes au sein même d’un document.
Des développements Open Source
L’ensemble des développements réalisés dans le cadre du programme PERSEE (chaîne de production et portail de diffusion) sont « en Open Source ». Ils sont en effet dotés une double licence CeCCIL et GPL et pourront être réutilisés dans le cadre d’autres projets de numérisation et/ou de diffusion de documents. Cette logique a permis la mise à disposition des technologies PERSEE pour d’autres projets sur le site lyonnais (Fonds Gallavardin, Corpus de textes linguistiques fondamentaux) et sera de nouveau illustrée dans le courant de l’année 2008 par le déploiement des technologies PERSEE sur un nouveau site (Université Paris Descartes) où elles seront également utilisées dans des projets de bibliothèque numérique propres à l’établissement.
Un investissement pérenne
Au-delà de la mise à disposition des données sur son portail de diffusion, le programme PERSEE s’est doté d’un « volet archivage pérenne ». Un système assurant l’archivage, à très long terme, de l’ensemble des données produites dans le cadre de PERSEE a été mis en place fin 2008.
L'ensemble des revues présentes sur le portail Persée est en cours d'archivage. C'est le CINES (Centre Informatique National de l'Enseignement Supérieur), en collaboration avec l'équipe Persée, qui assure cette mission.
Statistiques d'archivage (au 06/09/2011)
- 61 collections complètes
- 11 580 fascicules
- 2 267 573 pages
- 10,2 Tera octets
No comments:
Post a Comment