Friday, February 24, 2017

DIST CNRS et Unités rattachées INIST, CCSD et Persée. PLATEFORMES DE PARTAGE D'INFORMATION SCIENTIFIQUE ET TECHNIQUE



http://www.cnrs.fr/dist/presentation.htm

Unités rattachées

INIST 

- Institut de l'information scientifique et technique
L’Institut de l'information scientifique et technique du CNRS (INIST-CNRS) facilite l’accès aux résultats issus des différents champs de la recherche mondiale.
Deux sites d'informations sur l'IST :
     - LaLIST : La veille pour vos informations scientifiques, techniques et stratégiques
     - OpenAccess.Inist : Libre accès à l’information scientifique et technique

CCSD 

- Centre pour la communication scientifique directe
Le Centre pour la communication scientifique directe (CCSD - UMS 3668) est une unité mixte de service du CNRS, créée fin 2000 et principalement dédiée à la réalisation d’archives ouvertes.
Le CCSD a créé, développe et administre l’archive ouverte HAL, la plateforme de gestion de colloques SciencesConf.org et celle de gestion d’épi-revues Episciences.org.

Persée 

- Portail de revues en sciences humaines et sociales
Les missions de l’UMS Persée sont la valorisation numérique des ressources scientifiques, la recherche et l’innovation en matière d’outils et de méthodologies pour développer des corpus numériques et la diffusion de compétences et d’expertise dans ces domaines

PLATEFORMES DE PARTAGE D'INFORMATION SCIENTIFIQUE ET TECHNIQUE

Différentes plateformes (bibliothèques numériques, bases de données, archives ouvertes, moteurs de recherche, etc.) utilisées pour le partage des résultats de la recherche. Les plateformes sont recensées et catégorisées afin de mettre en valeur les initiatives en faveur de la mutualisation des connaissances et du libre accès à la production scientifique.


Bases de données en libre accès


En France :

  • HAL(Hyper articles en ligne) est une archive ouverte pluridisciplinaire destinée au dépôt et à la diffusion d'articles scientifiques (publiés ou non) et de thèses. Les thèses sont disponibles dans TEL (thèses en ligne). L’acquisition des données se fait par auto-archivage. La diffusion d’HAL est sous la responsabilité du CCSD (Centre pour la communication scientifique directe), une unité mixte de services du CNRS (DIST), de l’INRIA et de l’Université de Lyon.
  • Gallica permet d’accéder librement à de nombreux documents numérisés (livres, revues, photos, enluminures, etc.) de la Bibliothèque nationale de France (BNF). La base de données couvre toutes les disciplines, mais particulièrement les sciences humaines et sociales.
  • Huma-Num est une rès grande infrastructure de recherche (TGIR) en SHS. Elle est portée par l'Unité Mixte de Services 3598 associant le CNRS, l'Université d'Aix-Marseille et le Campus Condorcet. Huma-Num propose un ensemble de services, notamment via les plateformes NAKALA et ISIDORE :
    NAKALA permet à des équipes de recherche, qui en font la demande, de déposer leurs données numériques (fichiers texte, son, image, vidéo) dans un entrepôt sécurisé qui assure à la fois l'accessibilité aux données et leur citabilité dans le temps. Les technologies mises en oeuvre permettent notamment de rendre interopérables les métadonnées, c'est-à-dire la possibilité de pouvoir les connecter à d'autres entrepôts existants, et de les rendre moissonnables par des services spécialisés comme ISIDORE.fournit un Handle (pas DOI)
    Un identifiant unique est associé à chaque donnée et permet ainsi de citer les données indépendamment de leur localisation réelle : la technologie proposée est basée sur l’attribution d’identifiants de type handle, qui possèdent un mécanisme d’adressage générique, sans lien avec l’institution qui porte le service. C’est ce qui rend pérenne l’accès à la donnée, même en cas de changement ou d’évolution de l’institution qui porte le service.
    ISIDORE est une plateforme de recherche permettant l'accès à des documents numériques en libre accès de sciences humaines et sociales (SHS).
  • OpenEdition (contenant : Revues.org, Hypothèses.org, Calenda, etc.) est un portail de publication en SHS créé par le Centre pour l'édition électronique ouverte (Cléo). La majorité des articles sont en « open access freemium », tandis que d’autre sont en « open access simple » et « accès exclusif ». OpenEdition est financé par le CNRS, l'EHESS, l'Université d'Aix-Marseille, l'Université d'Avignon, la Fondation Calouste Gulbenkian et Google.
  • Pascal et Francis est une base de données bibliographique en libre accès en sciences exactes (Pascal) et en sciences humaines et sociales (Francis). Pascal et Francis étaient deux bases de données distinctes, accessibles par abonnement, développées par l’INIST-CNRS entre 1972 et 2015. En juillet 2016, l’INIST-CNRS annonce la mise en libre accès des deux bases de données, qui sont fusionnées, offrant ainsi un accès gratuit et sans inscription à plus de 14 millions de références bibliographiques.
  • Persée est un portail de revues en sciences humaines et sociales (SHS) dont les documents sont acquis grâce à une numérisation rétrospective de revues françaises. Le texte intégral est accessible en mode image ainsi qu’en mode texte (OCR). Persée est géré par l’UMS Persée, l’Université de Lyon, l’ENS Lyon et le Ministère de l'Éducation nationale, de l'Enseignement supérieur et de la Recherche (MENESR).

En Europe :

  • Europeana / Europeana Collections est un catalogue en libre accès, spécialisé en musique, art et histoire. Ce catalogue permet de rechercher des ressources numériques (livres, matériel audiovisuel, photographies, documents d'archives, etc.) issus des bibliothèques nationales des Etats membres de l’Union européenne. Le site, lancé en novembre 2008, est actuellement (juillet 2016) en phase de test. Europeana Collections est géré par une fondation (Europeana Foundation) et est co-financée par l’Union européenne.
  • The European Library est un portail de recherche qui permet d’accéder à des ressources (livres, affiches, enregistrements sonores, vidéo, etc.) des bibliothèques nationales d’Europe. L’accès aux documents peut-être gratuit ou payant selon la politique de chaque bibliothèque nationale. Le développement de ce portail européen est effectué par un consortium réunissant une trentaine de bibliothèques nationales européennes. Les données brutes sont accessibles via l’API « The European Library Open Search API ».
  • INSPIRE HEP (High-Energy Physics Literature Database) est une base de données bibliographiques en libre accès, au niveau européen, dans le domaine de la physique des hautes énergies, gérée par le CERN.
  • Econstor est une base de données bibliographique, spécialisée en économie et commerce. Le contenu d’Econstor – c’est-à-dire de la littérature scientifique en libre accès – est également accessible via certains portails et moteurs de recherche. Cette plateforme est développée par la Bibliothèque nationale allemande d'économie (ZBW).
  • Paperscape est un outil de visualisation des données contenues dans ArXiv, créé par Damien George et Rob Knegjens.
  • Zenodo est un entrepôt de données (bases de données, images, publications, video/audio, etc.) qui permet aux chercheurs de déposer des ensembles de données et de les lier à des publications scientifiques. Il est issu du projet européen OpenAIREplus, développé par le CERN et lié aux projets pilotes de la Commission européenne en matière de gestion de données. Zenodo affecte des DATACITE DOIs aux objets et expose les métadonnées de description au moissonnage à travers le protocole OAI-PMH, le protocole d’interopérabilité des archives ouvertes (Prodinra, HAL…).

Aux Etats-Unis :

  • ArXiv est une archive ouverte internationale de prépublications électroniques d'articles scientifiques dans les domaines de la physique, l'astrophysique, des mathématiques, de l'informatique, des sciences non linéaires et de la biologie quantitative. ArXiv est accessible gratuitement. Cette plateforme est gérée par Cornell University Library. En février 2012, le total des dépôts s'élevait à plus de 700 000 publications.
  • bioRxiv est une archive ouverte de prépublications d’articles scientifiques en sciences du vivant, lancée fin 2013 par le Cold Spring Harbor Laboratory (CSHL), un organisme américain privé à but non lucratif effectuant des recherches en médecine et biologie. Sur le modèle d’ArXiv, mais dans les domaines des sciences de la vie, ce réservoir n’accueille que des prépublications. Le dépôt des prépublications et leur accès sont gratuits. L’objectif est de de réduire le délai entre la rédaction de l’article et sa mise à disposition. Ces prépublications ont une URL pérenne et sont indexées par les moteurs de recherche.
  • CiteSeerX est « un moteur de recherche et une librairie numérique pour les articles scientifiques et académiques avec une attention portée sur l'informatique. Il est développé par des chercheurs de l'université d'État de Pennsylvanie. Il utilise un index de citation qui permet de rechercher par citation et d'ordonner les documents par l'impact des citations.» (Wikipedia).
  • D-PLACE, qui signifique « Database of Places, Language, Culture, and Environment », est une base de données - non bibliographique - sur les lieux, langues, cultures et environnements, développée par la National Evolutionary Synthesis Center (Etats-Unis) et la Max Planck Institute for the Science of Human History (Allemagne). Les informations ethnographiques sont regroupées en « sociétés », chacune étant liée à une position géographique et à une langue. D-PLACE permet aux internautes de visualiser les informations sous forme de tableau, de carte ou d’arbre linguistique.
  • JSTOR (contraction de Journal Storage) est une base de données bibliographique généraliste ainsi qu’un système d'archivage en ligne de publications académiques. L’accès à JSTOR dépend des inscriptions de chaque établissement. JSTOR est une société américaine à but non lucratif basée à New York.
  • Public Library of Science (PLOS) est une plateforme spécialisée en biologie et médecine permettant un libre accès à des publications scientifiques anglophones. La plateforme PLOS est gérée une société américaine à but non lucratif. Le modèle économique de PLOS est basé sur le payement – par l’auteur ou par l’organisme financeur de l’auteur – d’Article Processing Charge (APC).
  • PubMed Central est une base de données bibliographique contenant un important volume de publications (plus de 3 millions) intégralement en accès libre et principalement anglophone, en génie biomédical et en sciences de la vie. PubMed Central est développé par l’U.S. National Library of Medicine (NLM) pour servir d'archive aux articles biomédicaux. Chaque ouvrage inscrit dans sa base de données est associé à un identifiant : le PMC.
  • SocArXiv (en développement) une archive ouverte qui contiendra des prépublications et des publications en sciences sociales. Son développement, effectué par le Center for Open Science - un organisme américain privé à but non lucratif basé à Charlottesville, Virginia - a été annoncé en juillet 2016 par un communiqué de presse. Les chercheurs auront ainsi l’opportunité de mettre rapidement en libre accès les différentes versions de leurs articles. SocArXiv pourrait évoluer vers une plateforme de publication de revues électronique avec une évaluation des articles après leur dépôt (post peer-review).

Au Canada :

  • PhilPapers est une base de données bibliographique internationale pour les professionnels et étudiants en philosophie, développée par l’University of Western Ontario. La plateforme donne accès aux résumés des articles. En 2009, PhilPapers a reçu un financement important du Joint Information Systems Committee (JISC) du Royaume-Uni.
  • Érudit est un portail québécois de revues francophones en SHS. Le consortium interuniversitaire d’Érudit regroupe l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal sous la forme d’un organisme à but non lucratif. Les documents publiés depuis plus de deux ans sont en libre accès (principe de la barrière mobile), ce qui représente environ 85% du contenu.

Bases de données ouvertes sous condition définies par les entités gestionnaires publiques


  • BibCNRS est une plateformes documentaire du CNRS, développé par l’INIST, qui centralise dix portails thématiques : biologie, chimie, écologie et environnement, homme et société, ingénierie et systèmes, mathématiques, nucléaire et particules, physique, sciences de l’information, terre et univers. Son développement, actuellement au stade bêta, est effectué en open source.
    Si vous êtes membre d’une unité CNRS, vous pouvez accéder gratuitement au texte intégral d’articles de plusieurs milliers de revues scientifiques électroniques via les portails de l'INIST:
    BiblioSHS : Sciences humaines et sociales
    BiblioPlanets : Sciences de la Terre et de l’Univers
    BiblioVie : Sciences Biologiques
    BiblioST2i : Sciences et Technologies de l’Information et de l’Ingénierie
    TitaneSciences : Sciences Chimiques
    BiblioSciences : multidisciplinaire
    Archives des revues de l’Institute of Physics : Sciences Physiques
  • ISTEX (Initiative d’excellence de l’Information Scientifique et Technique) est un projet investissement d'avenir. L’objectif principal du projet est d’offrir à l’ensemble de la communauté de l’enseignement supérieur et de la recherche un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines en engageant une politique nationale d’acquisition massive de documentation : archives de revues, bases de données, corpus de textes, etc. ISTEX est géré par l’INIST-CNRS, la DIST-CNRS, l’ABES, le consortium Couperin et la CPU.
  • HATHITRUST est une bibliothèque numérique, créée en 2008, mettant en commun le contenu de plusieurs bibliothèques numériques d'universités des États-Unis, du Canada et d'Europe, ainsi que des ouvrages issus de Google Livres et d'Internet Archive. « Hathi » signifique « éléphant » en Hindi ; animal connu pour ses capacités de mémorisation.

Bases de données d’éditeurs


Ces bases de données sont accessibles par abonnement ou autre forme d’achat.
  • CAIRN fournit un accès numérique aux revues de quatre éditeurs francophones en sciences humaines et sociales (Belin, De Boeck, La Découverte et Erès). Seule une partie des ressources est en libre accès, notamment les plus anciennes.
  • Mendeley est un logiciel destiné à la gestion et au partage de travaux de recherche. Développé par l’entreprise Mendeley Ltd., et disponible depuis 2008, le logiciel a été acquis par l’éditeur Elsevier en 2013.
  • Web of Science (WoS) est un service anglophone d’information universitaire en ligne produit par la société ISI (Institute for Scientific Information) de l’éditeur Thomson Reuters. Web of Science contient plus de 10 000 périodiques, accessibles sur abonnement pour des universités et des centres de recherche via la plateforme ISI Web of Knowledge.
  • Scopus est une base de données bibliographique anglophone contenant des articles issus de revues scientifiques. Cela comprend environ 22 000 journaux provenant de plus de 5 000 éditeurs. Scopus appartient à l’éditeur Elsevier et est disponible en ligne après abonnement.

Catalogues de ressources « physiques » en libre accès


  • SUDOC est un catalogue collectif qui permet aux bibliothèques des universités françaises et d'autres établissements d'enseignement supérieur de recenser et d’indiquer la localisation des documents en leur possession. Le SUDOC est développé par l'Agence bibliographique de l'enseignement supérieur (ABES) et est accessible en ligne depuis 2000.
  • WorldCat (contraction de l’anglais World Catalog) est un catalogue en accès libre de bibliothèques publiques et privées. WorldCat a été créé en 1971 et est géré par une coopérative de bibliothèques OCLC (Online Computer Library Center) basée dans l’Ohio (Etats-Unis). Suite à un partenariat entre l'ABES et l'OCLC, les données contenues dans le SUDOC devraient être versées dans WorldCat.
  • COPAC est un service du JISC et de la Research Libraries UK (RLUK) qui permet d’effectuer des recherches dans un catalogue de plus de 70 bibliothèques anglaises et irlandaises, notamment en SHS.

Réseaux sociaux scientifiques


  • ResearchGATE est un réseau social pour chercheurs et scientifiques de toutes disciplines, accessible par inscription (gratuite). Le site contient un moteur de recherche permettant de chercher dans les ressources internes et dans des bases de données bibliographiques (PubMed, Citeseer, etc.). ResearchGATE est une société allemande régie par le droit allemand et européen (notamment via la directive 95/46/CE).
  • Academia.edu est un réseau social américain destiné aux chercheurs, accessible par inscription (gratuite). Academia.eu permet également la mise en ligne et l’accès à des articles scientifiques. Academia.edu est une entreprise à but lucratif.
  • Twitter est un réseau social américain généraliste mais largement utilisé par des chercheurs.

Moteurs de recherche


English keywords : recommendation engines for scientific litterature, litterature mining

Moteurs de recherche spécialisés dans les documents en libre accès


  • CORE est un moteur de recherche dont le développement est soutenu par le JISC et The Open University (Royaume-Uni). Ce service expérimental d’analyse sémantique permet de chercher des textes par similitudes parmi une base de 10 million d’articles en libre accès.

Les deux moteurs de recherche suivants sont présentés sur le site d'OpenEdition.
  • BASE est le moteur de recherche mis au point par l’université de Bielefeld en Allemagne. Il n’indexe que des documents en open access, provenant de milliers de sources ouvertes dans le monde, et couvre tous les champs disciplinaires. Son interface est disponible en français.
  • ISIDORE est une plateforme de recherche permettant l'accès à des documents numériques de sciences humaines et sociales (SHS). Ouverte à tous et en particulier aux enseignants, chercheurs, doctorants et étudiants, elle s'appuie sur les principes du web de données et donne accès à des données en accès libre (open access). ISIDORE est une réalisation de la très grande infrastructure de recherche Huma-Num (CCSD-CNRS, Aix-Marseille Université, Campus Condorcet). Un marché de réalisation a été confié à un consortium composé des sociétés Antidot, Sword et Mondéca.

Autres moteurs de recherche


  • Google Scholar est un moteur de recherche d'articles scientifiques lancé en 2004 qui inventorie des articles approuvés ou non par des comités de lecture, des thèses, des citations ou encore des livres scientifiques.
Plusieurs moteurs de recherche spécialisés dans les articles scientifiques ont fermé ou ne sont plus mis à jour. C’est le cas de Live Search Academic depuis 2008 et Microsoft Academic Search depuis 2014, tous deux développés par Microsoft ; ainsi que de Scirus depuis 2014, qui était développé par Elsevier.

Moteurs de recommandations de flux d’actualité scientifique


  • PubChase est un moteur de recommandation de littérature biomédicale, qui est connecté au logiciel de gestion bibliographique Mendeley. PubChase a recours aux modélisations statistiques et à la fouille de données afin de générer des recommandations personnalisées d’articles en fonction des articles précédemment sélectionné par l’internaute.
  • Meta Science (anciennement Sciencescape Inc.) est un site web de gestion de contenu qui recommande des articles scientifiques à l’utilisateur grâce aux algorithmes de Machine Learning. Meta Science est connecté au moteur de recherche de données bibliographiques PubMed dans le secteur de la biologie et de la médecine.
  • Sparrho est un moteur de recommandations qui fournit des flux d’actualité scientifique personnalités anglophone grâce à l’utilisation d’algorithmes d’apprentissage automatique (Machine Learning) qui sélectionnent les contenus pertinents. La recherche d’article peut se faire en incluant et/ou excluant des mots-clés, revues, auteurs. La startup, basée au Royaume-Uni, a été créée en juillet 2013.

Annuaires de la recherche


Annuaire généraliste


  • ScanR est le nouveau moteur de recherche du MENESR qui recense les orientations et les productions des structures de recherche françaises. Voir présentation par l’ADBU.
  • MERIL portal (Mapping the European Research Infrastructure Landscape) est une base de données qui inventorie les infrastructures de recherche en libre accès en Europe avec une dimension internationale, à travers tous les domaines de recherche.
  • RIs Observatory est un annuaire européen en libre accès, financé par la Commission européenne, recensant des infrastructures (ces données sont fournies par le portail MERIL), des projets (type FP7 et H2020), des organismes, des personnes, des documents et des outils de visualisation de ces réseaux.
  • Gateway to Resarch est un annuaire de projets et d'acteurs de l'IST au Royaume-Uni développé par le Research Councils UK (RCUK). Ce portail recense l'ensemble des subventions attribuées (toutes disciplines confondues) et leurs bénéficiaires depuis 2006 au Royaume-Uni.

Annuaire de journaux


  • DOAJ (Directory of open access journals) est un annuaire des journaux en libre accès qui permet d’effectuer des recherches dans les bases de donnée bibliographique de nombreux journaux et plateformes (Elsevier, OpenEdition, PLOS, Springer Nature, Taylor and Francis Group, etc.).
  • Mir@bel (Mutualisation d'informations sur les revues et leurs accès dans les bases en ligne) est un annuaire qui recense des éditeurs et des revues. La base de données contient principalement des revues francophones en SHS. Mir@bel a été créé par trois établissements d’enseignement supérieur français (Sciences Po Grenoble, Sciences Po Lyon et Ecole Normale Supérieure de Lyon) en 2012.

Annuaires de plateformes


  • OpenDOAR (Directory of Open Access Repositories) est un annuaire qui recense des plateformes en libre accès. OpenDOAR est développé par SHERPA (Securing a Hybrid Environment for Research Preservation and Access), basé au Royaume-Uni.
  • IBiSA (Infrastructures en Biologie Santé et Agronomie) contient un annuaire de plateformes issues de la recherche française en biologie, santé et agronomie, qui ont été sélectionnées suite à un appel d’offre. Ce site est géré par le groupement d'intérêt scientifique (GIS) IBiSA, créé en mai 2007.
  • re3data.org (Registry of Research data Repositories) est un annuaire anglophone de bases de données, de plateformes et de bibliothèques numériques (« repositories », en anglais), contenant plus de mille éléments. Les recherches peuvent être effectuées selon des critères de discipline, de pays et de type de contenu (données brutes, codes sources, données structurées, images, etc.).
  • Des réseaux IST en SHS sont présentés sur le site de l'Institut des sciences humaines et sociales (INSHS).

Annuaires de personnes


  • ANNUAIRES/CNRS est un page web présentant les annuaires du CNRS :
    -Annuaire des laboratoires et des personnels du CNRS ;
    -Annuaire de l'administration du CNRS ;
    -Annuaire du Comité national de la recherche scientifique ;
    -Labintel (annuaire avec accès réservé).
  • RENALISTE/CNRS est un annuaire des professionnels de l'IST travaillant dans des unités associées au CNRS.

Annuaires de financements


  • Fund.it est une plateforme d'internationalisation de la recherche en SHS, qui centralise des appels à candidatures pour séjours de recherche et des appels à projets pour financements (dont Horizon 2020). Fund.it est un projet conçu et développé par la fondation Réseau français des instituts d’études avancées (RFIEA) en partenariat avec la fondation Maison des sciences de l’Homme (FMSH) et avec le soutien du Centre national de la recherche scientifique (CNRS). Soutenu par le Labex RFIEA+, Fund.it bénéficie du soutien de l'Agence nationale de la recherche (ANR) via le programme Investissements d'Avenir.

Autres ressources


Thursday, February 23, 2017

List of Researcher Services (a paper in Journal of Library Administration 2016)



Author/Researcher Identification

—these services provide some necessary infrastructure that may be used in the other two categories, such as unique identifiers and name disambiguation

Academic and Professional Networking

—most succinctly described as “social networking for academics,” these services focus on connecting users based on research interest, affiliation, geography, or other variables.

Reference and Citation Management

—while these tools and services include some of the functionality and features of other categories, they are distinct given their primary focus on management of citations that a researcher compiles for use within a publication or for sharing with other researchers.


Reference 

http://dx.doi.org/10.1080/01930826.2016.1146534
http://www.tandfonline.com/doi/full/10.1080/01930826.2016.1146534


ResearchGate generate free DOI for unpublished work


What type of research can I generate a DOI for?

DOIs can be generated for most of your unpublished work. However, publications of type Article, Book, Chapter, Patent, Cover Page, Poster , Code and Conference Paper are considered to have been published elsewhere, and therefore DOIs cannot be generated for these publication types. You can also add an existing DOI issued by your publisher to any of your research.
Note: Once a ResearchGate DOI has been generated, the research cannot be edited. Instead, you should remove the research completely, re-upload it with the edits and then generate a new DOI.

How do I generate a DOI for my research?

If a publication you’ve already added to your profile doesn’t have a DOI and isn't one of those types mentioned above, you can generate one by following these steps:

  1. Go to your profile and click the Timeline tab
  2. Select the publication you would like to generate a DOI for by clicking on its title
  3. On the right-hand side, click on the blue arrow and select Generate a DOI (if this is not visible, then your publication is one one the types listed above; generating a DOI for these types is not possible)
  4. Review the details of your publication to ensure they are correct
  5. Click Generate a DOI.

To generate a DOI for unpublished work you haven't yet added to your profile you will first need to add the publication. Here's how:

  1. Go to your profile and click Add your publications
  2. Select the type of publication
  3. Click Select file
  4. Upload your file (required)
  5. Click Continue
  6. Verify your publication details and select Generate a DOI  (if this is not visible, then your publication is one one the types listed above; generating a DOI for these types is not possible)
  7. Click Finish to confirm your changes.

Your work will now be assigned a DOI, making it easy for researchers to find and cite it.

https://explore.researchgate.net/display/support/Generating+a+DOI

Monday, February 20, 2017

Zotero vers Bib2HAL vers HAL: import du bibLateX vers HAL par lot



Bib2hal vous permet de déposer un lot de publications dans HAL à partir d’un fichier BibTeX dans un portail de HAL.


Outils et services développés localement pour améliorer ou faciliter l'utilisation de HAL
https://wiki.ccsd.cnrs.fr/wikis/hal/index.php/Outils_et_services_d%C3%A9velopp%C3%A9s_localement_pour_am%C3%A9liorer_ou_faciliter_l'utilisation_de_HAL
https://hal.archives-ouvertes.fr/page/bibtex-exemple
https://hal.archives-ouvertes.fr/page/description-des-champs-bibtex

Depuis 2014, nous nous servons  de Zotero+Bib2Hal pour signaler en masse les publications 2008-2014 de l’Université de La Réunion. Ce billet vise à expliquer comment:
http://assessmentlibrarian.fr/?p=2079

Un excellent billet dans hypotheses.org de 2016
"Bib2HAL ou comment faciliter le dépôt dans HAL"
http://carnetist.hypotheses.org/494


Vous pouvez aussi voir:
http://stephane-mottin.blogspot.fr/2017/02/zotero-tei-xml-csl-json-biblatex-vers.html

Process

Le problème est de faire des fichiers bibLateX corrects pour bib2HAL.
  1. Partir de la référence du livre récupéré dans SUDOC via ZOTERO (ou endnote).
  2. Export en BibLatex
  3. modifier ce .bib en y changeant "livre" en "chapitre de livre pour le premier article/chapitre et les quelques champs à modifier.
  4. dans un tableur comme excel, on va générer la liste des bibTeX
    1. on coupe en 5 parties de bibTeX en ayant remplacé les tab-return par $$
      et les deux premiers sont par exemple:
      • @inbook{
      • materiaux18_2011,$$address = {Meudon,France},$$edition = {[3e éd.]},$$title = {
    2. cela permet de générer avec CONCATENER @inbook{imateriaux18_2011
      avec ie n° de l'article/chapitre
      puis le titre de l'article/chapitre...
    3. on ajoute aussi des metadonnées spécifiques à HAL
      • x-country= {France},
      • x-city={Meudon},
      • on change
        keywords      = {Hautes pressions -- Matériaux, Joints d'étanchéité, Matériaux -- Effets des hautes pressions},
        devient (virgule en ;)
        keywords      = {Hautes pressions -- Matériaux ; Joints d'étanchéité ; Matériaux -- Effets des hautes pressions},
    4.  "date" n'est pas OK pour HAL
      il faut  "Year"
    5. et ajout pour HAL:
      • x-audience = {international},
      • x-language = {fr},
      • x-domain = {phys;phys.cond; phys.meca.mema; phys.cond.cm-ms;spi.mat},
      • x-popularlevel = {Oui},
      • x-serieseditor={Mottin, Stéphane},
  5. fin de la modification du bibTeX

dépot

  1. tester son fichier bibteX via https://dev-bib2hal.inria.fr/
    ce qui permet de tester les affiliations, les métadonnées, les doublons
  2. puis le déposer via https://bib2hal.inria.fr/
L’outil accompagne l’utilisateur dans le dépôt à différents niveaux :
  • analyse du bibtex avec détection et indication des erreurs
  • recherche de doublons
  • proposition d’affiliations des auteurs à partir de celles existantes dans Hal
  • vérification des métadonnées (valeur, caractère obligatoire) et initialisation de certaines métadonnées manquantes avec des valeurs par défaut (x-audience, abstract...)
  • Ce service est accessible à partir de https://bib2hal.inria.fr
Une version "Bac à sable" accessible depuis https://dev-bib2hal.inria.fr permet de tester l’outil. Les dépôts se font dans un entrepot "Bac à sable" de HAL (https://halv3-preprod.archives-ouvertes.fr)

mettre votre collection ou non (alors mettre dépôt en mode "auto" pour votre collection).
La plus importante fonction de Bib2Hal est l’affiliation des auteurs. Cette étape aussi fastidieuse que primordiale consiste à attribuer à chaque auteur une affiliation à un ou plusieurs laboratoires de manière semi-automatique. Cette action déclenchera le tamponnage de la publi dans toutes les collections HAL concernées quelques jours après le dépôt.

domaines

Domaines pour tous les articles dans le cas où il n'y a pas de domaine par article (champ x-domain).
Pour avoir la liste des domaines, consultez le référentiel des domaines : 
qui renvoie un HAL-XML avec 400 references.

Format BibLateX avec modif/ajout pour bib2HAL

  • Attention : ne pas avoir 2 fois la même clé BibTeX
  • Le fichier BibTeX doit être en utf-8 sans BOM. BOM (pour « Byte Order Mark ») rajoute un caractère en début du fichier qui pose des problèmes. La plupart des éditeurs de texte indique dans l'encodage si c'est de l'utf8 avec ou sans BOM.
  • Les caractères LaTex sont acceptés (accents, caractères mathématiques, ...).
  • il faut 
    • year = {2011}
  • pages ={17-27};
  • le champs adresse doit contenir ville, pays comme 
    • address={Paris,France}
  • Le champ DOI doit être de la forme 10.xxx et non http://...
  • Bib2hal ne tient pas compte des @comment ou @string
  • Les champs multivalués (keywords, projets, ..) doivent être séparés par un point-virgule ;
    keywords={key1 ; key2}
  • en plus des champs standards, il faut ajouter des champs spécifiques à HAL Ces champ se nomment x-{MT} où {MT} est le nom de la métadonnée dans HAL. Par exemple il faut au moins
    • x-audience = {international},
    • x-popularlevel = {Oui},
    • x-language = {fr},
    • x-domain = {phys;phys.cond;spi.mat},

      d'autres sont facultatifs:
    • x-serieseditor={Mottin, Stéphane},
    • x-conferenceorganizer={Boissinot, Patrick and Langlois, Patrick and Pádua, Agílio},
    • x-country= {FR},
    • x-city={Meudon},
address : sous la forme {ville,pays} --> Bib2hal peut à partir de ce champ calculer automatiquement les champs x-country et x-city. 
France en iso est FR