Showing posts with label hal. Show all posts
Showing posts with label hal. Show all posts

Friday, March 10, 2023

HAL (Hyper Archives en ligne) and LINK to arXiv; pubmed, Zenodo, Software Heritage... OUTILS pour déposer en lots

 
         la galaxie HAL

Une des questions reste d'automatiser  par un procédé "workflow" du contenu (notice, articles...) vers diverses plateformes et de les relier.

La plateforme HAL est hélas peu connue à l'étranger:
Mais son déficit de notoriété est compensé par ses interconnexions avec les grandes archives ouvertes internationales et par les procédures de versement automatique. 

HAL propose un ensemble de services et d'outils aux chercheurs comme le transfert automatique des documents vers une archive ouverte internationale telle qu'ArXiv ou Pubmed Central lorsqu'ils appartiennent aux disciplines concernées, ce qui en augmente la visibilité internationale et l'impact.
Pour la physique, les mathématiques et l'informatique, le déposant peut choisir de déposer simultanément l'article sur arXiv.

Depuis le 25 septembre 2018, les dépôts de logiciels sur HAL sont connectés à Software Heritage


En outre j'avais publié de long posts sur les api de HAL et les liens avec Zotero :
voir aussi les liens générés pour la collection de livres (29 ouvrages) avec SUDOC, worldcat and google books:

HAL

article de Daniel Charnay

Il est très intéressant de lire en 2minutes cet article de 2019 qui traite de ces liens:
« Avec HAL, nous voulions créer un arXiv multidisciplinaire »
de Daniel Charnay qui en a été un des initiateurs:

article de Laurent Romary (liens avec INRIA)

L’un des défis principaux pour HAL, qui est devenu une plate-forme de référence pour de nombreuses institutions, qui comme le CNRS récemment, y ont adopté des politiques de dépôt systématique, est de continuer à offrir des services proches des chercheurs eux-mêmes et s’intégrer dans le cycle global de la publication scientifique. C’est dans cet esprit que nous soutenons le déploiement de la plate-forme de gestion d’épirevues Épisciences, qui permet l’évaluation par les pairs de preprints déposés au préalable dans HAL (ainsi que d’autres archives ouvertes telles qu’ArXiv).

Par ailleurs, HAL doit permettre de relier étroitement une publication avec les jeux de données ou les logiciels qui y sont associés. Nous avons ainsi contribué à la mise en œuvre d’un dépôt logiciel dans HAL référençant les sources archivées dans Software Heritage. Enfin, avec l’accroissement des contenus, HAL commence à devenir une alternative crédible aux grandes bases bibliométriques internationales (WoS, Scopus, etc.) pour suivre la production scientifique française et en analyser les points forts. Il faut pour cela penser la prochaine génération d’outils et d’interfaces qui permettront notamment à chaque chercheur, équipe ou institution d’obtenir des listes de publication pour une page web, ou encore d’analyser ses propres publications.
Reference (Date: 24 nov. 2021)

inria tools

Inria s’est aussi très tôt impliqué, en collaboration avec le CCSD, l’unité de service du CNRS qui développe HAL, dans la mise en œuvre d’outils facilitant notamment l’intégration groupée de documents (X2HAL) ou l’extraction automatique de métadonnées à partir des PDF sources (GROBID). Devenu entre-temps l’un des établissements partenaires du CCSD, Inria a montré le chemin d’une implication institutionnelle exemplaire dans le domaine de la science ouverte en instaurant une obligation de dépôt pour tous les chercheurs de ses équipes. À ce jour, plus de 85% des textes intégraux de l’institut INRIA sont ainsi disponibles sous HAL.
L'inria avait publié des outils pour favoriser ces liens et aider à faire des dépôts (2017):

liens vers HCERES

Début 2023, un outils a été créé pour exporter toutes une liste de publication notamment pour HCERES

Tuesday, March 14, 2017

Altmetrics and free tools

If you click , you will get details:




In scholarly and scientific publishing, altmetrics are non-traditional metrics proposed as an alternative to more traditional citation impact metrics, such as impact factor and h-index.
https://en.wikipedia.org/wiki/Altmetrics

free tools

https://www.altmetric.com/products/free-tools/

Altmetric Bookmarklet

The Altmetric bookmarklet enables you to instantly see Altmetric data for any published research output with a DOI.

It’s quick, free and easy to install in just 3 simple steps.



The Bookmarklet only works on PubMed, arXiv or pages containing a DOI
It only supports publishers who embed Google Scholar friendly citation metadata on their pages by default, though we’re adding support for others. You can hurry along support for a particular journal by asking @altmetric for it on Twitter

Institutional Repository badges

We offer free embeddable badges for repositories within academic institutions. They can be installed with just a few lines of code, and you can choose the style of badge you’d like to display. Users will be able to click on the badge to view the full details page for each research output.

examples:
-> HAL
-> Zenodo

Explorer for Academic Librarians

We offer free individual access to the Altmetric Explorer for Publishers for academic librarians based within universities. This version of the Explorer can be used to browse and filter all of the research outputs in the Altmetric database, but does not include any institutional views, functionality or reporting. Please email us to request an account.
https://www.altmetric.com/products/explorer-for-publishers/

Real-time updates

Our attention data is collated and updated in real time – meaning you start to get feedback on your publications almost as soon as they’re made available online.

Email alerts

Set up daily, weekly or monthly email alerts to receive regular updates on the attention surrounding content you care about, delivered straight to your inbox.

Powerful search & filtering

Browse all articles in the database, or filter by specific journals, publishers, or time last mentioned. Enter unique identifiers (including DOIs, ISBNs, PubMed IDs, arXiv IDs and Handles) to track specific items. Alternatively, search for individual outputs using keywords.

Export data

All of the data in the Explorer can be exported via Excel or an API to be used in other internal reporting or dashboards.

Badges for Individual Researchers

Individual researchers can embed our badges for free too! It’s a great way to add context to your personal website or online CV, and can help demonstrate the reach of your work to visitors.

Once embedded you can click on the badge to view the full details page for each research output.
https://www.altmetric.com/about-our-data/altmetric-details-page/

Showcase the influence of your work
https://www.altmetric.com/products/free-tools/free-badges-for-researchers/

Step 1

Choose the badge style you want to display, and then grab the embed code from our site and add it to the html of your page.
http://api.altmetric.com/embeds.html

https://www.altmetric.com/products/altmetric-badges/

Step 2

Let us know you’ve done it (mailto support@altmetric.com)! This way we can unlock the details pages to make sure everyone can see all of the original mentions of your work (otherwise they’ll just see the first 4 most recent ones from each source).

Identify the most effective channels:
https://www.altmetric.com/audience/researchers/

API for research

http://api.altmetric.com/

We’re happy to provide free access to the Altmetric API for academic research purposes. Please see the API page for information about the different levels of API access we offer.

If you’d like to request a key or have any questions about how the API works and the data you’re gathering, please email us.

t's free to use this API to fetch basic alt-metrics information about articles & datasets and to use that information in your own apps and mashups - just give altmetric.com attribution somewhere.

However, if you'd like to download the data in bulk, perform more complex queries, remove the rate limits and see more detailed data about articles then you'll need a commercial license (if you'd like to let us know about your use case you can reach us at info@altmetric.com).

If you'd like to use the data in an academic research project then let us know and we can grant you a free license for non-commercial use.

Want to see some examples of what's possible? Check out our API gallery.
https://www.altmetric.com/products/altmetric-api/

Sources

https://help.altmetric.com/support/solutions/articles/6000060968-what-data-sources-does-altmetric-track-

The table below describes the process for collecting data, update frequency and any additional details across all of our sources.

Source nameCollection methodUpdate frequencyNotes
Twitter                                           Third party data provider APIReal-time feedDemographics, support for retweets, with monitoring of suspicious activity.
FacebookFacebook APIDailyPublic Facebook Pages and posts only, with prioritised popular Pages.
Policy documentsPDFs collected and scanned from policy sources and repositoriesDailyScanning and text-mining policy document PDFs for references, which are looked up in CrossRef/PubMed and resolved to DOIs.
NewsRSS feeds and APIReal-time feedManually curated news sources, with data provided via a third-party provider and RSS feeds direct.
BlogsRSS feedsDailyManually curated list, harvesting links to scholarly content.
MendeleyMendeley APIDailyReader counts is number of readers with the output in their Library. Not included in score.
ScopusScopus APIReal-time feedCitation counts from peer-reviewed literature. Not included in score.
Post-publication peer reviewsPubPeer and Publons APIsDailyPeer review comments collected from item records and associated by unique identifier.
RedditReddit APIDailyIncludes all sub-reddits. Original posts only, no comments. 
WikipediaWikipedia APIReal-time feedMentions of scholarly outputs collected from References section. English Wikipedia only.
Q&A (Stack Overflow)Stack Overflow APIDailyScan for links to scholarly outputs.
F1000 ReviewsF1000 APIDailyScan for links to scholarly outputs.
Google+Google+ APIDailyPublic posts only.
YouTubeYouTube APIDailyScan for links to scholarly outputs in video comments.
 Open Syllabus Static Import from Open SyllabusQuarterly Link syllabi's contents to HLOM IDs. 

altmetrics blog

Monday, March 13, 2017

dissemin impactstory web service déposer sur des archives ouvertes Zenodo HAL



Dissemin est à comparer à https://impactstory.org/
qui lui ne propose que de relier vos références (qu'il trouve) à des liens URL (No free fulltext anywhere? Consider uploading this work to an open repository like Zenodo or Figshare.)
Dissemin vous aide à trouver et à uploader.
Dissemin http://dissem.in/

C'est un web service encourageant les chercheurs à diffuser leurs publications librement.
Dissemin propose une plateforme web qui récolte des métadonnées à partir de différentes sources et qui détermine la disponibilité du texte intégral des publications des chercheurs. Il a été conçu pour encourager l'usage des dépôts (plutôt que les pages personnelles).

Les chercheurs ont souvent le droit de mettre leurs articles en accès libre sur le Web, pour compléter la version payante proposée par les éditeurs traditionnels. Pourtant, tous ne le font pas.

À cause de cela, les bibliothèques doivent payer à prix d'or des abonnements électroniques aux journaux de recherche, ce qui grève leurs finances et limite leur offre.

C'est déjà bien de mettre vos articles en ligne sur votre page Web, mais ce n'est pas suffisant ! De telles copies sont moins pérennes et plus difficiles à trouver que celles qui sont déposées dans des dépôts bien indexés.

Dissemin cherche des copies de vos articles dans une grande collection de dépôts ouverts en ligne, et vous indique ceux qu'il n'a pas pu trouver de cette façon.

Il propose aussi le service de chercher les références dans wikipedia et de les lier à des documents open access dans des archives ouvertes.

Quand nous l'avons trouvé dans l'un des dépôts que nous parcourons. La liste de ces dépôts est à voir ci-dessous.

Sources primaires


  • CrossRef.org
  • BASE (Bielefeld Academic Search Engine); grâce au moteur de recherche BASE, nous avons accès à plus de 80 millions de ref.
  • SHERPA/RoMEO
  • Zotero

Sources secondaires

Moissonnées avec le protocole OAI-PMH.

  • arXiv
  • HAL
  • PubMed Central
  • OpenAIRE
  • DOAJ
  • Persée
  • Cairn.info
  • Numdam

http://dissem.in/sources

Quelques personnes ont créé une associations 'CAPSH' qui gère certains aspects de dissemin:
CAPSH (Committee for the Accessibility of Publications in Sciences and Humanities) is a French nonprofit association promoting the open access to academic publications. It is in charge of the Dissemin project.

Liste des présentation à des congrès conf:

https://association.dissem.in/index.html.fr

process

On se connecte avec son ORCID id à
http://dissem.in/

Il trouve les fichiers et les classe suivant l'accord avec l'éditeur.
Puis il permet de faire de l'upload vers ZENODO (avec peu de metadata)
(et aussi vers HAL voir ci-dessous).

Le site a aussi une fonction "profile" qui liste vos file et vos dépôt (upload).

FAQ


Documentation

Les dépôts

Quel dépôt utiliser ?
Il y a en gros trois types de dépôts :
Les dépôts thématiques, qui se limitent à certains domaines précis, comme arXiv.
Les dépôts institutionnels, dédiés à l'archivage de la production scientifique d'une institution ou d'un pays.
Les dépôts académiques génériques comme Zenodo, dont le périmètre n'est limité qu'aux données issues de la recherche.
Si votre communauté scientifique préfère un dépôt thématique particulier, il vaut mieux l'utiliser afin d'améliorer votre visibilité. Dans le cas contraire, les dépôts institutionnels ou génériques sont également une option raisonnable.

ZENODO HAL 

Pourquoi ne puis-je pas déposer dans mon dépôt favori pour l'instant ?

Pour l'instant, nous vous proposons seulement de déposer vos articles dans les dépôts suivants :
  • Zenodo, un dépôt innovant soutenu par l'UE.
  • HAL, un dépôt français géré par le CCSD
Pour proposer davantage de dépôts, il faut que nous écrivions du code spécifique à chaque dépôt, mais il faut surtout que ces dépôts nous donnent l'autorisation de déposer des papiers en masse. Nous avons envisagé d'intégrer les dépôts suivants :
arXiv, un dépôt généraliste bien connu. Pour l'instant, arXiv n'autorise pas Dissemin à déposer en utilisant leur API SWORD, et demande aux utilisateurs de déposer dans arXiv manuellement. Si vous voudriez utiliser Dissemin pour déposer vos articles dans arXiv, n'hésitez pas à les contacter.

CCSD HAL

Il permet à chaque chercheur de mesurer l’accessibilité de ses publications et de mettre en ligne en quelques clics celles qui ne sont pas déjà librement disponibles. Plus besoin de saisir manuellement les métadonnées (titre, auteurs ou identifiants variés) : celles-ci sont automatiquement renseignées par Dissemin.
Cette fonctionnalité est rendue possible par l’exploitation de deux sources de données : le Bielefeld Academic Search Engine (BASE) et Crossref, qui couvrent presque 100 millions de publications.

Jusqu’à présent, les documents ainsi rendus librement accessibles étaient hébergés par Zenodo, un dépôt appartenant au CERN. Les chercheurs de toutes disciplines souhaitant déposer dans HAL peuvent désormais aussi utiliser Dissemin comme canal de dépôt depuis début 2017.

Dissemin utilise l’import SWORD pour déposer les publications. Celles-ci suivent le parcours classique de vérification avant d’être mises en ligne.  Les dépôts effectués par Dissemin seront rattachés au compte utilisateur de l’auteur dans HAL à partir de l’identifiant ORCID. Pour cela il faudra juste que l’auteur ait associé son compte HAL avec son ORCID.
Cette réalisation est le fruit d’un partenariat entre le Consortium Couperin, le CCSD, et le CAPSH, qui développe Dissemin.
https://www.ccsd.cnrs.fr/2017/03/deposer-dans-hal-avec-dissemin/

GitHub

Le code source est sur GitHub
python
https://github.com/dissemin/dissemin

Puis-je récolter vos données ?

Oui ! Nous avons même une API. Si vous n'êtes pas satisfait par ce qu'elle propose, n'hésitez pas à nous contacter.
http://dev.dissem.in/#api

Wednesday, March 8, 2017

ZENODO Feature request: bibliometrics, statistics of page views and downloads. Datacite statistics.



Zenodo is very useful and the new release adds a lot of improved functionality. One feature I think is still missing are download statistics for each deposit. The altmetrics integration is nice, but I suspect a lot more people download an item than blog or tweet about it. So download statistics would provide very welcome, more fine-grained information and it wouldn't even take an external provider to collect the data. The French repository HAL does this very nicely (even distinguishing between page views and downloads). I personally would prefer those statistics to be public, but if this raises concerns, maybe an opt-out / opt-in solution is necessary.
In order to enhance Zenodo and monitor traffic,
non-personal information such as IP addresses
and cookies may be tracked and retained, and log files may be shared
https://zenodo.org/policies

Datacite

datacite statistics are only for DATA centers
Try this example:
https://search.datacite.org/ui?q=*&fq=has_metadata%3Atrue&fq=is_active%3Atrue&fq=prefix%3A%2210.5281%22&

GitHub

https://github.com/zenodo/zenodo/issues/915

Thursday, March 2, 2017

OpenAIRE et HAL



OpenAIRE (Open Access Infrastructure for Research in Europe) est une infrastructure européenne dont l’objectif est de diffuser en accès ouvert les publications et les données scientifiques des recherches financées sur fonds européens. Elle vise ainsi à soutenir les politiques en faveur du libre accès : le programme Horizon 2020 comporte notamment l’obligation d’assurer le libre accès aux publications issues des recherches qu’il aura contribué à financer.

OpenAIRE agrège les données en moissonnant des réservoirs de données comme HAL : ces sources sont listées sous l’appellation data providers (OpenAIRE en recense 798).

Ainsi, toutes les publications avec texte intégral que vous avez déposées dans HAL, HAL-SHS ou le portail HAL de votre institution, sont-elles visibles sur cette plate-forme. Et ce, même si elles ne sont pas associées à un financement européen.

Comment trouver vos publications ?
Pour faire une recherche sur votre nom d’auteur, cliquez sur l’onglet « Search » en sélectionnant « Publications, data, project » et saisir votre requête.

https://www.ccsd.cnrs.fr/fr/2016/12/openaire-affiche-toutes-vos-publications-deposees-dans-hal/
billet de dec 2016

La visibilité de HAL est augmentée avec ce moissonnage par l’infrastructure européenne, ce qui permet une diffusion de vos publications auprès de partenaires potentiels dans le cadre de projets de recherche européens.

traitements analytiques aux archives ouvertes et aux bases de publications: GROBID structuration automatique de documents PDF




GROBID = structuration automatique de documents

Pour tester ce service

http://cloud.science-miner.com/grobid/

Les problèmes

Difficulté d’exploitation du format PDF / pauvreté et incohérence des metadonnées
➡ PDF : format pas adapté à la fouille de textes, les structures élémentaires sont absentes
➡ les techniques modernes d’exploitation de corpus nécessitent des pleins textes et des métadonnées de très bonne qualité
➡ ~91% des pleins textes d’ISTEX disponibles qu’en PDF
➡ XML éditeurs natifs très hétérogènes et souvent incomplets

But

Offrir une infrastructure logicielle open source et libre permettant des traitements analytiques de corpus scientifiques qui seraient autrement impossibles
Exemples :
➡ besoins des références bibliographiques et des affiliations pour appliquer des techniques bibliométriques
➡ liens avec des bases de références (CrossRef, brevets, etc.)
➡ pleins textes structurés pour la fouille de textes Automatisation via apprentissage automatique
Un sous-domaine de recherche du text-mining très riche


Exploration et analyse des sources IST pour la recherche et ses environnements - PDF de 23/05/2015
https://www.cnrs.fr/dist/z-outils/documents/Data4IST/Grobid_Inria.pdf
https://grobid.readthedocs.io/en/latest/grobid-04-2015.pdf

https://grobid.readthedocs.io/en/latest/

https://wiki.tei-c.org/index.php/GROBID

code

https://github.com/kermitt2/grobid

Friday, February 24, 2017

DIST CNRS et Unités rattachées INIST, CCSD et Persée. PLATEFORMES DE PARTAGE D'INFORMATION SCIENTIFIQUE ET TECHNIQUE



http://www.cnrs.fr/dist/presentation.htm

Unités rattachées

INIST 

- Institut de l'information scientifique et technique
L’Institut de l'information scientifique et technique du CNRS (INIST-CNRS) facilite l’accès aux résultats issus des différents champs de la recherche mondiale.
Deux sites d'informations sur l'IST :
     - LaLIST : La veille pour vos informations scientifiques, techniques et stratégiques
     - OpenAccess.Inist : Libre accès à l’information scientifique et technique

CCSD 

- Centre pour la communication scientifique directe
Le Centre pour la communication scientifique directe (CCSD - UMS 3668) est une unité mixte de service du CNRS, créée fin 2000 et principalement dédiée à la réalisation d’archives ouvertes.
Le CCSD a créé, développe et administre l’archive ouverte HAL, la plateforme de gestion de colloques SciencesConf.org et celle de gestion d’épi-revues Episciences.org.

Persée 

- Portail de revues en sciences humaines et sociales
Les missions de l’UMS Persée sont la valorisation numérique des ressources scientifiques, la recherche et l’innovation en matière d’outils et de méthodologies pour développer des corpus numériques et la diffusion de compétences et d’expertise dans ces domaines

PLATEFORMES DE PARTAGE D'INFORMATION SCIENTIFIQUE ET TECHNIQUE

Différentes plateformes (bibliothèques numériques, bases de données, archives ouvertes, moteurs de recherche, etc.) utilisées pour le partage des résultats de la recherche. Les plateformes sont recensées et catégorisées afin de mettre en valeur les initiatives en faveur de la mutualisation des connaissances et du libre accès à la production scientifique.


Bases de données en libre accès


En France :

  • HAL(Hyper articles en ligne) est une archive ouverte pluridisciplinaire destinée au dépôt et à la diffusion d'articles scientifiques (publiés ou non) et de thèses. Les thèses sont disponibles dans TEL (thèses en ligne). L’acquisition des données se fait par auto-archivage. La diffusion d’HAL est sous la responsabilité du CCSD (Centre pour la communication scientifique directe), une unité mixte de services du CNRS (DIST), de l’INRIA et de l’Université de Lyon.
  • Gallica permet d’accéder librement à de nombreux documents numérisés (livres, revues, photos, enluminures, etc.) de la Bibliothèque nationale de France (BNF). La base de données couvre toutes les disciplines, mais particulièrement les sciences humaines et sociales.
  • Huma-Num est une rès grande infrastructure de recherche (TGIR) en SHS. Elle est portée par l'Unité Mixte de Services 3598 associant le CNRS, l'Université d'Aix-Marseille et le Campus Condorcet. Huma-Num propose un ensemble de services, notamment via les plateformes NAKALA et ISIDORE :
    NAKALA permet à des équipes de recherche, qui en font la demande, de déposer leurs données numériques (fichiers texte, son, image, vidéo) dans un entrepôt sécurisé qui assure à la fois l'accessibilité aux données et leur citabilité dans le temps. Les technologies mises en oeuvre permettent notamment de rendre interopérables les métadonnées, c'est-à-dire la possibilité de pouvoir les connecter à d'autres entrepôts existants, et de les rendre moissonnables par des services spécialisés comme ISIDORE.fournit un Handle (pas DOI)
    Un identifiant unique est associé à chaque donnée et permet ainsi de citer les données indépendamment de leur localisation réelle : la technologie proposée est basée sur l’attribution d’identifiants de type handle, qui possèdent un mécanisme d’adressage générique, sans lien avec l’institution qui porte le service. C’est ce qui rend pérenne l’accès à la donnée, même en cas de changement ou d’évolution de l’institution qui porte le service.
    ISIDORE est une plateforme de recherche permettant l'accès à des documents numériques en libre accès de sciences humaines et sociales (SHS).
  • OpenEdition (contenant : Revues.org, Hypothèses.org, Calenda, etc.) est un portail de publication en SHS créé par le Centre pour l'édition électronique ouverte (Cléo). La majorité des articles sont en « open access freemium », tandis que d’autre sont en « open access simple » et « accès exclusif ». OpenEdition est financé par le CNRS, l'EHESS, l'Université d'Aix-Marseille, l'Université d'Avignon, la Fondation Calouste Gulbenkian et Google.
  • Pascal et Francis est une base de données bibliographique en libre accès en sciences exactes (Pascal) et en sciences humaines et sociales (Francis). Pascal et Francis étaient deux bases de données distinctes, accessibles par abonnement, développées par l’INIST-CNRS entre 1972 et 2015. En juillet 2016, l’INIST-CNRS annonce la mise en libre accès des deux bases de données, qui sont fusionnées, offrant ainsi un accès gratuit et sans inscription à plus de 14 millions de références bibliographiques.
  • Persée est un portail de revues en sciences humaines et sociales (SHS) dont les documents sont acquis grâce à une numérisation rétrospective de revues françaises. Le texte intégral est accessible en mode image ainsi qu’en mode texte (OCR). Persée est géré par l’UMS Persée, l’Université de Lyon, l’ENS Lyon et le Ministère de l'Éducation nationale, de l'Enseignement supérieur et de la Recherche (MENESR).

En Europe :

  • Europeana / Europeana Collections est un catalogue en libre accès, spécialisé en musique, art et histoire. Ce catalogue permet de rechercher des ressources numériques (livres, matériel audiovisuel, photographies, documents d'archives, etc.) issus des bibliothèques nationales des Etats membres de l’Union européenne. Le site, lancé en novembre 2008, est actuellement (juillet 2016) en phase de test. Europeana Collections est géré par une fondation (Europeana Foundation) et est co-financée par l’Union européenne.
  • The European Library est un portail de recherche qui permet d’accéder à des ressources (livres, affiches, enregistrements sonores, vidéo, etc.) des bibliothèques nationales d’Europe. L’accès aux documents peut-être gratuit ou payant selon la politique de chaque bibliothèque nationale. Le développement de ce portail européen est effectué par un consortium réunissant une trentaine de bibliothèques nationales européennes. Les données brutes sont accessibles via l’API « The European Library Open Search API ».
  • INSPIRE HEP (High-Energy Physics Literature Database) est une base de données bibliographiques en libre accès, au niveau européen, dans le domaine de la physique des hautes énergies, gérée par le CERN.
  • Econstor est une base de données bibliographique, spécialisée en économie et commerce. Le contenu d’Econstor – c’est-à-dire de la littérature scientifique en libre accès – est également accessible via certains portails et moteurs de recherche. Cette plateforme est développée par la Bibliothèque nationale allemande d'économie (ZBW).
  • Paperscape est un outil de visualisation des données contenues dans ArXiv, créé par Damien George et Rob Knegjens.
  • Zenodo est un entrepôt de données (bases de données, images, publications, video/audio, etc.) qui permet aux chercheurs de déposer des ensembles de données et de les lier à des publications scientifiques. Il est issu du projet européen OpenAIREplus, développé par le CERN et lié aux projets pilotes de la Commission européenne en matière de gestion de données. Zenodo affecte des DATACITE DOIs aux objets et expose les métadonnées de description au moissonnage à travers le protocole OAI-PMH, le protocole d’interopérabilité des archives ouvertes (Prodinra, HAL…).

Aux Etats-Unis :

  • ArXiv est une archive ouverte internationale de prépublications électroniques d'articles scientifiques dans les domaines de la physique, l'astrophysique, des mathématiques, de l'informatique, des sciences non linéaires et de la biologie quantitative. ArXiv est accessible gratuitement. Cette plateforme est gérée par Cornell University Library. En février 2012, le total des dépôts s'élevait à plus de 700 000 publications.
  • bioRxiv est une archive ouverte de prépublications d’articles scientifiques en sciences du vivant, lancée fin 2013 par le Cold Spring Harbor Laboratory (CSHL), un organisme américain privé à but non lucratif effectuant des recherches en médecine et biologie. Sur le modèle d’ArXiv, mais dans les domaines des sciences de la vie, ce réservoir n’accueille que des prépublications. Le dépôt des prépublications et leur accès sont gratuits. L’objectif est de de réduire le délai entre la rédaction de l’article et sa mise à disposition. Ces prépublications ont une URL pérenne et sont indexées par les moteurs de recherche.
  • CiteSeerX est « un moteur de recherche et une librairie numérique pour les articles scientifiques et académiques avec une attention portée sur l'informatique. Il est développé par des chercheurs de l'université d'État de Pennsylvanie. Il utilise un index de citation qui permet de rechercher par citation et d'ordonner les documents par l'impact des citations.» (Wikipedia).
  • D-PLACE, qui signifique « Database of Places, Language, Culture, and Environment », est une base de données - non bibliographique - sur les lieux, langues, cultures et environnements, développée par la National Evolutionary Synthesis Center (Etats-Unis) et la Max Planck Institute for the Science of Human History (Allemagne). Les informations ethnographiques sont regroupées en « sociétés », chacune étant liée à une position géographique et à une langue. D-PLACE permet aux internautes de visualiser les informations sous forme de tableau, de carte ou d’arbre linguistique.
  • JSTOR (contraction de Journal Storage) est une base de données bibliographique généraliste ainsi qu’un système d'archivage en ligne de publications académiques. L’accès à JSTOR dépend des inscriptions de chaque établissement. JSTOR est une société américaine à but non lucratif basée à New York.
  • Public Library of Science (PLOS) est une plateforme spécialisée en biologie et médecine permettant un libre accès à des publications scientifiques anglophones. La plateforme PLOS est gérée une société américaine à but non lucratif. Le modèle économique de PLOS est basé sur le payement – par l’auteur ou par l’organisme financeur de l’auteur – d’Article Processing Charge (APC).
  • PubMed Central est une base de données bibliographique contenant un important volume de publications (plus de 3 millions) intégralement en accès libre et principalement anglophone, en génie biomédical et en sciences de la vie. PubMed Central est développé par l’U.S. National Library of Medicine (NLM) pour servir d'archive aux articles biomédicaux. Chaque ouvrage inscrit dans sa base de données est associé à un identifiant : le PMC.
  • SocArXiv (en développement) une archive ouverte qui contiendra des prépublications et des publications en sciences sociales. Son développement, effectué par le Center for Open Science - un organisme américain privé à but non lucratif basé à Charlottesville, Virginia - a été annoncé en juillet 2016 par un communiqué de presse. Les chercheurs auront ainsi l’opportunité de mettre rapidement en libre accès les différentes versions de leurs articles. SocArXiv pourrait évoluer vers une plateforme de publication de revues électronique avec une évaluation des articles après leur dépôt (post peer-review).

Au Canada :

  • PhilPapers est une base de données bibliographique internationale pour les professionnels et étudiants en philosophie, développée par l’University of Western Ontario. La plateforme donne accès aux résumés des articles. En 2009, PhilPapers a reçu un financement important du Joint Information Systems Committee (JISC) du Royaume-Uni.
  • Érudit est un portail québécois de revues francophones en SHS. Le consortium interuniversitaire d’Érudit regroupe l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal sous la forme d’un organisme à but non lucratif. Les documents publiés depuis plus de deux ans sont en libre accès (principe de la barrière mobile), ce qui représente environ 85% du contenu.

Bases de données ouvertes sous condition définies par les entités gestionnaires publiques


  • BibCNRS est une plateformes documentaire du CNRS, développé par l’INIST, qui centralise dix portails thématiques : biologie, chimie, écologie et environnement, homme et société, ingénierie et systèmes, mathématiques, nucléaire et particules, physique, sciences de l’information, terre et univers. Son développement, actuellement au stade bêta, est effectué en open source.
    Si vous êtes membre d’une unité CNRS, vous pouvez accéder gratuitement au texte intégral d’articles de plusieurs milliers de revues scientifiques électroniques via les portails de l'INIST:
    BiblioSHS : Sciences humaines et sociales
    BiblioPlanets : Sciences de la Terre et de l’Univers
    BiblioVie : Sciences Biologiques
    BiblioST2i : Sciences et Technologies de l’Information et de l’Ingénierie
    TitaneSciences : Sciences Chimiques
    BiblioSciences : multidisciplinaire
    Archives des revues de l’Institute of Physics : Sciences Physiques
  • ISTEX (Initiative d’excellence de l’Information Scientifique et Technique) est un projet investissement d'avenir. L’objectif principal du projet est d’offrir à l’ensemble de la communauté de l’enseignement supérieur et de la recherche un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines en engageant une politique nationale d’acquisition massive de documentation : archives de revues, bases de données, corpus de textes, etc. ISTEX est géré par l’INIST-CNRS, la DIST-CNRS, l’ABES, le consortium Couperin et la CPU.
  • HATHITRUST est une bibliothèque numérique, créée en 2008, mettant en commun le contenu de plusieurs bibliothèques numériques d'universités des États-Unis, du Canada et d'Europe, ainsi que des ouvrages issus de Google Livres et d'Internet Archive. « Hathi » signifique « éléphant » en Hindi ; animal connu pour ses capacités de mémorisation.

Bases de données d’éditeurs


Ces bases de données sont accessibles par abonnement ou autre forme d’achat.
  • CAIRN fournit un accès numérique aux revues de quatre éditeurs francophones en sciences humaines et sociales (Belin, De Boeck, La Découverte et Erès). Seule une partie des ressources est en libre accès, notamment les plus anciennes.
  • Mendeley est un logiciel destiné à la gestion et au partage de travaux de recherche. Développé par l’entreprise Mendeley Ltd., et disponible depuis 2008, le logiciel a été acquis par l’éditeur Elsevier en 2013.
  • Web of Science (WoS) est un service anglophone d’information universitaire en ligne produit par la société ISI (Institute for Scientific Information) de l’éditeur Thomson Reuters. Web of Science contient plus de 10 000 périodiques, accessibles sur abonnement pour des universités et des centres de recherche via la plateforme ISI Web of Knowledge.
  • Scopus est une base de données bibliographique anglophone contenant des articles issus de revues scientifiques. Cela comprend environ 22 000 journaux provenant de plus de 5 000 éditeurs. Scopus appartient à l’éditeur Elsevier et est disponible en ligne après abonnement.

Catalogues de ressources « physiques » en libre accès


  • SUDOC est un catalogue collectif qui permet aux bibliothèques des universités françaises et d'autres établissements d'enseignement supérieur de recenser et d’indiquer la localisation des documents en leur possession. Le SUDOC est développé par l'Agence bibliographique de l'enseignement supérieur (ABES) et est accessible en ligne depuis 2000.
  • WorldCat (contraction de l’anglais World Catalog) est un catalogue en accès libre de bibliothèques publiques et privées. WorldCat a été créé en 1971 et est géré par une coopérative de bibliothèques OCLC (Online Computer Library Center) basée dans l’Ohio (Etats-Unis). Suite à un partenariat entre l'ABES et l'OCLC, les données contenues dans le SUDOC devraient être versées dans WorldCat.
  • COPAC est un service du JISC et de la Research Libraries UK (RLUK) qui permet d’effectuer des recherches dans un catalogue de plus de 70 bibliothèques anglaises et irlandaises, notamment en SHS.

Réseaux sociaux scientifiques


  • ResearchGATE est un réseau social pour chercheurs et scientifiques de toutes disciplines, accessible par inscription (gratuite). Le site contient un moteur de recherche permettant de chercher dans les ressources internes et dans des bases de données bibliographiques (PubMed, Citeseer, etc.). ResearchGATE est une société allemande régie par le droit allemand et européen (notamment via la directive 95/46/CE).
  • Academia.edu est un réseau social américain destiné aux chercheurs, accessible par inscription (gratuite). Academia.eu permet également la mise en ligne et l’accès à des articles scientifiques. Academia.edu est une entreprise à but lucratif.
  • Twitter est un réseau social américain généraliste mais largement utilisé par des chercheurs.

Moteurs de recherche


English keywords : recommendation engines for scientific litterature, litterature mining

Moteurs de recherche spécialisés dans les documents en libre accès


  • CORE est un moteur de recherche dont le développement est soutenu par le JISC et The Open University (Royaume-Uni). Ce service expérimental d’analyse sémantique permet de chercher des textes par similitudes parmi une base de 10 million d’articles en libre accès.

Les deux moteurs de recherche suivants sont présentés sur le site d'OpenEdition.
  • BASE est le moteur de recherche mis au point par l’université de Bielefeld en Allemagne. Il n’indexe que des documents en open access, provenant de milliers de sources ouvertes dans le monde, et couvre tous les champs disciplinaires. Son interface est disponible en français.
  • ISIDORE est une plateforme de recherche permettant l'accès à des documents numériques de sciences humaines et sociales (SHS). Ouverte à tous et en particulier aux enseignants, chercheurs, doctorants et étudiants, elle s'appuie sur les principes du web de données et donne accès à des données en accès libre (open access). ISIDORE est une réalisation de la très grande infrastructure de recherche Huma-Num (CCSD-CNRS, Aix-Marseille Université, Campus Condorcet). Un marché de réalisation a été confié à un consortium composé des sociétés Antidot, Sword et Mondéca.

Autres moteurs de recherche


  • Google Scholar est un moteur de recherche d'articles scientifiques lancé en 2004 qui inventorie des articles approuvés ou non par des comités de lecture, des thèses, des citations ou encore des livres scientifiques.
Plusieurs moteurs de recherche spécialisés dans les articles scientifiques ont fermé ou ne sont plus mis à jour. C’est le cas de Live Search Academic depuis 2008 et Microsoft Academic Search depuis 2014, tous deux développés par Microsoft ; ainsi que de Scirus depuis 2014, qui était développé par Elsevier.

Moteurs de recommandations de flux d’actualité scientifique


  • PubChase est un moteur de recommandation de littérature biomédicale, qui est connecté au logiciel de gestion bibliographique Mendeley. PubChase a recours aux modélisations statistiques et à la fouille de données afin de générer des recommandations personnalisées d’articles en fonction des articles précédemment sélectionné par l’internaute.
  • Meta Science (anciennement Sciencescape Inc.) est un site web de gestion de contenu qui recommande des articles scientifiques à l’utilisateur grâce aux algorithmes de Machine Learning. Meta Science est connecté au moteur de recherche de données bibliographiques PubMed dans le secteur de la biologie et de la médecine.
  • Sparrho est un moteur de recommandations qui fournit des flux d’actualité scientifique personnalités anglophone grâce à l’utilisation d’algorithmes d’apprentissage automatique (Machine Learning) qui sélectionnent les contenus pertinents. La recherche d’article peut se faire en incluant et/ou excluant des mots-clés, revues, auteurs. La startup, basée au Royaume-Uni, a été créée en juillet 2013.

Annuaires de la recherche


Annuaire généraliste


  • ScanR est le nouveau moteur de recherche du MENESR qui recense les orientations et les productions des structures de recherche françaises. Voir présentation par l’ADBU.
  • MERIL portal (Mapping the European Research Infrastructure Landscape) est une base de données qui inventorie les infrastructures de recherche en libre accès en Europe avec une dimension internationale, à travers tous les domaines de recherche.
  • RIs Observatory est un annuaire européen en libre accès, financé par la Commission européenne, recensant des infrastructures (ces données sont fournies par le portail MERIL), des projets (type FP7 et H2020), des organismes, des personnes, des documents et des outils de visualisation de ces réseaux.
  • Gateway to Resarch est un annuaire de projets et d'acteurs de l'IST au Royaume-Uni développé par le Research Councils UK (RCUK). Ce portail recense l'ensemble des subventions attribuées (toutes disciplines confondues) et leurs bénéficiaires depuis 2006 au Royaume-Uni.

Annuaire de journaux


  • DOAJ (Directory of open access journals) est un annuaire des journaux en libre accès qui permet d’effectuer des recherches dans les bases de donnée bibliographique de nombreux journaux et plateformes (Elsevier, OpenEdition, PLOS, Springer Nature, Taylor and Francis Group, etc.).
  • Mir@bel (Mutualisation d'informations sur les revues et leurs accès dans les bases en ligne) est un annuaire qui recense des éditeurs et des revues. La base de données contient principalement des revues francophones en SHS. Mir@bel a été créé par trois établissements d’enseignement supérieur français (Sciences Po Grenoble, Sciences Po Lyon et Ecole Normale Supérieure de Lyon) en 2012.

Annuaires de plateformes


  • OpenDOAR (Directory of Open Access Repositories) est un annuaire qui recense des plateformes en libre accès. OpenDOAR est développé par SHERPA (Securing a Hybrid Environment for Research Preservation and Access), basé au Royaume-Uni.
  • IBiSA (Infrastructures en Biologie Santé et Agronomie) contient un annuaire de plateformes issues de la recherche française en biologie, santé et agronomie, qui ont été sélectionnées suite à un appel d’offre. Ce site est géré par le groupement d'intérêt scientifique (GIS) IBiSA, créé en mai 2007.
  • re3data.org (Registry of Research data Repositories) est un annuaire anglophone de bases de données, de plateformes et de bibliothèques numériques (« repositories », en anglais), contenant plus de mille éléments. Les recherches peuvent être effectuées selon des critères de discipline, de pays et de type de contenu (données brutes, codes sources, données structurées, images, etc.).
  • Des réseaux IST en SHS sont présentés sur le site de l'Institut des sciences humaines et sociales (INSHS).

Annuaires de personnes


  • ANNUAIRES/CNRS est un page web présentant les annuaires du CNRS :
    -Annuaire des laboratoires et des personnels du CNRS ;
    -Annuaire de l'administration du CNRS ;
    -Annuaire du Comité national de la recherche scientifique ;
    -Labintel (annuaire avec accès réservé).
  • RENALISTE/CNRS est un annuaire des professionnels de l'IST travaillant dans des unités associées au CNRS.

Annuaires de financements


  • Fund.it est une plateforme d'internationalisation de la recherche en SHS, qui centralise des appels à candidatures pour séjours de recherche et des appels à projets pour financements (dont Horizon 2020). Fund.it est un projet conçu et développé par la fondation Réseau français des instituts d’études avancées (RFIEA) en partenariat avec la fondation Maison des sciences de l’Homme (FMSH) et avec le soutien du Centre national de la recherche scientifique (CNRS). Soutenu par le Labex RFIEA+, Fund.it bénéficie du soutien de l'Agence nationale de la recherche (ANR) via le programme Investissements d'Avenir.

Autres ressources