Friday, March 10, 2023

HAL (Hyper Archives en ligne) and LINK to arXiv; pubmed, Zenodo, Software Heritage... OUTILS pour déposer en lots

 
         la galaxie HAL

Une des questions reste d'automatiser  par un procédé "workflow" du contenu (notice, articles...) vers diverses plateformes et de les relier.

La plateforme HAL est hélas peu connue à l'étranger:
Mais son déficit de notoriété est compensé par ses interconnexions avec les grandes archives ouvertes internationales et par les procédures de versement automatique. 

HAL propose un ensemble de services et d'outils aux chercheurs comme le transfert automatique des documents vers une archive ouverte internationale telle qu'ArXiv ou Pubmed Central lorsqu'ils appartiennent aux disciplines concernées, ce qui en augmente la visibilité internationale et l'impact.
Pour la physique, les mathématiques et l'informatique, le déposant peut choisir de déposer simultanément l'article sur arXiv.

Depuis le 25 septembre 2018, les dépôts de logiciels sur HAL sont connectés à Software Heritage


En outre j'avais publié de long posts sur les api de HAL et les liens avec Zotero :
voir aussi les liens générés pour la collection de livres (29 ouvrages) avec SUDOC, worldcat and google books:

HAL

article de Daniel Charnay

Il est très intéressant de lire en 2minutes cet article de 2019 qui traite de ces liens:
« Avec HAL, nous voulions créer un arXiv multidisciplinaire »
de Daniel Charnay qui en a été un des initiateurs:

article de Laurent Romary (liens avec INRIA)

L’un des défis principaux pour HAL, qui est devenu une plate-forme de référence pour de nombreuses institutions, qui comme le CNRS récemment, y ont adopté des politiques de dépôt systématique, est de continuer à offrir des services proches des chercheurs eux-mêmes et s’intégrer dans le cycle global de la publication scientifique. C’est dans cet esprit que nous soutenons le déploiement de la plate-forme de gestion d’épirevues Épisciences, qui permet l’évaluation par les pairs de preprints déposés au préalable dans HAL (ainsi que d’autres archives ouvertes telles qu’ArXiv).

Par ailleurs, HAL doit permettre de relier étroitement une publication avec les jeux de données ou les logiciels qui y sont associés. Nous avons ainsi contribué à la mise en œuvre d’un dépôt logiciel dans HAL référençant les sources archivées dans Software Heritage. Enfin, avec l’accroissement des contenus, HAL commence à devenir une alternative crédible aux grandes bases bibliométriques internationales (WoS, Scopus, etc.) pour suivre la production scientifique française et en analyser les points forts. Il faut pour cela penser la prochaine génération d’outils et d’interfaces qui permettront notamment à chaque chercheur, équipe ou institution d’obtenir des listes de publication pour une page web, ou encore d’analyser ses propres publications.
Reference (Date: 24 nov. 2021)

inria tools

Inria s’est aussi très tôt impliqué, en collaboration avec le CCSD, l’unité de service du CNRS qui développe HAL, dans la mise en œuvre d’outils facilitant notamment l’intégration groupée de documents (X2HAL) ou l’extraction automatique de métadonnées à partir des PDF sources (GROBID). Devenu entre-temps l’un des établissements partenaires du CCSD, Inria a montré le chemin d’une implication institutionnelle exemplaire dans le domaine de la science ouverte en instaurant une obligation de dépôt pour tous les chercheurs de ses équipes. À ce jour, plus de 85% des textes intégraux de l’institut INRIA sont ainsi disponibles sous HAL.
L'inria avait publié des outils pour favoriser ces liens et aider à faire des dépôts (2017):

liens vers HCERES

Début 2023, un outils a été créé pour exporter toutes une liste de publication notamment pour HCERES

Monday, March 6, 2023

Jupyter Notebook Service and python, colab de google ? alternatives?

 

Which Jupyter Notebook Service Should I Use?

We recommend starting off with Gradient’s free Community Notebooks feature. With free GPUs and CPUs, storage, uninterrupted service, an intuitive UI, ML project templates, and much more, it’s hard to imagine a use case where Gradient wouldn’t fit the bill.

Dive in with a free GPU-backed Jupyter notebook (free account, free everything), fork one of many ML project templates (and run it for free from your own account), or check out the FAQ.


Qu'est-ce que Colab ?

https://colab.research.google.com/

Colab (ou "Colaboratory") vous permet d'écrire et d'exécuter du code Python dans votre navigateur avec
  • Aucune configuration requise
  • Accès sans frais aux GPU
  • Partage facile
Que vous soyez étudiant, data scientist ou chercheur en IA, Colab peut vous simplifier la tâche. Regardez la présentation de Colab pour en savoir plus ou commencez tout de suite.

Les notebooks Colab vous permettent d'utiliser, dans un même document, du code exécutable, du texte enrichi, des images, du code HTML, du code LaTeX et bien plus. Lorsque vous créez des notebooks Colab, ils sont enregistrés dans votre compte Google Drive. Vous pouvez facilement les partager avec vos collaborateurs ou vos amis, qui peuvent alors y apporter des commentaires ou même les modifier. Pour en savoir plus, consultez la page Présentation de Colaboratory. Pour créer un notebook Colab, utilisez le menu "Fichier" ci-dessus ou le lien Créer un notebook Colab.

Les notebooks Colab sont des notebooks Jupyter hébergés par Colab. Pour en savoir plus sur le projet Jupyter, consultez le site Web jupyter.org.

Science des données

Colab vous permet de tirer pleinement parti des bibliothèques populaires Python pour analyser et visualiser des données. La cellule de code ci-dessous utilise numpy pour générer des données aléatoires et matplotlib pour les visualiser. Pour modifier le code, cliquez simplement sur la cellule.

Machine learning

Colab vous permet d'importer un ensemble de données d'images, d'entraîner un classificateur d'images sur cet ensemble et d'évaluer le modèle, tout cela avec quelques lignes de code. Les notebooks Colab exécutent ce code sur les serveurs cloud de Google. Vous avez donc à votre disposition toute la puissance du matériel Google, y compris les GPU et TPU, quelle que soit la puissance de votre ordinateur. Vous n'avez besoin que d'un navigateur.

Colab est très largement utilisé par la communauté du machine learning, par exemple dans les applications suivantes :
  • Premiers pas avec TensorFlow
  • Développement et entraînement de réseaux de neurones
  • Expérimentation avec les TPU
  • Dissémination de la recherche en IA
  • Création de tutoriels

exemple

Mask R-CNN Image Segmentation Demo
This Colab enables you to use a Mask R-CNN model that was trained on Cloud TPU to perform instance segmentation on a sample input image. The resulting predictions are overlayed on the sample image as boxes, instance masks, and labels. You can also experiment with your own images by editing the input image URL.

About Mask R-CNN
The Mask R-CNN model addresses one of the most difficult computer vision challenges: image segmentation. Image segmentation is the task of detecting and distinguishing multiple objects within a single image. In particular, Mask R-CNN performs "instance segmentation," which means that different instances of the same type of object in the input image, for example, car, should be assigned distinct labels.
COCO index mapping
ID_MAPPING = {
    1: 'person',
    2: 'bicycle',
    3: 'car',
    4: 'motorcycle',
    5: 'airplane',
    6: 'bus',
    7: 'train',
    8: 'truck',
    9: 'boat',
    10: 'traffic light',....