Wednesday, February 15, 2017

jabref.org reference manager, BibTeX (MODS) and XMP (export/import)

intro

JabRef is an open source bibliography reference manager. The native file format used by JabRef is BibTeX, the standard LaTeX bibliography format. JabRef runs on the Java VM (version 1.8 or newer), and works equally well on Windows, Linux, and Mac OS X.

http://www.jabref.org/

BibTeX is an application and a bibliography file format written by Oren Patashnik and Leslie Lamport for the LaTeX document preparation system. General information can be found on the CTAN BibTeX package information page. JabRef also supports BibLaTeX.

Bibliographies generated by LaTeX and BibTeX from a BibTeX file can be formatted to suit any reference list specifications through the use of different BibTeX and BibLaTeX style files.

Entries can be searched in external databases and BibTeX entries can be fetched from there. Example sources: arXiv, CiteseerX, Google Scholar, Medline, GVK, IEEEXplore, and Springer.

Import of various formats

RIS, Medline/Pubmed (xml), Refer/Endnote, INSPEC, BibTeXML, CSA, ISI Web of Science, SilverPlatter, Scifinder, OVID, Biblioscape, Sixpack, JStor, and RIS.

Moreover, the FireFox add-on JabFox makes importing new bibliographic information directly from the browser very easy.

export formats

Built-in and custom export formats

HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, and OpenOffice.org as well as LibreOffice

Integrates to your environment

Launch external applications: PDF viewers, web browser
Insert citations into TeXstudio, LyX, Kile, LatexEditor, Emacs, Vim, and WinEdt

Support for XMP Metadata in PDFs

Improve the workflow of sharing PDFs and bibliography information

http://help.jabref.org/fr/XMP
Pour utiliser la fonction XMP dans JabRef, vous pouvez faire les choses suivantes :
  • Importer un unique fichier PDF annoté contenant les métadonnées XMP. Vous pouvez sélectionner “Fichier -> Importer dans… -> PDF avec annotations XMP” ou faire glisser le fichier dans la fenêtre principale.
  • Ecrire les informations bibliographiques dans le fichier PDF associé. Pour cela, double-cliquez sur l’entrée dans la fenêtre principale, allez dans l’onglet “General” et cliquer sur “Ecrire XMP”.
  • Si vous voulez annoter tous les PDFs dans une base de données déterminée vous pouvez sélectionner “Outils -> Ecrire XMP pour la base de données”
  • Pour vérifier si cela a fonctionné, vous pouvez ouvrir le PDF dans Adobe Acrobat et sélectionner “Fichier -> Propriétés du Document -> Métadonnées additionnelles -> Avancé”. Dans l’arborescence sur la droite vous devriez voir une entrée nommée “http://purl.org/net/bibteXMP”. Cela fonctionne uniquement avec Adobe Acrobat, et pas avec Adobe Reader. 
Si vous n’avez pas Adobe Acrobat, vous pouvez utiliser pdfinfo à la place afin de voir les métadonnées XMP. pdfinfo fait partie de Xpdf (www.foolabs.com/xpdf) et Poppler (http://poppler.freedesktop.org). https://www.fosshub.com/PDFsam.html ; https://poppler.freedesktop.org/

Format de fichier BibteXmp

XMP utilise un sous-ensemble du Schéma de Description des Ressources (Resource Description Framework - RDF) pour stocker les données. Pour JabRef, un nouveau format de métadonnées est utilisé ; il ressemble beaucoup au format BibTeX. Fondamentalement, tous les champs et valeurs sont transformés en noeuds dans un document XML. Seuls les auteurs et les éditeurs sont stockés comme des rdf:Seq-structures, aussi les utilisateurs des données peuvent éviter la séparation basées sur des ‘and’. Toutes les chaînes et les références croisées seront présentes dans les données.

Le schéma suivant, facile et minimal, est utilisé :
  • La clef BibTeX est stockée comme une bibtexkey.
  • Le type d’entrée BibTeX est stocké comme une entrytype.
  • les champs author et editor sont encodés comme des rdf:Seqs où les auteurs individuels sont représentés par des rdf:lis.
  • Tous les autres champs sont sauvés en utilisant directement le nom de leur champ.

Ci-dessous, un exemple de mise en correspondance
@INPROCEEDINGS{CroAnnHow05,
  author = {Crowston, K. and Annabi, H. and Howison, J. and Masango, C.},
  title = {Effective work practices for floss development: A model and propositions},
  booktitle = {Hawaii International Conference On System Sciences (HICSS)},
  year = {2005},
  owner = {oezbek},
  timestamp = {2006.05.29},
  url = {http://james.howison.name/publications}
}
sera transformé en
<rdf:Description xmlns:bibtex="http://jabref.sourceforge.net/bibteXMP/"
    bibtex:bibtexkey="CroAnnHow05"
    bibtex:year="2005"
    bibtex:title="Effective work practices for floss development: A model and propositions"
    bibtex:owner="oezbek"
    bibtex:url="http://james.howison.name/publications"
    bibtex:booktitle="Hawaii International Conference On System Sciences (HICSS)"
    bibtex:timestamp="2006.05.29">
        <bibtex:author>
            <rdf:Seq>
                <rdf:li>K. Crowston</rdf:li>
                <rdf:li>H. Annabi</rdf:li>
                <rdf:li>J. Howison</rdf:li>
                <rdf:li>C. Masango</rdf:li>
            </rdf:Seq>
        </bibtex:author>
    <bibtex:entrytype>Inproceedings</bibtex:entrytype>
</rdf:Description>
Faites attention aux pièges suivants si vous essayez de traiter les métadonnées bibtexXMP :

Selon RDF, les couples attribut-valeur peuvent aussi être exprimés comme des noeuds, et vice-versa.

voir aussi
http://stephane-mottin.blogspot.fr/2017/02/save-metadata-xmp-to-pdf-files-from.html

Liens

Quelques liens (en anglais) à propos de XMP et de l’annotation des PDFs :

XML.com article about XMP
https://www.xml.com/pub/a/2004/09/22/xmp.html
PDFBox by the Apache Software Foundation is the Jaba library used to access the PDFs and the metadata stream.
http://pdfbox.apache.org/
Good thread on ArsTechnica discussing the management of PDFs.
http://arstechnica.com/civis/viewtopic.php?f=19&t=408429
Adobe XMP Specification
http://www.adobe.com/content/dam/Adobe/en/devnet/xmp/pdfs/XMPSpecificationPart1.pdf

No comments:

Post a Comment