Showing posts with label latex. Show all posts
Showing posts with label latex. Show all posts

Friday, July 21, 2017

install MacTeX june 2017, TeX LaTeX AMSTeX TeXShop BibDesk LaTeXiT TeXLive --> 5.8 Gb



MacTeX-2017
June, 2017
For Yosemite (macOS 10.10) and Higher

This installer provides all the software needed to use the TeX typesetting system on Mac OS X. All of the software is fully configured and ready to use. Included are

  • the actual TeX program, and the XeTeX extended version with Unicode and native font support;
  • macro packages, such as LaTeX, AMSTeX, and ConTeXt
  • TeXShop, graphical user interface for TeX
  • Ghostscript, required by certain TeX utilities

A custom install option is available for users who only need some of the software provided.

If you are new to TeX, consult the README installed in /Applications/TeX to begin learning and using TeX.
---

This installer provides all the software needed to use the TeX typesetting system on Mac OS X. All of the software is fully configured and ready to use. Included are
  • the actual TeX program, and the XeTeX extended version with Unicode and native font support;
  • macro packages, such as LaTeX, AMSTeX, and ConTeXt
  • TeXShop, a graphical user interface for TeX
  • Ghostscript, a free postscript interpreter used by certain TeX utilities
  • BibDesk, an editor for BibTeX databases
  • LaTeXiT, a utility to typeset LaTeX equations and export the resulting PDF by drag and drop
  • TeX Live Utility, a utility to administer TeX Live and update packages in it over the network
  • cocoAspell, an extension of Apple's built-in spell checker which understands LaTeX
  •  Excalibur, a spell checker for TeX source code

The underlying TeXLive distribution is extensive, containing most binaries, fonts, styles, and packages used in the TeX community. It is a repackaging of the full TeX Live distribution from the TeX Users Group (TUG), and installs that distribution exactly as it would appear if installed from the TeX Live DVD.

A custom install option is provided for users who want only part of the package. The package contains Ghostscript; users who already have Ghostscript may want to use custom install to avoid the version provided here. 

Among the programs installed by the package is TeXShop, a graphical interface to the TeX typesetting tools. TeXShop will be in your Applications folder in a subfolder named TeX and you can drag its icon to the dock if you wish. The TeX folder contains a README file explaining technical details of TeX Live for experienced users, and explaining how to start using and learning TeX for beginners.

Some programs in TeX need to know whether you are using letter-size paper or A4-size paper. The installer tries to guess the answer from your printer's default paper setting. This will work in almost all cases. If you run into problems, run TeX Live Utility in /Applications/TeX and select "Change Paper Size..." in the Actions menu. 

The installer adds BibDesk, Excalibur, LaTeXiT to the TeX folder in your Applications folder. All are standard Mac programs which can be uninstalled by just dragging them to the trash.

The TeX typesetting system consists of several command line programs and a large number of supporting files. These tools are installed in /usr/local, a directory not visible in the Finder. Inside the system Library folder you will find a subfolder named TeX; the Root file inside this folder is a link to the TeX directory tree which makes it visible to the Finder. So you can examine the files if you are curious.  It is usually not necessary to look at the command line files because they are automatically accessed by TeX as needed. 

If you have used TeX on another system, you may have needed to modify $TEXINPUTS, $PATH, and other shell variables; these are handled automatically on Mac OS X. Occasionally you will want to add additional style files and the like to TeX; to do so, create the directory "texmf" inside your personal Library folder in your home directory, and put additional files in subdirectories of this folder. For instance, LaTeX will find any file in

~/Library/texmf/tex/latex

or a subdirectory of this folder.


For more information about TeX, see http://tug.org, in particular http://tug.org/begin.html for links to a number of introductory resources. For more information about this MacTeX distribution, see http://tug.org/mactex.

Ref

http://www.tug.org/mactex/mactex-download.html

Thursday, July 20, 2017

HUB text/PAO une syntaxe pour différentes cibles input et output (backends, targets ou writers), de manière à obtenir du HTML du LaTeX, page de man: pandoc


hexadécimal

Au départ si on a que du texte sans mise en forme, on peut écrire en hexadécimal comme dans ma jeunesse des années 70 (en ASCII ou étendue pour les caractères français par exemple). Il suffisait de connaitre par coeur la table ASCII de 128 correspondances qui est une norme informatique de codage de caractères des années 60. Et tout cela avec un clavier de 0-9 et A-F soit 16 touches (même pas une touche carriage return  car c'est le code #D ni même une touche espace car c'est #20)!
http://ascii.cl/
Et pour l'histoire:
https://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange

C'était clair, il y avait celui qui tapait ses idées au kilomètre puis celui qui mettait en forme.

que du text mis en forme (et un peu de "PAO") et comparaison des softs

Si on a que text (par exemple ASCII ou UTF-8) c'est assez simple.
Avec du balisage léger et des transcodeurs, on a du Hub-text.
voir une liste partielle des output formats:
https://en.wikipedia.org/wiki/Lightweight_markup_language

https://en.wikipedia.org/wiki/Comparison_of_document_markup_languages

https://en.wikipedia.org/wiki/Comparison_of_documentation_generators
(and  programming languages).
example: ROBODoc is a documentation tool similar to Javadoc and licensed under the GPL. It is used to extract API documentation from source code. It can be used with any language that supports comments and works by extracting specially formatted headers. These are then reformatted into HTML, DocBook, TROFF, ASCII, LaTeX, PDF, or RTF.
It can be used to document any programming artifact, such as: classes, functions, tests, makefile entries, etc.
ROBODoc works with C, C++, Fortran, Perl, shell scripts, Assembler, DCL, DB/C, Tcl/Tk, Forth, Lisp, COBOL, Occam, Basic, HTML, Clarion, and any other language that supports comments.
https://en.wikipedia.org/wiki/ROBODoc


Une analyse que je partage

Comparaison des langages de balisage (markup) léger (lightweight) : Txt2tags, Pandoc, Docutils, AsciiDoc, Deplate, Stx2any, AFT, Markdown et Textile:
http://fgallaire.flext.net/comparaison-langage-balisage-markup-lightweight-leger-txt2tags-pandoc-docutils-asciidoc-deplate-stx2any-aft-markdown-textile/

La bureautique est la principale utilisation de l’informatique depuis sa création. Pourtant, les outils majoritairement utilisés dans ce domaine, les logiciels de traitement de texte WYSIWYG comme LibreOffice ou MS word, laissent la majorité des informaticiens et des ergonomes totalement désespérés.
Ces logiciels ont en effet un nombre de défauts très important : ils font se concentrer sur la forme et non sur le fond, leur résultat final ne correspond souvent pas à ce qui est affiché, ils sont incompatibles entre eux, ce sont d’énormes usines à gaz, ils ne fonctionnent qu’en mode graphique, etc.

Il a donc fallu penser à une manière de donner ces instructions de mise en forme au sein du fichier texte lui-même, et c’est ainsi que sont apparus les langages de balisage (markup), dont les plus connus sont HTML (inventé en 1991 par Tim Berners-Lee) et LaTeX (créé en 1985, et basé sur TeX, inventé par le grand Donald Knuth en 1977), et dont la première grande figure fut Roff, un programme Unix historique développé à partir de 1961, et dont la version GNU, Groff, est installée par défaut sur toutes les distributions GNU/Linux, puisqu’on l’utilise encore pour les pages de man des logiciels.

Ces langages représentent une nette amélioration, mais ont tous un gros problème : ils sont gênants ! On ne retrouve plus aussi facilement son contenu au milieu de toutes ces balises supplémentaires, sans parler du fait que les syntaxes complexes ouvrent la voie à de nombreuses erreurs de compilation.

C’est en 1995 que l’on trouva la solution de ce problème, avec la création du premier langage Wiki, dont le but principal était de permettre l’édition facile de pages web par tout un chacun, et dont l’utilisateur actuel le plus célèbre est l’encyclopédie libre Wikipédia. S’il y a presque autant de syntaxes différentes que de logiciels Wiki, elles ont toutes la caractéristique d’utiliser des caractères textuels simples et intuitifs pour donner les indications de formatage du texte.
http://www.wikicreole.org/wiki/Reasoning

https://www.mediawiki.org/wiki/Help:Formatting
https://fr.wikipedia.org/wiki/Aide:Syntaxe_(wikicode)
https://fr.wikipedia.org/wiki/Aide:Ins%C3%A9rer_un_tableau_(wikicode,_avanc%C3%A9)
https://fr.wikipedia.org/wiki/Mod%C3%A8le:BUtilisateur
https://www.mediawiki.org/wiki/MediaWiki/fr

J'ai toujours aimé le principe du "folding editor".
le premier fut STET  'STructured Editing Tool' de 1977
https://en.wikipedia.org/wiki/STET_(text_editor)
A folding editor is a text editor which supports text folding or code folding, a mechanism allowing the user to hide and reveal blocks of text—usually named. Typically this is done to allow the user to better picture the overall structure of a document or program.
Folding is provided by many modern text editors, and syntax-based or semantics-based folding is now a component of many software development environments...
https://en.wikipedia.org/wiki/Folding_editor


Mais pourquoi limiter ces langages de balisage léger à la seule génération de HTML ? Pourquoi ne pas utiliser la même syntaxe pour différentes cibles (appelées backends, targets ou writers selon les logiciels), de manière à obtenir aussi bien une page web en HTML, qu’un document en LaTeX pour l’impression, ou qu’une page de man pour un logiciel ? Ce sont les logiciels qui poursuivent ce but qui m’intéressent, ils constituent pour moi l’avenir de la bureautique informatique, et j’ai été amené à les comparer pour en choisir un dans lequel m’investir comme développeur.

Trois d’entre eux, Docutils, Deplate et Pandoc, ont un design évolué, avec une machine à états finis pour laquelle on peut écrire de nouveaux readers et writers de manière parfaitement propre. Cependant, malgré leurs grandes qualités, Deplate est un projet trop confidentiel (ainsi il n’est incompréhensiblement pas présent parmi les pourtant si nombreux paquets Debian), et je ne me sentais pas à la hauteur pour m’investir dans un projet comme Pandoc, totalement écrit en Haskell, qui est un langage de programmation complexe que j’aimerais beaucoup utiliser.
Je détaillerai Pandoc ci-dessous.

Txt2tags

J’ai rajouté dans ce comparatif Markdown et Textile, puisqu’ils ont chacun une implémentation en Python, mais ne générant que du HTML, ils ne m’intéressaient pas vraiment. AsciiDoc et Txt2tags ont un peu la même architecture, avec un gros fichier principal faisant tout le travail, que l’on peut configurer, respectivement avec un fichier .conf et deux dictionnaires Python (un pour les Tags et l’autre pour les Rules), pour créer de nouvelles cibles. AsciiDoc et Txt2tags sont donc plus aisés à prendre en main et à modifier rapidement que Docutils, qui est une très belle et très bien architecturée machine à états objet, mais aussi plus difficile à appréhender.
De plus, comme je désapprouvais totalement la politique de licence domaine publique de Docutils, il ne me restait plus qu’à faire mon choix entre Txt2tags et AsciiDoc. C’est principalement l’orientation très DocBook (un format ne m’intéressant personnellement pas du tout) d’AsciiDoc, et d’autres détails, comme la localisation en de nombreuses langues de Txt2tags et sa plus grande simplicité, qui m’ont finalement fait choisir Txt2tags.

Ce choix est confirmé par une étude plus avancée des différentes syntaxes. Ainsi alors que la syntaxe reST de Docutils ne dispose que de :

*italique* et **gras**

Txt2tags est beaucoup plus riche :

//italique// **gras** __souligné__ et --barré--

Le codage visuel est bien meilleur, et le compréhension instantanée avec la syntaxe de Txt2tags, puisque les slashs donnent l’impression penchée de l’italique, les étoiles imitent la surcharge du gras, les underscores donnent l’impression de soulignement, et les moins apparaissent comme une barre. De plus, l’utilisation généralisée des caractères de balisage en doubles, permet de lever à peu de frais un maximum d’ambiguïtés syntaxiques.

insertion d'une image est beaucoup plus simple Txt2tags
[[picture.png] http://fgallaire.flext.net]

Leur implémentation en Python permet à Txt2tags, reST (par Docutils) et AsciiDoc d’être utilisables à la fois comme logiciels de bureautique multiplateforme (Linux, Mac OS X, Windows et *BSD) et pour le web côté serveur. Depuis 2012, une implémentation de txt2tags en PHP est disponible, développée par Petko Yotov (le mainteneur et principal développeur de PmWiki) et sponsorisée par Eric Forgeot. Grâce aux nombreux efforts de ce dernier, il existe maintenant plusieurs implémentations de la syntaxe Txt2tags en JavaScript, avec une démo parfaitement fonctionnelle des possibilités de rendu côté client en temps réel. Et Matthew Pickering a quant à lui écrit un reader Txt2tags pour Pandoc.
En face, Markdown est représenté par une armada d’implémentations dans tous les langages utilisés sur le web côté serveur, et aussi en JavaScript côté client pour des prévisualisations efficaces sans Ajax, mais seul Pandoc, qui n’est pas si facile à compiler sur toutes les plateformes, propose autre chose qu’un rendu en HTML.
Je vais bien sûr continuer à travailler sur le logiciel Txt2tags, mais une implémentation de la syntaxe Txt2tags dans un parser Docutils, pour toucher directement toute la communauté des développeurs Python qui documentent leurs projets, et pouvoir bénéficier ensuite du sublime Sphinx, est un projet qui me motive de plus en plus.
Enfin, je suis toujours un peu nostalgique devant ce screenshot, parce que c’est en le voyant, avec en haut à gauche le fichier avec les balises, et en bas à droite celui avec le résultat texte brut, que j’ai pris conscience que Txt2tags faisait bien ce que j’espérais, et que comme en plus il était en Python, ce serait probablement le logiciel auquel j’allais contribuer !

Pandoc

Pandoc is a command-line tool. There is no graphic user interface. 
Pandoc is a Haskell library for converting from one markup format to another, and a command-line tool that uses this library. It can read MarkdownCommonMarkPHP Markdown ExtraGitHub-Flavored MarkdownMultiMarkdown, and (subsets of) TextilereStructuredTextHTMLLaTeXMediaWiki markupTWiki markupHaddock markupOPMLEmacs Org modeDocBookMusetxt2tagsVimwikiEPUBODT, and Word docx; and it can write plain text, MarkdownCommonMarkPHP Markdown ExtraGitHub-Flavored MarkdownMultiMarkdownreStructuredTextXHTMLHTML5LaTeX (including beamer slide shows), ConTeXtRTFOPMLDocBookOpenDocumentODTWord docxGNU TexinfoMediaWiki markupDokuWiki markupZimWiki markupHaddock markupEPUB (v2 or v3), FictionBook2Textilegroff man, [groff ms], Emacs Org modeAsciiDocInDesign ICMLTEI SimpleMuse and SlidySlideousDZSlidesreveal.js or S5 HTML slide shows. It can also produce PDF output on systems where LaTeX, ConTeXt, pdfroff, or wkhtmltopdf is installed.
Pandoc's enhanced version of Markdown includes syntax for footnotestables, flexible ordered listsdefinition listsfenced code blockssuperscripts and subscriptsstrikeoutmetadata blocks, automatic tables of contents, embedded LaTeX mathcitations, and [Markdown inside HTML block elements][Extension: markdown_in_html_blocks]. (These enhancements, described further under Pandoc's Markdown, can be disabled using the markdown_strict input or output format.)
In contrast to most existing tools for converting Markdown to HTML, which use regex substitutions, pandoc has a modular design: it consists of a set of readers, which parse text in a given format and produce a native representation of the document, and a set of writers, which convert this native representation into a target format. Thus, adding an input or output format requires only adding a reader or writer.
Because pandoc's intermediate representation of a document is less expressive than many of the formats it converts between, one should not expect perfect conversions between every format and every other. Pandoc attempts to preserve the structural elements of a document, but not formatting details such as margin size. And some document elements, such as complex tables, may not fit into pandoc's simple document model. While conversions from pandoc's Markdown to all formats aspire to be perfect, conversions from formats more expressive than pandoc's Markdown can be expected to be lossy.
This document is for people who are unfamiliar with command line tools. Command-line experts can go straight to the User’s Guide or the pandoc man page:

Modules 

In contrast to most existing tools for converting Markdown to HTML, pandoc has a modular design: it consists of a set of readers, which parse text in a given format and produce a native representation of the document, and a set of writers, which convert this native representation into a target format. Thus, adding an input or output format requires only adding a reader or writer.

Ref.

Pandoc’s enhanced version of Markdown 

Pandoc’s enhanced version of Markdown includes syntax for footnotes, tables, flexible ordered lists, definition lists, fenced code blocks, superscripts and subscripts, strikeout, metadata blocks, automatic tables of contents, embedded LaTeX math, citations, and Markdown inside HTML block elements. (These enhancements, described further under Pandoc’s Markdown, can be disabled using the markdown_strict input or output format.)

Tricks

you have a long markdown file in GitHub and want to have a TOC, you can use 
pandoc -t markdown_github --toc -o example-with-toc.md example.md

Using Markdown Templates

Math in Pure Markdown


Wednesday, July 19, 2017

ajlsm et maîtrise technologique de la plate forme Cyberdocs, orientée vers la production, l'archivage et la diffusion électroniques des documents scientifiques


cyberthèse/cyberdocs  lyon2

Hélas cela date de plus de 10ans pour cyberthèse/cyberdocs avec abandon.
https://sourcesup.renater.fr/cybertheses/ --> 404
https://sourcesup.renater.fr/projects/cyberdocs/
date de 2009 sans MAJ.
https://sourcesup.renater.fr/scm/?group_id=28
https://sourcesup.renater.fr/scm/viewvc.php/trunk/?root=cyberdocs
https://github.com/fabdsp

mais:
http://www.univ-lyon2.fr/bibliotheques/theses-en-ligne-452917.kjsp?RH=WWW309PUB
est opérationnel.
L'université Lyon 2 archive et diffuse en format numérique les thèses soutenues. Cette politique qui est mise en œuvre de manière systématique depuis 2000, permet l'archivage et la diffusion sur internet de plus de 1600 thèses.

De plus Pleade est toujours actif.

De Latex vers un archivage pérenne et une diffusion électronique ouverte

LaTeX est un logiciel de composition de documents ou plus exactement une collection de macro commandes destinées à faciliter l'utilisation du processeur de TeX. Il est particulièrement utilisé dans les domaines techniques et scientifiques pour la production de documents de taille moyenne ou importante. Les qualités de mise en forme des documents, notamment mathématiques, et leur impression ne sont plus à démontrer.
Mais à l'heure où la publication scientifique électronique est en voie de banalisation, il est extrêmement difficile de convertir un document natif LaTeX vers le format XML qui est devenu le standard de fait des documents électroniques. XML permet, entre autres, de garantir un archivage pérenne et grâce à son environnement une accessibilité la plus large possible en intégrant et en supportant des normes annexes en matière de codage des caractères (Unicode) ou de transcription des formules mathématiques avec MathMl.
La conversion des documents LaTeX vers XML est un sujet délicat à plus d'un titre. Une tradition ancienne chez les utilisateurs de LaTeX veut qu'en dehors de leur outil préféré, point de salut. Une réaction nouvelle de la part des éditeurs scientifiques universitaires ou commerciaux met en avant l'obligation de l'accessibilité et de l'ouverture dans le respect des normes et des standards qui facilitent la communication scientifique ouverte.
Dans le secteur de la publication électronique des thèses, cette discussion n'a pas débouché sur des solutions satisfaisantes. Cyberdocs diffuse les thèses « LaTeX » au format « pdf » ce qui est insatisfaisant. Mais le groupe qui animait le programme Cyberthèses représentait plutôt les sciences humaines et sociales : nous n'avions donc pas de légitimité disciplinaire. Mais au hasard de rencontres et de débats, nous avons croisé la route d'un éditeur scientifique qui était confronté au même problème : comment convertir au format XML, nécessaire pour un archivage pérenne et une diffusion électronique ouverte, des documents scientifiques composés avec LaTeX pour être imprimés ?
Ce programme a réuni autour de la conversion des documents scientifiques écrits en LaTeX vers XML, l'équipe EDP Sciences (éditeur scientifique) qui a fait de l'édition scientifique électronique ouverte un de ses objectifs prioritaires, le groupe Cyberthèses, avec la société AJLSM qui porte la maîtrise technologique de la plate forme Cyberdocs, orientée vers la production, l'archivage et la diffusion électroniques des documents scientifiques et des membres de la communauté scientifique utilisateurs de LaTeX. Ce sont les résultats obtenus que nous vous présentons.
La réalisation d'un objet logiciel, un convertisseur, repose sur l'étude et l'analyse des modèles de documents scientifiques et des pratiques qui en découlent. L'objet « thèse » a été considéré comme un exemple particulier d'un problème plus général concernant tous les types de documents et notamment les articles de revues. L'intégration dans la plate forme Cyberdocs sera possible grâce à un convertisseur qui amènera les documents vers le format TEILite utilisé par Cyberdocs.
Mais ce convertisseur sera également adapté aux autres types de documents : articles, revues, ouvrages, rapports scientifiques ou techniques en étant compatible avec les principales DTD existantes : Journal Publishing, TEI Lite, Docbook. L'évolution de cet outil est ouverte aux contributions de l'ensemble de la communauté, c'est pour cela qu'il sera distribué sous une licence libre.
Ce programme a reçu le soutien financier de la DIST du CNRS et de la D.G.R.I. du ministère de l'enseignement supérieur et de la recherche.

Ref

http://theses.univ-lyon2.fr/files/presentation-28.pdf

plate-forme Cyberdocs

La plate-forme Cyberdocs permet de structurer des documents issus de traitements de texte et de les publier sur Internet, à l'aide de la norme XML et la DTD TEI Lite.
Elle est aujourd'hui principalement utilisée comme nouvelle plate-forme de traitement et de diffusion des thèses dans le cadre du projet Cyberthèses, un programme francophone d'archivage et de diffusion électronique des thèses, qui regroupe de nombreuses institutions francophones ou non à travers le monde.
Cette plate forme de conversion, placée sous licence GPL, a été réalisée avec l’aide de la société AJLSM (http://www.ajlsm.com/produits/cyberdocs), et est diffusée en Afrique, dans l’Amérique du Sud, en Suisse et en France.
Voir le site officiel de Cyberdocs : http://www.cyberdocs.org/fr/home (non actif).
http://www.univ-lyon2.fr/bibliotheques/theses-en-ligne-452917.kjsp?RH=WWW309PUB

AJLSM

Depuis 1999, AJLSM propose des solutions ouvertes, pérennes et efficaces pour créer, convertir, gérer, diffuser ou archiver votre information numérique.
Trois concepts sont la plupart du temps à la base des solutions que nous proposons : la normalisation, XML et les logiciels libres. Associées de manière optimale, ces approches permettent d'obtenir des systèmes d'information documentaire où les technologies sont au service de l'information, et non l'inverse.
AJLSM est aujourd'hui un acteur reconnu dans les domaines du patrimoine culturel et de la documentation scientifique. Nous avons participé à de nombreux projets dans ces domaines, avec des partenaires prestigieux, en France, en Europe et au Canada.
AJLSM propose des produits libres, développés dans le cadre de nos différents projets et qui bénéficient aujourd'hui à une communauté beaucoup plus large.

Les produits Logiciels libres

AJLSM est impliqué dans plusieurs projets de logiciels libres.
Pleade, outil de publication de corpus documentaires hétérogènes, incluant un moteur de recherche, un harvester, un visualiseur, pour instruments de recherche archivistique en format EAD Encoded Archival Description (http://www.loc.gov/ead/) , pour la presse avec reconnaissance optique de caractères (format xml METS, xml ALTO), etc.
http://pleade.com/
Notix, application bibliographique libre et paramétrable.

Les produits Logiciels non libres

ThesX est un logiciel qui permet de gérer des thésaurus, c'est-à-dire :
  • Créer, supprimer, modifier et exporter le contenu et la structure d'un thésaurus.
  • Rechercher du contenu dans un ou plusieurs thésaurus.
ThesX peut s'intégrer, entre autre, à Pleade dans des formulaires de recherche.
Pleade Plus est un ensemble de fonctionnalités et de modules complémentaires à Pleade.

Pleade

est aussi/surtout un moteur de recherche.
Créé par AJLSM et la Direction de Archives de France en 2001, Pleade est un outil de publication et de diffusion intégrant un puissant moteur de recherche ainsi qu'un moissonneur OAI-PMH (harvester) dans des corpus de documents XML (EAD et EAC-CPF, METS et ALTO, UNIMARC, Nomina, TEI, Dublin Core et Dublin Core Qualifié, BiblioML, MODS, ...).
Pleade suit les normes du responsive design depuis la version 3.59.

Pleade est une solution logicielle libre et open source à destination des archives, bibliothèques et musées. Depuis plus de 15 ans, Pleade permet la valorisation des données patrimoniales suivant un workflow très simple: publier, diffuser et disséminer.

PLEADE is a free software for searching and viewing archival finding aids in XML/EAD // PLEADE est un logiciel libre pour consulter et chercher des instruments de recherche archivistiques en format XML/EAD.

Code

https://sourceforge.net/projects/pleade/

C'est du java.

Dernière version de fin 2016: version 3.59.
PLEADE 3.59 works with Java 8.

PLEADE read-me anglais français

 About pleade-exe-3.59.zip for MAC/Linux or pleade-exe-3.59-windows.zip for Windows

 I - What is this ?
 ------------------

 This folder contains resources for running and testing an application Pleade-3.59.

 II - Installation Linux/Mac
 ---------------------------

 Step 1: Open and place a console in the root of pleade-exe-3.59 directory
 Step 2: If it is not, make executable pleade.sh.
$ Chmod + x pleade.sh

 Step 3: Run pleade.sh with the command
$ ./pleade.sh

 If all OK, after the application server start, Pleade-3.59 will be
 accessible with a web browser at http://localhost:8090/pleade

 To shutdown Pleade-Pleade 3.59 close the console that has served to launch the pleade.sh

 II - Installation Windows
 -------------------------

 Step 1: Create the folder C:\pleade-exe-3.59
 Step 2: Place the entire contents of this directory in C:\pleade-exe-3.59.
At the end of the operation, this path C:\pleade-exe-3.59\webserver
must exist.
 Step 3: Run (double click) the script C:\pleade-3.59\pleade.bat
/!\ If windows's firewall is triggered (alert message)
allow the script to run with the privileges required /!\


 If all ok, after the application server start, Pleade-3.59 will be
 accessible with a web browser at http://localhost:8090/pleade

 To shutdown Pleade-3.59 close the console that has served to launch the pleade.sh.

 III - Terms of Use
 ------------------

 This portable version of Pleade-3.59 is only for testing.
 It is pre-configured with minimum requirements

 For other usage details, read the PLEADE-3.59 license.


///////////////////////////////////////////////////////////////////////////////

 À propos de pleade-exe-3.59.zip pour MAC/Linux ou de pleade-exe-3.59-windows.zip pour Windows

 I - Qu'est-ce-que c'est ?
 -------------------------

 Ce dossier contient les ressources necessaires pour exécuter et tester une application
 pleade-Pleade 3.59.

 II - Installation Linux/Mac
 ---------------------------

 Étape 1: Ouvrir une console et se placer à la racine du répertoire pleade-exe-Pleade 3.59
 Étape 2: Si ce n'est pas le cas, rendre éxécutable le fichier pleade.sh.
$ chmod +x pleade.sh

 Étape 3: Exécuter le fichier pleade.sh avec la commande
$ ./pleade.sh

 Si tout est OK, après le démarrage du serveur d'application, Pleade-3.59 sera
 accessible avec un navigateur internet à l'adresse http://localhost:8090/pleade

 Pour éteindre l'application fermer la console qui a servie à lancer le script pleade.sh.

 III - Installation Windows
 --------------------------

 Étape 1: Créer le répertoire C:\pleade-exe-3.59
 Étape 2: Placer l'ensemble du contenu de ce répertoire dans C:\pleade-exe-3.59,
de sorte que le chemin C:\pleade-exe-3.59\webserver existe
 Étape 3: Exécuter (double clic), le script C:\pleade-3.59\pleade.bat
/!\ Si le par-feu windows se déclanche (message d'alerte),
autoriser le script à se lancer avec les priviléges demandés /!\

 Si tout est OK, après le démarrage du serveur d'application, Pleade-3.59 sera
 accessible avec un navigateur internet à l'adresse http://localhost:8090/pleade

 Pour éteindre l'application fermer la console qui a servie à lancer le script pleade.sh.

 III - Conditions d'utilisation
 ------------------------------

 Cette version portable de Pleade-3.59 est forunit uniquement dans un but de tests.
 Elle est pré-configurée de façons minimale.

 Pour les autres détails d'utilisation, lire la licence de Pleade-3.59.

Ref

https://sourceforge.net/projects/pleade/files/pleade/3.59/

Thursday, March 9, 2017

ZENODO export functions. Very good for JSON, DataCite XML and Marc21 XML (and DublinCore-OAI-PMH )


ZENODO

Zenodo puts only 4 bibliographic fields in metadata of each page!
Then the import with Zotero (with metadata translator) is quite bad...

example:
https://zenodo.org/record/376087

This article was published with an input of 20 zenodo fields
(+2 : zenodo automatically add DOI field and 'zenodo id' field).

access_right
"open"
communities
...
contributors
...
creators
...
description
" <b>  Sommaire de ce volume 18 de la Collection<br /> -- <i>Intégrations des savoirs et savoir faire</i> -- </b> <br /> <i> Matériaux et Joints d Etanchéité pour les hautes pressions.</i> <ul> <li>Préface / Dominique Leguillon</li><li>P. 13; Introduction générale / Patrick Boissinot, Patrick Langlois, Agílio A.H. Pádua</li><li>P. 17; Introduction au dimensionnement / Agílio A.H. Pádua; <br /> 1 Définition du problème; 2 Dimensionnement; 3 Obturateurs; 4 Conclusion</li><li>P. 27; Frettage et autofrettage / Patrick Langlois;<br /> 1 Considérations préliminaires au frettage; 2 Frettage d une enceinte bibloc; 3 Frettage d une enceinte multibloc; 4 Formulation de l autofrettage; 5 Modes de réalisation de l autofrettage; 6 Conclusion</li><li>P. 51; Méthodes d éléments finis en calcul de structures élastiques / Joël Frelat;<br /> 1 Introduction; 2 Rappel de la formule théorique; 3 Formulation variationnelle; 4 Formulation numérique; 5 Etapes d une mise en oeuvre pratique; 6 Conclusion Extension aux problèmes non linéaires</li><li>P. 61; Les matériaux sidérurgiques et les hautes pressions / Jean-Paul Dichtel; <br /> 1 Caractérisation mécanique des aciers; 2 Métallurgie des aciers et superalliages; 3 Commentaires : la Directive Européenne Appareils à Pression</li><li>P. 73; Les métaux non ferreux Alliage cuivre-béryllium et titane / Jean-Pierre Petitet; <br /> 1 Introduction; 2 Le cuivre-béryllium; 3 Le titane</li><li>P. 81; Les Carbures cémentés WC-Co / Emmanuel Pauty;<br />  1 Les procédés de fabrication; 2 Les propriétés des carbures cémentés; 3 Conclusions</li><li>P. 95; Choix et usinage des carbures de tungstène / Jacques Calzas;<br />  1 Choix des carbures de tungstène; 2 Usinage du carbure de tungstène</li><li>P. 107; Céramiques et matériaux pour l optique / Jean-Claude Chervin;<br />  1 Céramiques; 2 Matériaux pour l optique</li><li>P. 137; Types de joints et de montage / Roger Argoud et Jacques Roux;<br />  1 Introduction; 2 Généralités; 3 Joints à basse pression; 4 Joints cône sur cône; 5 Joints Bridgman Champignon; 6 Joints annulaires auto-serrés; 7 Joints coniques d Amagat; 8 Autres joints; 9 Conclusion</li><li>P. 157; Joints hautes pressions pour la compression de gros volumes solides / Sylvie Le Floch;<br />  1 Joints solides utilisés dans les différents types d enceintes hautes pressions; 2 Matières premières des joints; 3 Assemblages HP-HT</li><li>P. 169; Le matériel standard / Jean-Pierre Petitet;<br />  1 Tubes, conduites et raccords; 2 Les vannes; 3 Quelques types d enceintes commercialisées; 4 Les générateurs de pression; 5 Le matériel moins standard</li><li>P. 183; Assemblages haute pression / Gérard Hamel;<br />  1 Montage des raccords de pressions; 2 Montage de quelques passages électriques; 3 Les passages de thermocouple; 4 Les passages optiques, montage des fenêtres; 5 Montage des joints et des obturateurs sur une cellule haute pression</li><li>P. 193; Usinage / Jean-Pierre Michel;<br />  1 Introduction; 2 Les joints de faible épaisseur; 3 Les bagues anti-extrusion à 45; 4 Les joints à 45; 5 Les joints  double Bridgman ; 6 Les joints plats en élastomères; 7 Les joints en indium (étanchéité en hélium et azote liquide; 8 Joints métal-métal type Lens ring; 9 Les passages du courant; 10 Usinage de matériaux exotiques</li><li>P. 207; Les règles de sécurité / Patrick Boissinot;<br />  1 Dangers présentés par les appareils à pression; 2 Appareils à pression rencontrés dans les laboratoires et facteurs de risques; 3 Principes généraux de prévention et réglementation; 4 Moyens de protection; 5 Conclusion</li> </ul> "
imprint_isbn
"978-2918701040"
imprint_place
"Meudon, France"
imprint_publisher
"MRCT-CNRS"
keywords
...
license
"cc-by-nc-nd-4.0"
notes
" Licence CC-BY-NC-ND. Ce volume (cet ISBN) est une 3ième édition. Collection -- Intégrations des savoirs et savoir faire -- dirigée par Stéphane MOTTIN. Lien: http://www.sudoc.fr/155436619 (voir SUDOC pour trouver cet ouvrage en bibliothèque). Ce PDF contient des metadata bibliographiques directement utilisables par exemple par Jabref (logiciel open source pour bibTeX). Ce PDF est structuré et balisé (voir en dessous de preview ci-dessous en haut à gauche). Le sommaire détaillé avec structure sur 2 niveaux est indiqué dans le champs résumé dans le but du (Linked Open DATA) et des citations croisées internes à l ouvrage."
partof_pages
"51-60 "
partof_title
"Matériaux et joints d étanchéité pour les hautes pressions"
publication_date
"2011-04-15"
publication_type
"section"
references
...
related_identifiers
...
subjects
...
title
" Méthodes d’éléments finis en calcul de structures élastiques "
upload_type
"publication"

You can export in 7 formats:

  1. bibTeX
  2. CSL
  3. DataCite
  4. DublinCore
  5. JSON
  6. MarcXML
  7. Mendeley

bibTeX

@misc{frelat_joel_2011_376087,
  author       = {Frelat, Joël},
  title        = {{Méthodes d éléments finis en calcul de structures 
                   élastiques}},
  month        = apr,
  year         = 2011,
  note         = {{Licence CC-BY-NC-ND.  Ce volume (cet ISBN) est une 
                   3ième édition.   Collection -- Intégrations des
                   savoirs et savoir faire --         dirigée par
                   Stéphane MOTTIN.  Lien:
                   http://www.sudoc.fr/155436619 (voir SUDOC pour
                   trouver cet ouvrage en bibliothèque).  Ce PDF
                   contient des metadata bibliographiques directement
                   utilisables par exemple par Jabref (logiciel open
                   source pour bibTeX). Ce PDF est structuré et
                   balisé (voir en dessous de preview ci-dessous en
                   haut à gauche). Le sommaire détaillé avec
                   structure sur 2 niveaux est indiqué dans le champs
                   résumé dans le but du (Linked Open DATA) et des
                   citations croisées internes à l ouvrage.}},
  doi          = {10.5281/zenodo.376087},
  url          = {https://doi.org/10.5281/zenodo.376087}
}
only 7 fields!!!
very bad.

CSL Citation Style Language JSON Export

only 13 fields
abstract
"<p><strong>  Sommaire de ce volume 18 de la Collection<br> -- <em>Intégrations des savoirs et savoir faire</em>-- </strong><br> <em>Matériaux et Joints d Etanchéité pour les hautes pressions.</em></p> <ul> <li>Préface / Dominique Leguillon</li> <li>P. 13; Introduction générale / Patrick Boissinot, Patrick Langlois, Agílio A.H. Pádua</li> <li>P. 17; Introduction au dimensionnement / Agílio A.H. Pádua;<br> 1 Définition du problème; 2 Dimensionnement; 3 Obturateurs; 4 Conclusion</li> <li>P. 27; Frettage et autofrettage / Patrick Langlois;<br> 1 Considérations préliminaires au frettage; 2 Frettage d une enceinte bibloc; 3 Frettage d une enceinte multibloc; 4 Formulation de l autofrettage; 5 Modes de réalisation de l autofrettage; 6 Conclusion</li> <li>P. 51; Méthodes d éléments finis en calcul de structures élastiques / Joël Frelat;<br> 1 Introduction; 2 Rappel de la formule théorique; 3 Formulation variationnelle; 4 Formulation numérique; 5 Etapes d une mise en oeuvre pratique; 6 Conclusion Extension aux problèmes non linéaires</li> <li>P. 61; Les matériaux sidérurgiques et les hautes pressions / Jean-Paul Dichtel;<br> 1 Caractérisation mécanique des aciers; 2 Métallurgie des aciers et superalliages; 3 Commentaires : la Directive Européenne Appareils à Pression</li> <li>P. 73; Les métaux non ferreux Alliage cuivre-béryllium et titane / Jean-Pierre Petitet;<br> 1 Introduction; 2 Le cuivre-béryllium; 3 Le titane</li> <li>P. 81; Les Carbures cémentés WC-Co / Emmanuel Pauty;<br>   1 Les procédés de fabrication; 2 Les propriétés des carbures cémentés; 3 Conclusions</li> <li>P. 95; Choix et usinage des carbures de tungstène / Jacques Calzas;<br>   1 Choix des carbures de tungstène; 2 Usinage du carbure de tungstène</li> <li>P. 107; Céramiques et matériaux pour l optique / Jean-Claude Chervin;<br>   1 Céramiques; 2 Matériaux pour l optique</li> <li>P. 137; Types de joints et de montage / Roger Argoud et Jacques Roux;<br>   1 Introduction; 2 Généralités; 3 Joints à basse pression; 4 Joints cône sur cône; 5 Joints Bridgman Champignon; 6 Joints annulaires auto-serrés; 7 Joints coniques d Amagat; 8 Autres joints; 9 Conclusion</li> <li>P. 157; Joints hautes pressions pour la compression de gros volumes solides / Sylvie Le Floch;<br>   1 Joints solides utilisés dans les différents types d enceintes hautes pressions; 2 Matières premières des joints; 3 Assemblages HP-HT</li> <li>P. 169; Le matériel standard / Jean-Pierre Petitet;<br>   1 Tubes, conduites et raccords; 2 Les vannes; 3 Quelques types d enceintes commercialisées; 4 Les générateurs de pression; 5 Le matériel moins standard</li> <li>P. 183; Assemblages haute pression / Gérard Hamel;<br>   1 Montage des raccords de pressions; 2 Montage de quelques passages électriques; 3 Les passages de thermocouple; 4 Les passages optiques, montage des fenêtres; 5 Montage des joints et des obturateurs sur une cellule haute pression</li> <li>P. 193; Usinage / Jean-Pierre Michel;<br>   1 Introduction; 2 Les joints de faible épaisseur; 3 Les bagues anti-extrusion à 45; 4 Les joints à 45; 5 Les joints  double Bridgman ; 6 Les joints plats en élastomères; 7 Les joints en indium (étanchéité en hélium et azote liquide; 8 Joints métal-métal type Lens ring; 9 Les passages du courant; 10 Usinage de matériaux exotiques</li> <li>P. 207; Les règles de sécurité / Patrick Boissinot;<br>   1 Dangers présentés par les appareils à pression; 2 Appareils à pression rencontrés dans les laboratoires et facteurs de risques; 3 Principes généraux de prévention et réglementation; 4 Moyens de protection; 5 Conclusion</li> </ul>"
author
...
container_title
"Matériaux et joints d étanchéité pour les hautes pressions"
DOI
"10.5281/zenodo.376087"
id
"376087"
ISBN
"978-2918701040"
issued
...
note
"Licence CC-BY-NC-ND. Ce volume (cet ISBN) est une 3ième édition. Collection -- Intégrations des savoirs et savoir faire -- dirigée par Stéphane MOTTIN. Lien: http://www.sudoc.fr/155436619 (voir SUDOC pour trouver cet ouvrage en bibliothèque). Ce PDF contient des metadata bibliographiques directement utilisables par exemple par Jabref (logiciel open source pour bibTeX). Ce PDF est structuré et balisé (voir en dessous de preview ci-dessous en haut à gauche). Le sommaire détaillé avec structure sur 2 niveaux est indiqué dans le champs résumé dans le but du (Linked Open DATA) et des citations croisées internes à l ouvrage."
page
"51-60"
publisher
"MRCT-CNRS"
publisher_place
"Meudon, France"
title
"Méthodes d'éléments finis en calcul de structures élastiques"
type
"chapter"

no contributors
no licence (i put in the "note" field")...

DataCite XML Export

Zenodo gives a DataCite DOI then he must provide clean datacite METADATA to DataCite.

with XML tree view:



It's a clean XML DataCite 3.1
<?xml version='1.0' encoding='utf-8'?>
<resource 
xmlns:xsi= "http://www.w3.org/2001/XMLSchema-instance" 
xmlns="http://datacite.org/schema/kernel-3" 
xsi:schemaLocation="http://datacite.org/schema/kernel-3 http://schema.datacite.org/meta/kernel-3/metadata.xsd">

<!--
 Revision history
     2010-08-26   Complete revision according to new common specification by the metadata work group after review. AJH, DTIC
2010-11-17 Revised to current state of kernel review, FZ, TIB 
2011-01-17 Complete revsion after community review. FZ, TIB
2011-03-17 Release of v2.1: added a namespace; mandatory properties got minLength; changes in the definitions of relationTypes
IsDocumentedBy/Documents and isCompiledBy/Compiles; changes type of property "Date" from xs:date to xs:string. FZ, TIB
2011-06-27 v2.2: namespace: kernel-2.2, additions to controlled lists "resourceType", "contributorType", "relatedIdentifierType", and "descriptionType". Removal of intermediate include-files.
     2013-05 v3.0: namespace: kernel-3.0; delete LastMetadataUpdate & MetadateVersionNumber; additions to controlled lists "contributorType", "dateType", "descriptionType", "relationType", "relatedIdentifierType" & "resourceType"; deletion of "StartDate" & "EndDate" from list "dateType" and "Film" from "resourceType";  allow arbitrary order of elements; allow optional wrapper elements to be empty; include xml:lang attribute for title, subject & description; include attribute schemeURI for nameIdentifier of creator, contributor & subject; added new attributes "relatedMetadataScheme", "schemeURI" & "schemeType" to relatedIdentifier; included new property "geoLocation" 
2014-08-20 v3.1: additions to controlled lists "relationType", contributorType" and "relatedIdentifierType"; introduction of new child element "affiliation" to "creator" and "contributor"
-->
only one field is empty:
no "CC-BY-NC-ND"

DublinCore (and OAI-PMH)

It's an XML with
http://www.openarchives.org/OAI/2.0/oai_dc.xsd"
<?xml version='1.0' encoding='utf-8'?>
<oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">

The field "notes " is empty.

It's for OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting
http://www.openarchives.org/pmh/
The Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) is a low-barrier mechanism for repository interoperability. Data Providers are repositories that expose structured metadata via OAI-PMH. Service Providers then make OAI-PMH service requests to harvest that metadata. OAI-PMH is a set of six verbs or services that are invoked within HTTP.

and DublinCore
http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=elements


JSON

It's the same METADATA JSON uploaded

1/    with unicode encoding /u  (for example for "é" -> \u00e9)
2/    with a beautify/format transform of JSON
3-a/ with at the beginning
{"created": "2017-03-09T10:05:09.248886+00:00", 
  "doi": "10.5281/zenodo.376087", 
  "id": 376087, 
  "links": {
    "badge": "https://zenodo.org/badge/doi/10.5281/zenodo.376087.svg", 
    "doi": "https://doi.org/10.5281/zenodo.376087", 
    "html": "https://zenodo.org/record/376087"
  }, 

3-b/ and at the end
owners": [
    2222
  ], 
  "revision": 0, 

  "updated": "2017-03-09T10:05:09.248893+00:00"


MarcXML

very good (all fields) but it's an old marc format (good for librarians)
and XML format
<record xmlns="http://www.loc.gov/MARC21/slim">

Mendeley

it's not an export but just a link to export
with only 3 METADATA {title, author and DOI} 
and a web service of automatic upload of PDFs.
If you have already the reference in Mendeley, it could be OK.
(I import my bibTeX references (JabRef) with Desktop Mendeley app and sync but problem, many fields 'notes' 'editor' = 0...).


Conclusion 

  • Very good for JSON, DataCite XML and Marc21 XML.
  • 'notes' lacks with the export DublinCore-OAI-PMH.
  • Put your BibTeX reference in your PDF.