Showing posts with label pdf. Show all posts
Showing posts with label pdf. Show all posts

Saturday, September 9, 2017

qr-code of a scientific article, and blogger. An Analytical Solution of The Laplace Equation With Robin Conditions


Use the DOI resolver:
https://chrome.google.com/webstore/detail/doi-resolver/goanbaknlbojfglcepjnankoobfakbpg
 and for example:
http://dx.doi.org/10.5281/zenodo.439037
it generates
this qr-code
(for your smartphone):


In blogger add image :
see this example on the right of this blog.

Cite as

Mottin, Stéphane. (2016). An analytical solution of the Laplace equation with Robin conditions by applying Legendre transform. Integral Transforms and Special Functions, 27(4), 289–306. 

Export

go to
https://zenodo.org/record/439037
export
BibTeX CSL DataCite Dublin Core JSON MARCXML

or inside the pdf :
Refence bibTeX
@article{mottin:hal-01376999,TITLE = {An analytical solution of the Laplace equation with Robin conditionsby applying Legendre transform},AUTHOR = {Mottin, Stéphane},URL = {https://hal.archives-ouvertes.fr/hal-01376999},JOURNAL = {Integral Transforms and Special Functions},PUBLISHER = {Taylor and Francis},VOLUME = { 27},NUMBER = {4},PAGES = {289-306},YEAR = {2016},DOI = {10.1080/10652469.2015.1121255},KEYWORDS = {Robin boundary conditions ; integral transform ; Legendre transform ; inverse problems ; Appell function ; evaluation of definite integrals ; biophotonics ; heat transfer ; mass transport},PDF = {https://hal.archives-ouvertes.fr/hal-01376999/file/mottin_2016_LegendreTransfo.pdf},}



Monday, August 7, 2017

best flipbook apps: yumpu (and zaps to automate)


Countless flipbook plugins give designers the ability to simulate printed material in a digital flipbook form through page-flipping effects and the addition of rich interactive content. I was trying the jQuery flipbook plugin and was really frustrated. Everything changed when i found the free web -service of Yumpu. It`s just easy and simple to upload your PDF pages or portfolio to Yumpu.

http://enstitute.org/8-best-jquery-flipbook-plugins/

Hary Maxwell is a passionate online publisher and author.  On Enstitute.org, he offers help to anyone who is interested in publishing their content online.


PDF->flipbook (an URL or many embed  & hosting in yumpu)
word->flipbook (an URL or many embed & hosting in yumpu)

https://www.yumpu.com/fr/document/view/59244397/3materiaux18-2011


en html5:


en flash

Benefits of Yumpu

  • The software and magazines are hosted in the cloud
  • Never have to worry about losing your magazines
  • No downloads or complicated menus to learn
  • Millions of readers will see your magazine on the platform
  • Optimized to be shared on a variety of social media channels
  • Drag and drop editing of links, sounds and slideshows in the magazine
  • Auto detect links to websites, email addresses and phone numbers
  • Import and format from PDF, Excel or Google doc files
  • Create unlimited Flipbooks
  • Unlimited pages per Flipbook
  • Embed in your website or blog
  • Easy to use Editor
  • SEO-optimization tools
  • Publish Flipbooks worldwide
  • Reach 12 million readers
  • Share Flipbooks on Facebook
  • Powerful social sharing tools
  • Create Collections
  • Support community
  • Cross-links inside Flipbooks
  • Add audio, video and links
  • Search engine optimized
  • Content delivery network
  • Desktop, tablet & mobile
  • Publish in 70 languages
  • Free Wordpress plugin
  • Developer API interface
  • Developer PHP API library
  • Publish via Dropbox
  • HQ-Publications zoom
  • HTML5, Flash, Java support
  • and many more...

Yumpu_flipbook-free-gratis-list-options


FREE PUBLISHING

Free-Feature-List
 We host your magazines in the cloud
 Share on all social media plattforms
 Reach millions of readers
 Hotspot editor videos
 Hotspot editor links
 Hotspot editor slideshow
 Hotspot editor audio
 Auto detect links
 Hotspot Import & Export via CSV

DEVELOPER PUBLISHING

Developer Feature List
 Open Interface to all applications

MAGAZINE PUBLISHING

Magazine Feature-Liste
 Optimized for all major search engines
 Worldwide and free publishing
 Integration for websites and blogs
 Unlimited number of pages
 Unlimited number of magazines
 Add links, videos and audio
 100% advertising-free - your magazine in full focus
 Password protection for magazines
 Download and print function for magazine
 Use your own corporate design
 Your branding in the magazine player
 Extensive statistics with Google Analytics
 Upload new revisions of existing documents

WEB PUBLISHING

Web Feature-List
 Excerpts of paid titles
 Shelf with your publications
 Kiosk with your own corporate design
 Extensive drag & drop layout editor
 Insert own html-code for special solutions
 Promote your products with your own advertising space
 Your own domain for your kiosk
 Creation of user groups and focus on target audiences
 Extensive subscription administration

MOBILE PUBLISHING

Mobile Feature-List
 Increase download rate with the smart banner
 iPhone & iPad app for your magazines
 Publish through Apple with your name
 Your app with your corporate design
 Offline reading on mobile devices
 Push notifications
 Use Apple payment and execute inapp sales
 Subscription payment inside the app
 Your own Android app


pricing




AUTOMATE YUMPU TASKS USING ZAPs ZAPIER

Zaps connect your apps. They're workflows that automatically finish actions and tasks, while you do more important work.

https://zapier.com/zapbook/yumpu/



HOW TO INTEGRATE YUMPU WITH PROCESSPLAN

https://zapier.com/zapbook/yumpu/processplan/

Wednesday, August 2, 2017

pdf and HTML5, with or without javascript? How to customize the look and feel of the PDF toolbar? interactive links


Embedding PDFs without JavaScript

be careful:
As of iOS 9, none of these examples (without JavaScript) work properly in Safari for iOS.

example with iframe

<iframe src="/pdf/sample-3pp.pdf#page=2" height="100%" width="100%">
This browser does not support PDFs. Please download the PDF to view it: <a href="/pdf/sample-3pp.pdf">Download PDF</a>
</iframe>

embed, object, iframe

https://pdfobject.com/static.html


PDF.js is a Portable Document Format (PDF) viewer that is built with HTML5. PDF.js is community-driven and supported by Mozilla Labs. Our goal is to create a general-purpose, web standards-based platform for parsing and rendering PDFs.

This extension provides PDF.js as the default PDF viewer in Chrome.
https://chrome.google.com/webstore/detail/pdf-viewer/oemmndcbldboiebfnladdacbdfmadadm?hl=en

Embedding PDFs with JavaScript

example of PDFObject 2.0 library and Mozilla's PDF.js

PDFObject is not a rendering engine. PDFObject just writes an <embed> element to the page, and relies on the browser or browser plugins to render the PDF. If the browser does not support embedded PDFs, PDFObject is not capable of forcing the browser to render the PDF.

If you need to force browsers to display a PDF, we suggest using Mozilla's PDF.js. Note that PDF.js is subject to its own limitations, such as cross-domain security restrictions. PDFObject and PDF.js play well together, there are links to some great PDF.js examples in the Examples section below.

PDFObject does not provide the ability to customize the look and feel of the PDF toolbar. The toolbar is controlled by the browser, and will vary widely from browser to browser (Chrome versus Safari versus Firefox, etc.). Some of these browsers provide the ability to show or hide the toolbar, or a feature such as the search field, via PDF Open Parameters. However, in general the browsers do NOT provide any mechanism for customizing the toolbar. If you really need to customize the toolbar, try forking Mozilla's PDF.js and customizing it to suit your needs.


PDFObject does not validate the existence of the PDF, or that the PDF is actually rendered. The assumption is that you are specifying a valid URL and the network is functioning normally. PDFObject does not check for 404 errors, and JavaScript cannot detect whether the PDF actually renders, unless you are using PDF.js, which is outside the scope of PDFObject.

PDFObject does not magically implement PDF Open Parameters. As mentioned above, these parameters are not widely supported. The PDF rendering engine either supports them or doesn't — PDFObject cannot force the rendering engine to implement these features.
https://pdfobject.com/

jQuery Document Viewer

7$
https://codecanyon.net/item/jquery-document-viewer/1732515?ref=jqueryrain&ref=jqueryrain&clickthrough_id=156843077&redirect_back=true

Display a document in a DOM element on the page
Display document in a modal window

This plugin uses pdf.js to render pdfs.

generater and parallax

http://www.jqueryrain.com/?JRJVsd1V

Android

https://play.google.com/store/apps/details?id=com.google.android.apps.pdfviewer&hl=en
http://www.apkmirror.com/apk/google-inc/google-pdf-viewer/

PDF Viewing is now available directly in Google Drive. For environments where this cannot be deployed, Google PDF Viewer offers the same capabilities in a standalone app. View, print, search and copy text from pdf documents while you're on the go.

best of viewer for CMS wordpress

embedded pdf viewer and interactive links

problems

Wednesday, July 26, 2017

liseuses et évolution des marchés en 2017; workflow d'amazon pour la publication électronique/papier

Introduction

L'histoire de cette version "4" (6 pouces et WiFi; sept 2012) de Kindle qui était en promo à 59 euros au lieu de 79 euros, avec une livraison gratuite. L'écran tactile viendra après.
https://www.amazon.fr/gp/product/B007HCCOD0/
Écran Écran 6 pouces (diagonale visible de 15 cm), affichage encre électronique E Ink Pearl, technologie optimisée d'affichage de polices, 167 dpi, 16 niveaux de gris.
Dimensions 166 mm x 114 mm x 8,7 mm
Poids 170 grammes
Configuration Aucune, l'appareil est sans fil. Il n'y a pas besoin d'ordinateur pour télécharger du contenu.
Stockage sur l'appareil Jusqu'à 1 400 ebooks ou 2 Go (environ 1,25 Go disponible pour les contenus de l'utilisateur, y compris des fichiers word qu'il faut passer via sa messagerie amazon).
Stockage dans le Cloud Stockage gratuit dans le Cloud pour tout le contenu Amazon.
 
Autonomie de la batterie Une seule charge de batterie dure jusqu'à un mois avec la connexion sans fil désactivée, à raison d'une demi-heure de lecture par jour. Avec la connexion sans fil activée en permanence, la batterie dure jusqu'à 3 semaines. L'autonomie de la batterie variera en fonction de l'utilisation de la connexion sans fil, comme l'achat dans la boutique Kindle, les recherches sur internet, et le téléchargement de contenus.
Temps de charge Charge complète en 3 heures environ en connectant à un ordinateur le câble USB 2.0 (inclus dans la boîte du Kindle). Le chargeur secteur pour la France est vendu séparément.
 
Connexion Wi-Fi L'appareil se connecte aux réseaux Wi-Fi publics et privés ainsi qu'aux points d'accès qui utilisent les standards 802.11b, 802.11g, ou 802.11n ; avec sécurité WEP, WPA et WPA2 qui nécessitent un mot de passe. Il ne se connecte pas aux réseaux sécurisés WPA et WPA2 utilisant les méthodes d'identification 802.1X.  
Formats de contenus pris en charge Kindle Format 8 (AZW3), Kindle (AZW), TXT, PDF, MOBI non protégé, PRC natif ; HTML, DOC, DOCX, JPEG, GIF, PNG, BMP converti.

Les liseuses

Les liseuses ont peu évolué depuis leur apparition il y a dix ans et les fabricants peinent à convaincre les lecteurs de se rééquiper.
Près de dix ans après l'arrivée des premiers modèles de liseuses électroniques, l'enthousiasme n'est pas franchement de mise pour les quelques constructeurs qui se partagent le marché. En France, les ventes ne progressent plus vraiment, et depuis longtemps. Quelque 400.000 exemplaires sont écoulés bon an mal an.
Aucun acteur ne communique ses chiffres de vente, mais Amazon et Kobo se partagent l'essentiel du marché. « Nous sommes au coude-à-coude, avec une part de marché autour de 45 % chacun ", assure Fabian Gumucio, directeur marketing Europe du Sud de Kobo. Derrière suit le français Bookeen dont les produits sont distribués, parfois en marque blanche, chez Carrefour, Leclerc ou Relay.
Signe que le marché n'est pas à la fête, le japonais Sony, tout premier à avoir commercialisé une liseuse, dès 2004, s'est retiré de la compétition en 2014. Et, en octobre 2015, la plus grande chaîne de librairies britannique, Waterstones, a retiré les Kindle des rayons de ses 280 magasins, à peine trois ans après les avoir introduits, décrivant les ventes comme « désolantes ".

Pas vraiment de rupture

En réalité, « les liseuses sont surtout achetées par les très gros lecteurs. C'est un marché de niche ", explique Michaël Dahan, le PDG fondateur de Bookeen. Et ce marché est relativement saturé. Reste le renouvellement du parc, mais - malheureusement pour les constructeurs - les appareils vieillissent plutôt bien. En moyenne, les utilisateurs ne changent de liseuse que tous les trois à cinq ans. « C'est un produit simple, avec un côté affectif qui n'est pas négligeable, explique Michaël Dahan. Et il n'y a pas vraiment eu de rupture technologique. "
La principale innovation remonte à 2012 avec l'arrivée de l'éclairage intégré sur le Kobo Glo, qui permet de lire dans l'obscurité. C'est d'ailleurs ce qui sépare aujourd'hui l'entrée de gamme, entre 70 et 90 euros, des produits plus évolués, entre 130 et 200 euros. Depuis, Kobo a introduit un modèle pour lire dans son bain. Bookeen, de son côté, commercialisera bientôt un appareil muni d'un étui pour recharger la batterie à l'énergie solaire. Autant de petits plus pour le lecteur. Mais le coeur du produit n'a pas vu d'amélioration significative ces dernières années et n'en verra sans doute pas de sitôt.
L'arrivée de la couleur, notamment, qui permettrait de lire magazines et bandes dessinées numériques, ne figure pas à l'agenda des constructeurs, car incompatible avec la technologie actuelle de l'encre électronique utilisée dans les liseuses. Et, côté prix, Amazon a toujours été très clair : la société ne gagne pas d'argent sur les liseuses. Difficile dans ces conditions pour la concurrence de se différencier par les prix. « Tout le monde a été obligé de suivre », reconnaît Fabian Gumucio. Et de porter le fer sur les contenus, le seul véritable nerf de la guerre.

Ref


https://www.lesechos.fr/14/04/2016/LesEchos/22171-085-ECH_sur-un-marche-francais-des-liseuses-en-berne--les-marges-restent-inexistantes-faute-d-innovation.htm

Nouveautés en juin  2017

Deux distributeurs s'apprêtent à sortir des liseuses " newlook " au mois de mai. Le choix de la date n'a rien du hasard : elles sont destinées à équiper les vacanciers qui souhaitent lire sur les plages. Kobo présente le 2 mai un nouveau modèle étanche sans lumière bleue qui ne devrait donc pas perturber le fonctionnement de la mélatonine pendant la nuit. Elle sera vendue par la Fnac Darty, Boulanger, CD-Discount... De son côté, Carrefour prévoit de lancer une liseuse en marque blanche avec une offre de contenus. Elle sera fabriquée par Bookeen. Mais l'arrivée de ces nouveaux modèles ne peut pas faire oublier la réalité économique. La liseuse a du mal à décoller. Après un pic dans les années 2012 -2013, les ventes sont retombées. En France, les constructeurs rechignent à donner des chiffres mais les ventes sont en dessous de 500.000 par an. " La liseuse n'est qu'un élément de la chaîne du livre numérique, explique Michael Dahan, président de Bookeen, elle permet de vendre des e-books. On ne peut pas se contenter de mesurer le nombre de liseuses vendues. Ce sont de gros lecteurs qui achètent les liseuses et ils les gardent longtemps. "

Les deux groupes ont donc misé sur des appareils adaptés à des situations de lecture particulière. Kobo affirme que son nouveau modèle, la liseuse Aura H20, est étanche jusqu’à 60 minutes dans 2 mètres d’eau. On peut donc lire dans son bain ou sur la plage sans trop craindre les éclaboussures ou, pire, de la faire tomber dans l’eau. Elle peut contenir 6.000 livres numériques et l’autonomie de la batterie, selon le constructeur, atteint plusieurs semaines. Carrefour n’a pas souhaité donner d’indication sur le modèle qu’il prépare. Mais il est possible que Carrefour commercialise une liseuse équipée d’une feuille photovoltaïque. Cette dernière permettra de recharger la liseuse à l’énergie solaire, sans batterie ni câble.

Un marché concentré

Le marché de la liseuse s’est concentré. Deux acteurs mondiaux dominent le marché : Amazon avec les diverses déclinaisons du Kindle et Rakuten avec Kobo.
Les deux groupes sont des sites de commerce en ligne pour qui la liseuse est un produit d’appel. 
Le groupe japonais Rakuten est connu en France pour avoir racheté Price Minister en 2010 et Kobo en 2011. Il revendique 17 millions d’utilisateurs dans l’hexagone.
Deux autres acteurs de taille plus modeste, Bookeen et TEA, font concurrence aux deux mastodontes. Bookeen commercialise des liseuses sous son nom mais fabrique aussi des liseuses que la grande distribution vend en marque blanche. C’est ainsi que Carrefour commercialise des liseuses sous la marque « Nolim by Carrefour », fabriquée par Bookeen. TEA (The Ebook Alternative), lancé par le libraire Guillaume Decitre, est distribué dans les librairies et sur le site du groupe mais aussi par les acteurs de la grande distribution. Mais tous les constructeurs reconnaissent que le taux de renouvellement des liseuses est faible. Il n’y a pas la même course à l’innovation que sur les téléphones mobiles, si bien que les consommateurs les gardent plusieurs années avant de les changer.

Ref

https://www.challenges.fr/high-tech/la-liseuse-n-a-pas-dit-son-dernier-mot_470701

Kindle Direct Publishing KDP

Publiez, sans frais, des ebooks et livres brochés en autoédition via Kindle Direct Publishing et touchez des millions de lecteurs sur Amazon.
Tout de suite sur le marché. La publication prend moins de 5 minutes et votre livre apparaît dans les boutiques Kindle du monde entier dans les 24 à 48 heures.
Gagnez plus. Vendez vos livres en France, en Allemagne, en Italie, en Espagne, au Royaume-Uni, au Canada, aux États-Unis, en Inde, au Japon, au Brésil, au Mexique, en Australie et dans bien d'autres pays… Et percevez des redevances qui peuvent atteindre 70 %. Inscrivez-vous au programme KDP Select et gagnez plus grâce à Kindle Unlimited / Abonnement Kindle et à la Bibliothèque de prêt Kindle.
Gardez le contrôle. Gardez le contrôle de vos droits et définissez vous-même vos prix. Vous pouvez modifier vos livres à tout moment.
Publiez au format numérique et papier. Publiez des ebooks Kindle et des livres brochés gratuitement via KDP.

Mettez en forme votre manuscrit.
https://kdp.amazon.com/fr_FR/help/topic/A17W8UM0MMSQX6
Si vous avez besoin d’aide pour la mise en forme, consultez nos outils et ressources.
https://kdp.amazon.com/fr_FR/help/topic/A3IWA2TQYMZ5J6

Word est un excellent outil car il permet de réaliser très facilement la mise en forme. Nous vous conseillons donc d’écrire votre livre dans Word ou de convertir un fichier source existant au format Word (DOC ou DOCX) avant de continuer. Voici quelques conseils pour améliorer la présentation de votre ebook :

Format de fichier : enregistrez votre contenu au format DOC ou DOCX et sauvegardez régulièrement votre travail afin de vous assurer que toutes vos modifications seront conservées.

Tableaux : si vous devez intégrer des tableaux à votre livre, utilisez la fonctionnalité « Insérer un tableau » de Word.

Mise en page : vous pouvez utiliser les retraits par défaut de Word, des caractères gras ou italiques ainsi que des titres. En revanche, les polices spéciales, les en-têtes et les pieds de page ne sont pas convertis au format Kindle. Veillez donc à les éviter.

Pour offrir une navigation facile au sein de votre livre, nous vous conseillons de créer une table des matières active. En effet, le contenu Kindle peut être redimensionné, si bien que les numéros de page ne sont pas vraiment exploitables.

  • Sur PC, vous pouvez utiliser l’outil intégré dans Word pour créer la table des matières (en savoir plus: https://kdp.amazon.com/fr_FR/help/topic/A1JMIOQ2RP4DPK).
  • Sur un Mac, vous devez créer une table des matières manuellement à l’aide des fonctions Lien hypertexte et Signet.


Dès lors que vous avez inséré tous les sauts de page et que vous êtes satisfait de la disposition de votre livre, enregistrez le fichier Word dans le dossier Documents ou sur le Bureau au format Page Web, filtrée (*HTM et *HTML) (PC) ou Page Web (.htm) (Mac). Ce format est obligatoire pour créer un ebook correct.

Quand vous enregistrez le fichier Word au format HTML, toutes les images présentes dans le document (s’il y en a) sont extraites et stockées dans un dossier distinct. Ce dossier apparaît au même emplacement que le fichier HTML.

Une fois que vous êtes satisfait de la qualité et de la présentation de votre livre, chargez le fichier dans votre Bibliothèque KDP, puis effectuez la procédure de publication.

À partir du moment où vous avez cliqué sur « Enregistrer et publier », il faut compter environ 24 heures pour que le livre soit mis en vente dans la boutique Kindle. Les autres caractéristiques du livre, comme la description et les liens vers les éditions papier associées, sont présentées sur la page produit sous 48 à 72 heures.

Kindle Textbook Creator 

version 1.13.7.0 du 7 sept 2016, testé sur mac Sierra.
Il est multilingue:



Kindle Textbook Creator est un outil téléchargeable qui vous permet de convertir des PDF de livres comprenant du contenu multimédia enrichi en vue de leur publication sur les appareils et applications Kindle. Avec Kindle Textbook Creator, vous pouvez plus facilement travailler sur vos manuels, livres de cuisine, carnets de voyages et autres livres contenant de nombreux éléments multimédias tels que :
  • Tableaux
  • Graphiques
  • Équations
  • Pistes audio
  • Vidéos
  • Pop-ups d’images
  • Fichiers audio intégrés
  • Boutons de lecture audio invisibles placés en superposition

Vous pouvez utiliser n’importe quel fichier PDF pour ajouter des pages à votre livre.
Kindle Textbook Creator accepte les fichiers d’origine d’une ou plusieurs pages au format .pdf.

Avant d’importer votre PDF, vérifiez qu’il comporte des signets pour chaque entrée de la table des matières. Lorsque vous avez chargé votre livre finalisé sur KDP, Amazon convertit ces signets pour créer la table des matières électronique qui permettra aux lecteurs de naviguer au sein de votre livre.

Vous pouvez ajouter des sons, vidéos et images en pop-up à votre manuel sous la forme d’icônes ou de liens hypertextes.
Voici les types de fichier pris en charge par Kindle Textbook Creator :
Vidéo : .mp4
Audio : .mp3
Image : .jpg, .jpeg ou .png

Format d’exportation
Kindle Textbook Creator exporte le livre terminé en .kpf (Kindle Package Format) afin que vous puissiez le charger sur Kindle Direct Publishing (KDP) et le proposer ainsi aux clients.
les livres créés avec Kindle Textbook Creator peuvent uniquement être chargés sur KDP ; à l’heure actuelle, ils ne sont pas compatibles avec Amazon Vendor Central.

Une fois votre livre publié, les lecteurs ont automatiquement accès aux fonctionnalités de lecture Kindle : surlignage, bloc-notes, fiches récapitulatives, dictionnaire...

Ref

https://kdp.amazon.com/fr_FR/

Digital Publishing 2.0; publication numérique 2.0 (post bilingue)


English

The first generation of digital publishing delivered the electronic equivalent of a book. But not all books. It was for books with layouts and content that were simple enough for the small black–and–white screens of e–readers. This means that digital publishing opportunities were pretty much limited to trade books and newspapers. Magazines and about 85% of books have not been able to reach these devices, nor have corporations or other organisations been able to tap into them, because they just aren't suitable for design–rich content and their displays are too limited. The introduction of iPad brought about a revolutionary change.

Digital Publishing 2.0 is marked by the introduction of an entirely new digital experience — one that promises an unprecedented level of consumer interaction with content through smartphones, e–readers, and tablets, as well as an equally engaging experience through computers.

Digital Publishing 2.0 technology delivers a full-color, interactive multimedia experience through larger, more sophisticated displays in which consumers explore content (whether books, magazines, newspapers, product catalogs, advertisements, or other material) through clickable videos, sound files, and other interactive functionality.

The most important difference between Digital Publishing 2.0 and Digital Publishing 1.0 is that it offers publishers and others a variety of ways to distinguish digital content from traditional content. This means publishers can — at least potentially— develop new revenue models for digital experiences.

ref

http://www.quark.com/en/Solutions/Content-Automation/Digital-Publishing.aspx

Français

Le Digital Publishing (publication numérique) de première génération permettait de produire l'équivalent d'un livre au format électronique. Mais pas de tous les livres. Seuls étaient concernés les livres à la mise en page et au contenu suffisamment simples pour être adaptés aux petits écrans en noir et blanc des lecteurs numériques. Les possibilités de publication numérique étaient donc généralement limitées aux ouvrages professionnels et aux journaux. Les grandes entreprises et autres organisations n'ont pas pu les utiliser car ils n'étaient pas compatibles avec les contenus dotés d'un graphisme riche et à cause de leurs écrans trop limités. Le lancement de l'iPad et iPhone (puis tablette android) a été à l'origine d'un changement révolutionnaire.

Le Digital Publishing 2.0 est marquée par la naissance d'une toute nouvelle expérience numérique qui promet aux clients un niveau d'interaction sans précédent avec les contenus via les smartphones, lecteurs numériques et tablettes, ainsi qu'une expérience tout aussi passionnante sur ordinateur.

La technologie mise en œuvre dans la Publication numérique 2.0 offre une expérience multimédia interactive toute en couleurs sur des écrans plus grands et plus évolués avec lesquels les clients peuvent explorer des contenus (livres, magazines, journaux, catalogues de produits, publicités ou autres) comme des vidéos, des fichiers audio, tout cela en un seul click.

La Publication numérique 2.0 se distingue avant tout de la Publication numérique 1.0 car elle offre différents moyens de démarquer les contenus numériques des contenus traditionnels. Les éditeurs et autres intervenants ont donc la possibilité de développer de nouveaux modèles de revenus pour les expériences numériques.

Les défis du multi-canal

Les défis liés à la mise en place de stratégies rentables pour le Digital Publishing 2.0

Malgré la popularité et la croissance rapide des terminaux mobiles, des défis de taille sont à relever dans la course au succès du Digital Publishing 2.0.

Tout d'abord, les éditeurs doivent créer des contenus dotés de fonctionnalités avancées, ce qui peut exiger une programmation complexe et beaucoup de travail technique. Ils doivent créer ces contenus enrichis pour différentes plates-formes, pour des terminaux qui arrivent sans cesse plus nombreux sur le marché et pour les différents types de supports. Afin de mener ces tâches à bien en limitant les coûts, vous avez besoin d’outils permettant aux concepteurs (et non aux développeurs) de créer du contenu enrichi qui fonctionnera correctement sur la totalité des plates-formes, des terminaux numériques et des supports.
Ensuite, le contenu enrichi doit fonctionner dans une application qui fournit non seulement toutes les fonctionnalités multimédia interactives attendues par le client, mais aussi d'autres qui le surprendront.
Pour finir, des canaux de distribution sont requis qui faciliteront pour un client la recherche, l'achat et le téléchargement de votre contenu.

Solution-> Créez des contenus interactifs enrichis indépendants de la plate-forme, du média et du périphérique numérique

Les logiciels (comme Quark ou Indesign ou Scribus ou autres PAO) peuvent vous aider à incorporer la publication numérique dans votre stratégie de publication multicanal pour cibler les tous derniers terminaux mobiles, y compris les tablettes comme l'iPad™ ou Iphone d'Apple® et les Galaxy Tab® ou smartphone de Samsung comme les ordi portables Gnu/linux, mac OSX, windows. De plus, avec la stratégie de contenus indépendants du média de Quark, nos logiciels vous protègent contre les errances permanentes de la technologie liées à l'apparition de nouveaux appareils sur le marché.

L'approche de Quark en matière de publication numérique repose sur deux fondements clés :
  1. Indépendance vis-à-vis des plates-formes : vous ne pouvez pas vous permettre de créer du contenu et de développer des applications pour chaque plate-forme, support et appareil. C’est pour cette raison que, au lieu de limiter vos données à un format spécifique, Quark vous permet de créer des contenus indépendants des plates-formes et des supports. Vous pouvez ainsi publier automatiquement dans tous les formats qui vous conviennent.
  2. Aucune programmation requise : nos logiciels permettent aux concepteurs graphiques de se lancer dans des expériences interactives fascinantes sans avoir à faire appel aux développeurs.

Publication numérique : une capacité de base d'une solution de publication dynamique

Nos capacités de publication numérique font partie intégrante de notre solution de publication dynamique, qui permet à de grandes entreprises d'améliorer leur productivité et de réaliser des économies sur les coûts dans tous leurs environnements de publication d'entreprise. L'utilisation de notre solution de publication dynamique permet à chacun de créer un contenu XML structuré dans Microsoft Word, d'automatiser l'assemblage de contenus personnalisés et de conception élaborée destinés à plusieurs publics, et de publier automatiquement sur papier, Web et terminaux numériques.

CRÉATION DE CONTENUS XML

Création XML, création structurée, création de contenu intelligent. Ces trois processus désignent le même concept : une méthode de création de contenu différente de celles proposées par les applications de traitement de texte et PAO qui génèrent, quant à elles, du contenu non structuré. De plus en plus d'entreprises se tournent vers la création de contenus XML car il s'agit de la première étape pour améliorer le processus de publication et obtenir ainsi plus de qualité et de flexibilité tout en réduisant les coûts.

Pourquoi choisir la création de contenus XML ?

Parce que la création de contenus non structurés — la base des logiciels de traitement de texte et de PAO — n'est plus en mesure de répondre aux exigences de publication des entreprises qui doivent fournir toujours plus d'informations de meilleure qualité, et à un tarif inférieur, pour davantage de types de supports.

Mais avec les logiciels de publication classiques, les rédacteurs ne se contentent pas de créer les informations : ils doivent également les mettre en forme et contrôler chaque élément de la mise en page, un processus extrêmement laborieux qu'il faudra répéter pour chaque type de support : 
  • papier, 
  • Web 
  • numérique. 
En outre, pour réutiliser les informations, il faut procéder par copier-coller, d'où la création de copies redondantes qui doivent être relues, traduites et mises à jour séparément, et ce aussi longtemps que les informations vivent. Ces carences entraînent des problèmes de précision, d'accessibilité et de présentation des informations car le volume de travail est trop important et accroît les risques d'erreur.

Fonctions de création XML

Pour surmonter les inefficacités liées au contenu non structuré, la création de contenus XML offre 5 avantages clés.

1/Dissociation du contenu et de sa mise en forme : 

au lieu d'appliquer une mise en forme pour différencier les divers éléments d'un document (par exemple, faire en sorte qu'un titre soit plus grand qu'un sous-titre), le rédacteur définit la fonction de chaque élément. Par exemple, il peut désigner le titre sous la forme <title>, et non pas 24 pt. Arial Bold.

2/Publication automatisée : 

les documents XML ne contenant aucune information de mise en forme, un système de publication peut appliquer séparément une mise en forme via un processus automatisé. Par exemple, le système peut désigner un élément <title> sous la forme 24 pt. Arial Bold dans la version papier et sous la forme 12 pt. Verdana sur un téléphone mobile. Ainsi, les rédacteurs n'ont pas à se soucier de la mise en forme et de la conception, des tâches laborieuses pouvant monopoliser le tiers voire la moitié de leur temps de travail.

3/Publication multicanal : 

vous pouvez publier automatiquement vos informations pour différents types de supports : papier, Web et terminaux mobiles. Cette méthode évite à un autre groupe de devoir créer manuellement chaque type de support supplémentaire, un processus long, coûteux et risquant d'induire des erreurs.

4/Composants réutilisables : 

le format XML permet aux rédacteurs de fractionner leurs documents en plusieurs composants réutilisables. Au lieu de copier-coller le contenu, ils peuvent réutiliser un composant simplement en y faisant référence. En cas de modification du composant original, tous les documents qui l'utilisent peuvent être automatiquement mis à jour avec la dernière version des informations de ce composant. Cette méthode améliore la précision et la cohérence des données.

5/Personnalisation : 

le format XML permettant de fractionner les documents en plusieurs composants, vous pouvez assembler automatiquement ces composants afin d'obtenir des publications personnalisées en fonction des besoins de chaque public, ce qui augmente la satisfaction du client.
---

Création XML depuis Quark

Quark Author est un logiciel basé sur le Web conçu spécifiquement pour permettre aux utilisateurs métier de créer du contenu XML, mais dans un environnement de traitement de texte familier, laissant le XML dans les coulisses. Les rédacteurs peuvent créer et réutiliser des composants de contenu qui sont gérés avec Quark Publishing Platform.

Quark XML Author for Microsoft® Word permet à chaque utilisateur de créer du contenu XML structuré dans Microsoft Word. Conçu pour une prise en main facile et rapide, Quark XML Author établit les bases d'un système de publication automatisé capable de rationaliser votre processus de publication, d'augmenter la cohérence de vos informations et d'améliorer ainsi les résultats de votre entreprise.
Lancé en 2002, Quark XML Author™ for Microsoft Word est un outil de création XML de nouvelle génération. Il se présente sous la forme d'un module complémentaire pour Microsoft Word qui permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation.

XML : le meilleur moyen de créer des informations

Le XML est une norme complexe et le fait de devoir se servir d'outils logiciels spécialisés le rend encore plus compliqué à apprendre pour les rédacteurs.

Création de documents XML dans Microsoft Word

Quark XML Author for Microsoft Word permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation. Quark XML Author est un module d'extension pour Microsoft Word qui permet aux rédacteurs de créer des composants d'information utilisables directement dans Quark Publishing Platform, qui les combine automatiquement de manière appropriée pour produire des documents imprimés de grande qualité ou des versions numériques pour le Web ou d'autres supports électroniques.

Comme Quark XML Author fonctionne au sein même de Word, vous pouvez le déployer dans toute votre entreprise de manière à profiter des gains d'efficacité et des améliorations apportées à tous les documents issus des différents services grâce au format XML.

Quark_Publishing_Platform

Les modules de Quark Publishing Platform fonctionnent de manière complémentaire pour permettre l'assemblage automatisé et la publication multicanal de contenu pour différents publics et types de médias.

La plate-forme constitue une solution de publication personnalisable complète facilitant la création de communications ciblées et pertinentes qui améliorent la relation avec le client et renforcent son niveau de satisfaction. Outre le papier et le Web, Quark Publishing Platform prend également en charge la réutilisation et la réorientation du contenu et de la mise en page pour la diffusion de communications numériques interactives riches et attrayantes pour les terminaux mobiles et les tablettes.
voir photo au début de ce post.

Pour en savoir plus, merci de sélectionner un des modules de Quark Publishing Platform sur:
http://www.quark.com/fr/Products/Quark_Publishing_Platform/How_It_Works.aspx
l est rigolo de voir que quark a utilisé adobe edge 5.0 (librairie js) qui n'est plus développé depuis fin 2015...

ref

http://www.quark.com/fr/Solutions/Content-Automation/Digital-Publishing.aspx

Sunday, July 23, 2017

screenshot & OCR & copy paste google books & comparison converter image to pdf word onenote evernote



This post is in french & english... Sorry.
Désolé ce post est en français et anglais.

L’OCR, sigles de Optical Character Recognition est une technologie conçue pour analyser la structure de l’image du document et puis diviser le document en caractères, tableaux et images et aussi équations (sur une ligne)... Ensuite, le programme peut reconstituer la mise en page et les éléments en un texte modifiable.

Le convertisseur PDF est également capable de transformer un document PDF en Word, Excel ou d’autres formats éditables. Mais ce genre de logiciel ne permet que de changer le format de fichier sans analyser le contenu du texte ou sans extraire les caractères. Autrement dit, après la conversion de PDF, vous recevez quand même un fichier non modifiable contenant des images.

Ici nous intéressons à la rapidité de traitement lorsque l'on fait une copie d'écran d'un site qui protège le texte (produit du texte visualisable en image, ou comme google books ou les livres/articles en streaming).

If you don’t have a scanner, your phone or a camera can be used in place of one. There are a number of apps in the App Store (iOS mac)  android win GNU/linux that “scan” physical documents into clean PDFs using a phone’s camera.
Evernote's Scannable is just one of several apps that allows you to scan documents with your smart phone (see below).

Comparison of OCR softs

https://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software

5 best commercial OCR softs

Abby FineReader

v14 windows and only v12 mac 12.1.6 supported macOS 10.12 Sierra (120€)
perpetual licenses
199€ (Convert PDFs and scans; Edit and comment PDFs)
or 299€ (and Compare documents  and Automate conversion 5000pages/month)

FineReader 14 offers new and enhanced features including wide range of PDF editing tools, document comparison feature and even more perceptive OCR for document conversion. Plus, faster performance across the board — from launching app to opening and converting.
PDF editing
Create PDFs from Word, Excel, and other formats
Retain text styles when exporting to Word
Single-line math formulas support
https://www.abbyy.com/en-eu/finereader/whats-new/comparison-charts/

10€ for this small utilities
https://www.abbyy.com/fr-fr/screenshot-reader/
and alternatives http://alternator.link/software/abbyy-screenshot-reader

ABBYY Real-Time Recognition SDK for mobile apps.
Extracting text directly from the smartphone’s preview screen is significantly faster and more convenient than taking a picture of the text followed by an OCR step

ABBYY Mobile Imaging SDK
The toolkit to analyze photos of documents captured with mobile devices to determine whether they are suitable for OCR or enhance their visual quality.

PDFELEMENT

59€
mac/PC
Autre point fort de l’outil, il est capable de rendre les formulaires numérisés modifiables et d’exporter les données numérisées au format CSV.

http://www.leptidigital.fr/technologie/logiciels-ocr-8915/

Omnipage

Omnipage 18 windows XP to 10
99€
educ: 69€

SDK win, linux, mac
http://www.nuance.fr/for-business/by-product/omnipage/for-developers/index.htm
http://www.nuance.fr/for-business/by-product/omnipage/for-developers/csdk-for-mac/index.htm

Readiris

Readiris 16
99€
mac/pc/iOS
OSX 10.9, 10.10,10.11 and 10.12
http://www.irislink.com/EN-US/c1466/Readiris-16-for-Macintosh---OCR-Software.aspx

Create indexed PDF files
This format is identical to the original PDF file except that it adds a layer of indexed text. This means you can easily search for the information you need in a document or a large volume of archived documents.
SDK
http://www.irislink.com/EN-US/c1096/iDRS-15.aspx

Skysoft PDF Editor 6 Professional for Mac or Win

commercial 99€
https://pdf.iskysoft.com/6std-vs-6pro.html

Renee PDF

par un français et gratuit mais que windows et pas open source
https://www.reneelab.fr/product-land-337.html

Ref

https://pdf.wondershare.fr/pdf-editing-tips/pdf-ocr-software.html

Prise de note, de scan, de photo et OCR limité

Greenshot

free soft and open source 
only windows
http://getgreenshot.org/
Greenshot is a light-weight screenshot software tool for Windows with the following key features:

Quickly create screenshots of a selected region, window or fullscreen; you can even capture complete (scrolling) web pages from Internet Explorer.
Easily annotate, highlight or obfuscate parts of the screenshot.
Export the screenshot in various ways: save to file, send to printer, copy to clipboard, attach to e-mail, send Office programs or upload to photo sites like Flickr or Picasa, and others.
...and a lot more options simplyfying creation of and work with screenshots every day.

Being easy to understand and configurable, Greenshot is an efficient tool for project managers, software developers, technical writers, testers and anyone else creating screenshots.

Screenshot to Speech

6€
http://macgenius.co/app/Screenshot-to-Speech/955098738
Poor OCR recognition

picatext

osx 10.12
4€
You need to get the text out of an image or from anywhere on your screen? With picatext this is as easy as selecting a file or a screen area. So now you can get the text you need in almost no time. No need to tediously typewrite everything again.
picatext is OCR made simple. We included just the functionality you need. Nothing that might distract you. That helps focusing on the important things and saves you a lot of time.
These are the awesome features of picatext:
- get text from images
- extract text from your screen
- supports the recognition of over 40 languages
- start screen selection by shortcut
- text gets copied to clipboard automatically
- set the font of the output text
http://www.macdrifter.com/2013/10/picatext-for-image-ocr-on-mac.html

Prizmo

50€
https://computers.tutsplus.com/tutorials/5-ways-to-ocr-documents-on-your-mac--mac-49683
https://creaceed.com/prizmo
https://itunes.apple.com/app/id546392952
Prizmo is a dedicated OCR app. It isn’t designed to help you crop or straighten your scanned documents, it’s sole purpose is to analyse the text of any scans and convert it into searchable text. It’s not just limited to plain text documents such as receipts and correspondence, Prizmo will even analyse old newspapers and magazines, book covers, pretty much anything with any shape, size and colour of text is something Prizmo will convert.
Prizmo includes the ability to capture scans directly from Image Capture, OS X’s built-in camera and scanner import app, so you can use it in conjunction with any existing scanner. You can also import existing files if you’ve been scanning them already.

Skim Clip

very good software.
It's the best for screenshot and built-in OCR.
http://www.domloveskim.com/software/skim-clip/#download
http://kimlovingnews.blogspot.fr/2012/08/skim-clip-11-headed-to-mac-app-store.html (the last post=dec 2012).
https://maczot.com/discuss/2012/11/23/skim-clip1353651425/

oldies dec 2012; shareware 10$. only MAC >10.6. Works on sierra 10.12.
The trial version is limited to 10 minutes of use at a time and has a 10 second delay at start up.

It uses tesseract (which support for a number of new image formats was added using the Leptonica library http://www.leptonica.com/). Leptonica is a pedagogically-oriented open source site containing software that is broadly useful for image processing and image analysis applications.
In addition to the freeform selection, we've added (v 1.1) a few more features such as playing a sound when clipping, an option to remove all headers from the exported output, and the ability to use a script to filter the OCR text before it is saved as a clipping. This last feature, filtering, is particularly interesting because it opens up many work flow possibilities as you may apply your understanding of UNIX and scripting tools like sed (https://en.wikipedia.org/wiki/Sed) and Perl to perform all kinds of creative transformations and processing on the scanned text.
Skim Clip is a unique new utility for OS X that combines Optical Character Recognition (OCR) with screen capture features to create a powerful and convenient new way of saving and organizing your information.
Using Skim Clip, you can capture the contents of any window, scan and save all its text including words in images, and store it into organized categories - all with a single keypress.
With the clipping converted into scanned computer text, you can instantly search thousands of clippings to find what you're looking for. Like a photographic memory with a search engine, Skim Clip makes it easy to keep, find, and reuse anything that's ever on your screen!

Features (v 1.0) include:
* Instantly clip with a single hot key from any application
* Fast and accurate OCR text conversion of any screen
* Scales to easily manage thousands of clippings
* Very quickly search OCR text, notes, and more
* Reuse your clipping by emailing, saving, and pasting them
* Present your clippings with slideshows and quicklook
* Create clipping categories and subcategories
* Export dozens of clippings in a single click
* Browse your clippings as thumbs or a listing
* Get visual feedback and categorize anywhere with the status menu
* Set your own hot key, export style, and more
* Automated custom scanned text processing
* Integrate Skim Clip into your workflow with AppleScript
* Double tap the hot key to instantly add a note for extra convenience
* Elegant interface to help keep your clips organized
* Keep focused on your work with Skim Clip always ready
* Optimized OCR for English with support for other languages

Version 1.1:
Clip anywhere on the screen by holding the clip hot key for freeform selection
Custom filtering of scanned text for advanced processing
Automate clipping with AppleScript
Improved image processing for better accuracy
Sound effect when clipping
Option to remove headers when exporting
Increased mail export compatibility
Plain text...

We've been invited to share the following comments from one Jim Miller, author of the well-regarded Rabbi Hawkins Mystery Series. Here's what Mr. Miller has to say about Skim Clip:
Skim Clip is amazing. I’m usually disappointed by Apps that claim to do everything, including saving the world, and then do nothing at all. That is not the case with Skim Clip. It does exactly what the developer says it will do. It is a screen capture and OCR combo that works.
Another plus for this program is the obvious time and effort that has gone into making the user manual simple and easy to understand. I was able to walk through the step-by-step instructions and capture a variety of screen shots. I do a lot of screen shots with the Mac’s commands, but they all end up as jpegs. With Skim Slip, I get the jpeg and if I choose, I can convert it into text and then insert it into Word, Pages and Scrivener very easily.
This is a timesaver I love. I used to cut and paste a captured image into a word processor or have it up on the screen so that I could then type the content into some other program just to make it useable. Not anymore. With Skim Clip, it’s all done for me.
Many thanks to Dominic and Kimberly,  (DomLovesKim Company)
Jim Miller
http://kimlovingnews.blogspot.fr/2012/10/from-author-using-skim-clip.html

Only for Intel, 64-bit processor, Mac OS X 10.6 or later, 64-bit processor
put the text OCR in the copy-buffer.

I try this soft on MAC 10.12.5 on chrome and others browsers :  it's the fastest.
Some minor pb with OCR when characters are tiny, just expand your window or try increasing your application's font size.
If you want another soft (but also oldies 2013), use PDF OCR X Community Edition (it also uses this Tesseract code) is a simple drag-and-drop utility for Mac OS X and Windows, that converts your PDFs and images into text documents or searchable PDF files. You must save the screenshot to a file (img) and drag-and-drop to it and copy the text. Then Skim Clip is faster and far better.

LEADTOOLS OCR App Review and SDK

iOS and android
https://www.leadtools.com/blog/document-imaging/leadtools-ocr-app-review/

OneNote

use Microsoft OneNote's built-in OCR functionality (free for Windows/Mac) ; it's in Pack Office.

menu
copy img
(right clics) copy picture to text

https://webapps.stackexchange.com/questions/57418/how-can-i-copy-paste-segments-from-google-books
In OneNote, users can enter typed text via keyboard, create tables, and insert pictures. However, unlike a word processor, users can write anywhere on a virtually unbounded document window by just clicking there. Also, users do not need to explicitly save their work – OneNote saves data automatically as the user works.
Microsoft also announced a number of new features in OneNote that use the service API:
OneNote Clipper: A browser bookmarklet that uses the OneNote service API and enables users to save a screenshot of a webpage to OneNote along with the link. The text in the screenshot is made searchable using Optical Character Recognition
https://en.wikipedia.org/wiki/Microsoft_OneNote

Evernote

As well as the keyboard entry of typed notes, Evernote supports image capture from cameras on supported devices, and the recording of voice notes. In some situations, text that appears in captured images can be recognized using OCR and annotated. Evernote also supports touch and tablet screens with handwriting recognition. Evernote web-clipping plugins are available for the most popular Internet browsers that allow marked sections of webpages to be captured and clipped to Evernote. If no section of a webpage has been highlighted, Evernote can clip the full page. 
Where suitable hardware is available, Evernote can automatically add geolocation tags to notes.

In 2010, the coding language for the suite was changed from C# for version 3.5 to C++ in version 4.0 to improve performance.
On supported operating systems, Evernote allows users to store and edit notes on their local machine, using a SQLite database in Windows.

The Evernote software can be downloaded and used as "stand-alone" software without using the online portion of an Evernote account (online registration is required for initial setup, however), but it will not be able to upload files to the Evernote server, or use the server to synchronize or share files between different Evernote installations. Also, no image or Image-PDF (Premium only) recognition and indexing will take place if the software is used entirely offline.

In June 2016, Evernote announced the limitation for users of its free Basic account to two devices per year and raise prices for its premium service tiers.Non-paying Evernote user is able to sync notes between two devices.

https://en.wikipedia.org/wiki/Evernote
https://help.evernote.com/hc/fr

Evernote does OCR images so they're searchable,  but the text is not extractable from the image.  OneNote is better for that specific use case - the text (or the best approximation of it) is available in a separate window to be copied and pasted elsewhere.  Voice to text is part of Evernote,  though you'd need to use one of the specialist pen inputs if you want to choose specific parts of the text to hear again.
in fact no OCR (may be with premium and for some specific img (buz card)).


Evernote with other apps:
Skitch is a free screenshot editing and sharing utility for OS X (iOS, Windows, and Android). The app permits the user to add shapes and text to an image, and then share it online. Images can also be exported to various image formats. Originally developed by Plasq, Skitch was acquired by Evernote on August 18, 2011. On December 17, 2015, Evernote announced that it will be ending support for Skitch for Windows, Windows Touch, iOS, and Android on January 22, 2016. Evernote said it will continue to offer Skitch for Mac and  iPad iPhone.
https://evernote.com/intl/fr/products/skitch

8 choices:
  1. Capture Viseur 
  2. Zone de capture précédente
  3. Capture viseur différé 
  4. Capture plein écran 
  5. Capture fenêtre... 
  6. Capture menu...
  7. Capture avec |'appareil photo... 
  8. Ouvrir une Image ou un PDF...

Scannable
If you're a die-hard Evernote user, Scannable may be the best option for you...assuming you use an iOS device, that is. Scannable on the iPhone and iPad allows you to instantly scan business cards, sketches, receipts, paper documents, and even multi-page documents with ease, and automatically file and organize the resulting images and files in your Evernote account. Your scans are automatically cropped to remove backgrounds (like the table behind the recipt, for example) and enhanced so the text is readable. If you scan a business card, the contact information from the card is automatically lifted and added to a contact card, so you can call the person, email them, or visit their website or social presence with a single tap. It's relatively new, and while it works best with Evernote, it also allows you to share your resulting scan with other apps on your iOS device, so you can upload it to Dropbox, email it, or save it to your camera roll. Best of all, it's completely and totally free—no unlocks, no premium version, although it definitely works best if you also use Evernote.
It is the business card wingman that knows the card is significant only because of the information it holds. While the paper is trivial, its words are full of potential. Once you connect to Evernote and LinkedIn, Scannable immediately digitizes every business card you scan. It takes that information and adds in details from your contact’s LinkedIn profile, including a photo, so you’ll always be able to put a face to the name. Instantly save the person to your contact list and feel free to ditch the paper entirely (we won’t tell anyone).
Scannable captures the paper in your life quickly and beautifully, transforming it into high-quality scans ready to save or share. Whether on the go or at the office, send paper on its way and move on.
Evernote's Scannable is just one of several apps that allows you to scan documents with your smart phone.
only for iPad & iPhone.

penultimate
Penultimate is the award-winning digital handwriting app for iPad that combines the natural experience of pen and paper with power of Evernote’s sync and search features. Lose the paper, keep the handwriting.
only for ipad
https://evernote.com/intl/en/products/penultimate

Evernote Web Clipper
Save webpages forever
From interests to research, save anything you see online—including text, links, and images—into your Evernote account with a single click.
plug-in for many browsers
https://evernote.com/intl/en/products/webclipper

evernote inc  and github
https://github.com/evernote

 Evernote and OneNote

comparison between 

Google OCR and drive

Google Drive includes a little-known free OCR tool that is a powerful, easy to use image to text converter.
Google Drive currently supports OCR for .jpg, .gif, .png, and PDF files up to 2MB in size

To add your documents to Google Drive to get them OCRed, first go in to your Google Drive account. On the My Drive page, click the My Drive button next to the New button on the left side of the page. Select Upload Files.
Use the Upload files option to upload a file to Google Drive. Find the file that you want to convert from PDF or image to text. Click the Open button. 
The document now appears in your Google Drive. Right-click on the document to bring up a drop-down menu.
Click the Open with option and click Google Docs. A sheet icon appears while the file is downloading. Google is now in the process of converting your PDF or image file to text with OCR.
The file will open in Google Docs with the PDF converted to text, but with little formatting applied. You can now edit and format the new text file as you like.
You will get:


Tutorial:

Free and Open soft

https://turtlapp.com/docs/
no OCR

Free Open source OCR

Comparison of the 3 open source OCR

Tesseract 

Tesseract has unicode (UTF-8) support, and can recognize more than 100 languages "out of the box".
Tesseract supports various output formats: plain-text, hocr(html), pdf, tsv, invisible-text-only pdf.
You should note that in many cases, in order to get better OCR results, you'll need to improve the quality of the image you are giving Tesseract.
Tesseract does various image processing operations internally (using the Leptonica library) before doing the actual OCR. It generally does a very good job of this, but there will inevitably be cases where it isn't good enough, which can result in a significant reduction in accuracy.
Installing Tesseract
You can either Install Tesseract via pre-built binary package or build it from source.
Supported Compilers are:
  • GCC 4.8 and above
  • Clang 3.4 and above
  • MSVC 2015, 2017
The Tesseract engine was originally developed as proprietary software at Hewlett Packard labs in Bristol, England and Greeley, Colorado between 1985 and 1994, with some more changes made in 1996 to port to Windows, and some migration from C to C++ in 1998. A lot of the code was written in C, and then some more was written in C++. Since then all the code has been converted to at least compile with a C++ compiler. Very little work was done in the following decade. It was then released as open source in 2005 by Hewlett Packard and the University of Nevada, Las Vegas (UNLV). Tesseract development has been "sponsored" by Google since 2006.
https://en.wikipedia.org/wiki/Tesseract_(software)
Tesseract is executed from the command-line interface.
Basic command line usage:
tesseract imagename outputbase [-l lang] [--oem ocrenginemode] [--psm pagesegmode] [configfiles...]
For more information about the various command line options use tesseract --help or man tesseract.
GUIs and Other Projects using Tesseract OCR
While Tesseract is not supplied with a GUI, there are many separate projects which provide a GUI for it. One notable example is OCRFeeder (end 2014).
https://github.com/tesseract-ocr/tesseract/wiki/User-Projects-%E2%80%93-3rdParty

PDF OCR X (uses this Tesseract code) is a simple drag-and-drop utility for Mac OS X and Windows, that converts your PDFs and images into text documents or searchable PDF files. It uses advanced OCR (optical character recognition) technology to extract the text of the PDF even if that text is contained in an image. This is particularly useful for dealing with PDFs that were created via a Scan-to-PDF function in a scanner or photo copier.
mac/win
0€=Limited to single-page images and PDFs (pro=29€ for unlimited pdf size)
http://solutions.weblite.ca/pdfocrx/

other projects with tesseract code

  • Online OCR services
  • Android/iOS
  • ocr-fileformat is a converter: Validate and transform between OCR file formats (hOCR, ALTO, PAGE, FineReader)
  • Audiveris is an open-source Optical Music Recognition software which processes the image of a music sheet to automatically provide symbolic music information in MusicXML standard.
  • Wolfram Mathematica 9.0 use tesseract for recognizing text
  • OCRmyPDF - Adds OCR text layer to scanned PDF files and images, allowing them to be searched. Processes pages in parallel on multi-core CPUs. Keeps exact resolution of original embedded images without recompressing JPEGs, when possible. Includes image several preprocessing options, detailed documentation, and support for many exotic PDFs.
  • Tally-Ho: Tally-Ho is a screen reader intended for sites like google books
    https://code.google.com/archive/p/tallyho/
    Tally-Ho is a screen reader intended for sites like google books (though it will also read anything copied to the clipboard). google books is a great site, especially if you're a Ph.D. student - however, for people who are visually impaired or dyslectic (or, like my gf, both...), it is quite inaccessible. Tally-Ho uses the Tesseract OCR engine (thanks google!) to convert the screen capture to text, so it can read graphic based sites such as google books. tested on windows xp sp2 w/at&t natural voices & vista w/microsoft
    End of dvpment 2008
  • IMPACT is a project funded by the European Commission. It aims to significantly improve access to historical text and to take away the barriers that stand in the way of the mass digitisation of the European cultural heritage. END = 2012 and other forks...
    http://www.impact-project.eu/
  • MathOCR Features mathematical formula recognition and logical layout analysis, can use OCR engines like Tesseract or Ocrad as back-end. https://github.com/chungkwong/MathOCR
    END=2015.

GOCR

END=2013

Cuneiform

https://en.wikipedia.org/wiki/CuneiForm_(software)
END=2011

web services OCR


Friday, July 21, 2017

install MacTeX june 2017, TeX LaTeX AMSTeX TeXShop BibDesk LaTeXiT TeXLive --> 5.8 Gb



MacTeX-2017
June, 2017
For Yosemite (macOS 10.10) and Higher

This installer provides all the software needed to use the TeX typesetting system on Mac OS X. All of the software is fully configured and ready to use. Included are

  • the actual TeX program, and the XeTeX extended version with Unicode and native font support;
  • macro packages, such as LaTeX, AMSTeX, and ConTeXt
  • TeXShop, graphical user interface for TeX
  • Ghostscript, required by certain TeX utilities

A custom install option is available for users who only need some of the software provided.

If you are new to TeX, consult the README installed in /Applications/TeX to begin learning and using TeX.
---

This installer provides all the software needed to use the TeX typesetting system on Mac OS X. All of the software is fully configured and ready to use. Included are
  • the actual TeX program, and the XeTeX extended version with Unicode and native font support;
  • macro packages, such as LaTeX, AMSTeX, and ConTeXt
  • TeXShop, a graphical user interface for TeX
  • Ghostscript, a free postscript interpreter used by certain TeX utilities
  • BibDesk, an editor for BibTeX databases
  • LaTeXiT, a utility to typeset LaTeX equations and export the resulting PDF by drag and drop
  • TeX Live Utility, a utility to administer TeX Live and update packages in it over the network
  • cocoAspell, an extension of Apple's built-in spell checker which understands LaTeX
  •  Excalibur, a spell checker for TeX source code

The underlying TeXLive distribution is extensive, containing most binaries, fonts, styles, and packages used in the TeX community. It is a repackaging of the full TeX Live distribution from the TeX Users Group (TUG), and installs that distribution exactly as it would appear if installed from the TeX Live DVD.

A custom install option is provided for users who want only part of the package. The package contains Ghostscript; users who already have Ghostscript may want to use custom install to avoid the version provided here. 

Among the programs installed by the package is TeXShop, a graphical interface to the TeX typesetting tools. TeXShop will be in your Applications folder in a subfolder named TeX and you can drag its icon to the dock if you wish. The TeX folder contains a README file explaining technical details of TeX Live for experienced users, and explaining how to start using and learning TeX for beginners.

Some programs in TeX need to know whether you are using letter-size paper or A4-size paper. The installer tries to guess the answer from your printer's default paper setting. This will work in almost all cases. If you run into problems, run TeX Live Utility in /Applications/TeX and select "Change Paper Size..." in the Actions menu. 

The installer adds BibDesk, Excalibur, LaTeXiT to the TeX folder in your Applications folder. All are standard Mac programs which can be uninstalled by just dragging them to the trash.

The TeX typesetting system consists of several command line programs and a large number of supporting files. These tools are installed in /usr/local, a directory not visible in the Finder. Inside the system Library folder you will find a subfolder named TeX; the Root file inside this folder is a link to the TeX directory tree which makes it visible to the Finder. So you can examine the files if you are curious.  It is usually not necessary to look at the command line files because they are automatically accessed by TeX as needed. 

If you have used TeX on another system, you may have needed to modify $TEXINPUTS, $PATH, and other shell variables; these are handled automatically on Mac OS X. Occasionally you will want to add additional style files and the like to TeX; to do so, create the directory "texmf" inside your personal Library folder in your home directory, and put additional files in subdirectories of this folder. For instance, LaTeX will find any file in

~/Library/texmf/tex/latex

or a subdirectory of this folder.


For more information about TeX, see http://tug.org, in particular http://tug.org/begin.html for links to a number of introductory resources. For more information about this MacTeX distribution, see http://tug.org/mactex.

Ref

http://www.tug.org/mactex/mactex-download.html

Wednesday, July 19, 2017

ajlsm et maîtrise technologique de la plate forme Cyberdocs, orientée vers la production, l'archivage et la diffusion électroniques des documents scientifiques


cyberthèse/cyberdocs  lyon2

Hélas cela date de plus de 10ans pour cyberthèse/cyberdocs avec abandon.
https://sourcesup.renater.fr/cybertheses/ --> 404
https://sourcesup.renater.fr/projects/cyberdocs/
date de 2009 sans MAJ.
https://sourcesup.renater.fr/scm/?group_id=28
https://sourcesup.renater.fr/scm/viewvc.php/trunk/?root=cyberdocs
https://github.com/fabdsp

mais:
http://www.univ-lyon2.fr/bibliotheques/theses-en-ligne-452917.kjsp?RH=WWW309PUB
est opérationnel.
L'université Lyon 2 archive et diffuse en format numérique les thèses soutenues. Cette politique qui est mise en œuvre de manière systématique depuis 2000, permet l'archivage et la diffusion sur internet de plus de 1600 thèses.

De plus Pleade est toujours actif.

De Latex vers un archivage pérenne et une diffusion électronique ouverte

LaTeX est un logiciel de composition de documents ou plus exactement une collection de macro commandes destinées à faciliter l'utilisation du processeur de TeX. Il est particulièrement utilisé dans les domaines techniques et scientifiques pour la production de documents de taille moyenne ou importante. Les qualités de mise en forme des documents, notamment mathématiques, et leur impression ne sont plus à démontrer.
Mais à l'heure où la publication scientifique électronique est en voie de banalisation, il est extrêmement difficile de convertir un document natif LaTeX vers le format XML qui est devenu le standard de fait des documents électroniques. XML permet, entre autres, de garantir un archivage pérenne et grâce à son environnement une accessibilité la plus large possible en intégrant et en supportant des normes annexes en matière de codage des caractères (Unicode) ou de transcription des formules mathématiques avec MathMl.
La conversion des documents LaTeX vers XML est un sujet délicat à plus d'un titre. Une tradition ancienne chez les utilisateurs de LaTeX veut qu'en dehors de leur outil préféré, point de salut. Une réaction nouvelle de la part des éditeurs scientifiques universitaires ou commerciaux met en avant l'obligation de l'accessibilité et de l'ouverture dans le respect des normes et des standards qui facilitent la communication scientifique ouverte.
Dans le secteur de la publication électronique des thèses, cette discussion n'a pas débouché sur des solutions satisfaisantes. Cyberdocs diffuse les thèses « LaTeX » au format « pdf » ce qui est insatisfaisant. Mais le groupe qui animait le programme Cyberthèses représentait plutôt les sciences humaines et sociales : nous n'avions donc pas de légitimité disciplinaire. Mais au hasard de rencontres et de débats, nous avons croisé la route d'un éditeur scientifique qui était confronté au même problème : comment convertir au format XML, nécessaire pour un archivage pérenne et une diffusion électronique ouverte, des documents scientifiques composés avec LaTeX pour être imprimés ?
Ce programme a réuni autour de la conversion des documents scientifiques écrits en LaTeX vers XML, l'équipe EDP Sciences (éditeur scientifique) qui a fait de l'édition scientifique électronique ouverte un de ses objectifs prioritaires, le groupe Cyberthèses, avec la société AJLSM qui porte la maîtrise technologique de la plate forme Cyberdocs, orientée vers la production, l'archivage et la diffusion électroniques des documents scientifiques et des membres de la communauté scientifique utilisateurs de LaTeX. Ce sont les résultats obtenus que nous vous présentons.
La réalisation d'un objet logiciel, un convertisseur, repose sur l'étude et l'analyse des modèles de documents scientifiques et des pratiques qui en découlent. L'objet « thèse » a été considéré comme un exemple particulier d'un problème plus général concernant tous les types de documents et notamment les articles de revues. L'intégration dans la plate forme Cyberdocs sera possible grâce à un convertisseur qui amènera les documents vers le format TEILite utilisé par Cyberdocs.
Mais ce convertisseur sera également adapté aux autres types de documents : articles, revues, ouvrages, rapports scientifiques ou techniques en étant compatible avec les principales DTD existantes : Journal Publishing, TEI Lite, Docbook. L'évolution de cet outil est ouverte aux contributions de l'ensemble de la communauté, c'est pour cela qu'il sera distribué sous une licence libre.
Ce programme a reçu le soutien financier de la DIST du CNRS et de la D.G.R.I. du ministère de l'enseignement supérieur et de la recherche.

Ref

http://theses.univ-lyon2.fr/files/presentation-28.pdf

plate-forme Cyberdocs

La plate-forme Cyberdocs permet de structurer des documents issus de traitements de texte et de les publier sur Internet, à l'aide de la norme XML et la DTD TEI Lite.
Elle est aujourd'hui principalement utilisée comme nouvelle plate-forme de traitement et de diffusion des thèses dans le cadre du projet Cyberthèses, un programme francophone d'archivage et de diffusion électronique des thèses, qui regroupe de nombreuses institutions francophones ou non à travers le monde.
Cette plate forme de conversion, placée sous licence GPL, a été réalisée avec l’aide de la société AJLSM (http://www.ajlsm.com/produits/cyberdocs), et est diffusée en Afrique, dans l’Amérique du Sud, en Suisse et en France.
Voir le site officiel de Cyberdocs : http://www.cyberdocs.org/fr/home (non actif).
http://www.univ-lyon2.fr/bibliotheques/theses-en-ligne-452917.kjsp?RH=WWW309PUB

AJLSM

Depuis 1999, AJLSM propose des solutions ouvertes, pérennes et efficaces pour créer, convertir, gérer, diffuser ou archiver votre information numérique.
Trois concepts sont la plupart du temps à la base des solutions que nous proposons : la normalisation, XML et les logiciels libres. Associées de manière optimale, ces approches permettent d'obtenir des systèmes d'information documentaire où les technologies sont au service de l'information, et non l'inverse.
AJLSM est aujourd'hui un acteur reconnu dans les domaines du patrimoine culturel et de la documentation scientifique. Nous avons participé à de nombreux projets dans ces domaines, avec des partenaires prestigieux, en France, en Europe et au Canada.
AJLSM propose des produits libres, développés dans le cadre de nos différents projets et qui bénéficient aujourd'hui à une communauté beaucoup plus large.

Les produits Logiciels libres

AJLSM est impliqué dans plusieurs projets de logiciels libres.
Pleade, outil de publication de corpus documentaires hétérogènes, incluant un moteur de recherche, un harvester, un visualiseur, pour instruments de recherche archivistique en format EAD Encoded Archival Description (http://www.loc.gov/ead/) , pour la presse avec reconnaissance optique de caractères (format xml METS, xml ALTO), etc.
http://pleade.com/
Notix, application bibliographique libre et paramétrable.

Les produits Logiciels non libres

ThesX est un logiciel qui permet de gérer des thésaurus, c'est-à-dire :
  • Créer, supprimer, modifier et exporter le contenu et la structure d'un thésaurus.
  • Rechercher du contenu dans un ou plusieurs thésaurus.
ThesX peut s'intégrer, entre autre, à Pleade dans des formulaires de recherche.
Pleade Plus est un ensemble de fonctionnalités et de modules complémentaires à Pleade.

Pleade

est aussi/surtout un moteur de recherche.
Créé par AJLSM et la Direction de Archives de France en 2001, Pleade est un outil de publication et de diffusion intégrant un puissant moteur de recherche ainsi qu'un moissonneur OAI-PMH (harvester) dans des corpus de documents XML (EAD et EAC-CPF, METS et ALTO, UNIMARC, Nomina, TEI, Dublin Core et Dublin Core Qualifié, BiblioML, MODS, ...).
Pleade suit les normes du responsive design depuis la version 3.59.

Pleade est une solution logicielle libre et open source à destination des archives, bibliothèques et musées. Depuis plus de 15 ans, Pleade permet la valorisation des données patrimoniales suivant un workflow très simple: publier, diffuser et disséminer.

PLEADE is a free software for searching and viewing archival finding aids in XML/EAD // PLEADE est un logiciel libre pour consulter et chercher des instruments de recherche archivistiques en format XML/EAD.

Code

https://sourceforge.net/projects/pleade/

C'est du java.

Dernière version de fin 2016: version 3.59.
PLEADE 3.59 works with Java 8.

PLEADE read-me anglais français

 About pleade-exe-3.59.zip for MAC/Linux or pleade-exe-3.59-windows.zip for Windows

 I - What is this ?
 ------------------

 This folder contains resources for running and testing an application Pleade-3.59.

 II - Installation Linux/Mac
 ---------------------------

 Step 1: Open and place a console in the root of pleade-exe-3.59 directory
 Step 2: If it is not, make executable pleade.sh.
$ Chmod + x pleade.sh

 Step 3: Run pleade.sh with the command
$ ./pleade.sh

 If all OK, after the application server start, Pleade-3.59 will be
 accessible with a web browser at http://localhost:8090/pleade

 To shutdown Pleade-Pleade 3.59 close the console that has served to launch the pleade.sh

 II - Installation Windows
 -------------------------

 Step 1: Create the folder C:\pleade-exe-3.59
 Step 2: Place the entire contents of this directory in C:\pleade-exe-3.59.
At the end of the operation, this path C:\pleade-exe-3.59\webserver
must exist.
 Step 3: Run (double click) the script C:\pleade-3.59\pleade.bat
/!\ If windows's firewall is triggered (alert message)
allow the script to run with the privileges required /!\


 If all ok, after the application server start, Pleade-3.59 will be
 accessible with a web browser at http://localhost:8090/pleade

 To shutdown Pleade-3.59 close the console that has served to launch the pleade.sh.

 III - Terms of Use
 ------------------

 This portable version of Pleade-3.59 is only for testing.
 It is pre-configured with minimum requirements

 For other usage details, read the PLEADE-3.59 license.


///////////////////////////////////////////////////////////////////////////////

 À propos de pleade-exe-3.59.zip pour MAC/Linux ou de pleade-exe-3.59-windows.zip pour Windows

 I - Qu'est-ce-que c'est ?
 -------------------------

 Ce dossier contient les ressources necessaires pour exécuter et tester une application
 pleade-Pleade 3.59.

 II - Installation Linux/Mac
 ---------------------------

 Étape 1: Ouvrir une console et se placer à la racine du répertoire pleade-exe-Pleade 3.59
 Étape 2: Si ce n'est pas le cas, rendre éxécutable le fichier pleade.sh.
$ chmod +x pleade.sh

 Étape 3: Exécuter le fichier pleade.sh avec la commande
$ ./pleade.sh

 Si tout est OK, après le démarrage du serveur d'application, Pleade-3.59 sera
 accessible avec un navigateur internet à l'adresse http://localhost:8090/pleade

 Pour éteindre l'application fermer la console qui a servie à lancer le script pleade.sh.

 III - Installation Windows
 --------------------------

 Étape 1: Créer le répertoire C:\pleade-exe-3.59
 Étape 2: Placer l'ensemble du contenu de ce répertoire dans C:\pleade-exe-3.59,
de sorte que le chemin C:\pleade-exe-3.59\webserver existe
 Étape 3: Exécuter (double clic), le script C:\pleade-3.59\pleade.bat
/!\ Si le par-feu windows se déclanche (message d'alerte),
autoriser le script à se lancer avec les priviléges demandés /!\

 Si tout est OK, après le démarrage du serveur d'application, Pleade-3.59 sera
 accessible avec un navigateur internet à l'adresse http://localhost:8090/pleade

 Pour éteindre l'application fermer la console qui a servie à lancer le script pleade.sh.

 III - Conditions d'utilisation
 ------------------------------

 Cette version portable de Pleade-3.59 est forunit uniquement dans un but de tests.
 Elle est pré-configurée de façons minimale.

 Pour les autres détails d'utilisation, lire la licence de Pleade-3.59.

Ref

https://sourceforge.net/projects/pleade/files/pleade/3.59/