Tuesday, January 17, 2017

sheepshaver an open source powerPC Apple Macintosh emulator



SheepShaver is an open source PowerPC Apple Macintosh emulator. Using SheepShaver (along with the appropriate ROM image) it is possible to emulate a PowerPC Macintosh computer capable of running Mac OS 7.5.2 through 9.0.4. 
Builds of SheepShaver are available for Mac OS X, Windows and Linux.

SheepShaver is considered a good replacement for the Classic Environment which is not available in the most recent versions of Mac OS X.

Please note that SheepShaver requires users to supply a ROM image and a copy of Mac OS.
http://www.emaculation.com/doku.php/macintosh_rom_images

http://sheepshaver.cebix.net/
GitHub:
https://github.com/cebix/macemu

voir dossier caché comme bibliotheque (library) dans mac OS sierra OSX12




AFFICHER LE DOSSIER BIBLIOTHÈQUE SUR MACOS SIERRA (10.12) : VIA LE TERMINAL

Par défaut le dossier Bibliothèque (Library) est masqué. Il suffit d’ouvrir le Finder et de regarder au sein de votre répertoire utilisateur pour vous en apercevoir.

Il suffit d’ouvrir le Terminal depuis le Finder (Applications et Utilitaires) ou de le lancer via une commande Spotlight cmd⌘ + barre d’espace (mot-clé « Terminal »). Ensuite, on saisit la commande suivante suivie de la touche Entrée :

chflags nohidden ~/Library/

http://www.macplanete.com/tutoriels/24881/afficher-le-dossier-bibliotheque-sur-macos-sierra-10-12

Example d'outils open source pour convertir de nombreux fichiers word (docx avec un template) en HTML: part of Macmillan’s Bookmaker toolchain


GitHub  macmillanpublishers/WordXML-to-HTML

word template of macmillanpublishers To others formats

XSL to convert MS Word-generated XML to HTML
https://github.com/macmillanpublishers/WordXML-to-HTML

The wordtohtml.xsl transforms are a key part of Macmillan’s Bookmaker toolchain. These core transforms convert Word XML to HTML that conforms to the HTMLBook spec, and are built-on by a handful of other ruby and XSL transforms to create an HTML file that plugs into the larger Macmillan workflow. Specifically, these XSL transforms are part of the bookmaker_htmlmaker process - you can read about the entire HTML transformation set here.

For well-formed HTMLBook, the wordtohtml.xsl transforms require Word documents to use Macmillan’s Microsoft Word template--a set of predefined paragraph and character styles that add semantic tagging to the different pieces of a manuscript. You can read about the template here. wordtohtml.xsl is built to look for specific Word style names, and apply HTMLBook elements accordingly--this means that in order to get predictable HTMLBook, Word documents must use the Macmillan tag set correctly. You can read about some of the specific markup requirements here.

https://github.com/macmillanpublishers/bookmaker
Welcome to the Bookmaker toolchain! Bookmaker comprises a series of scripts that turn a Word document into an HTML document, and then into a PDF and/or EPUB file.

Each script in the Bookmaker sequence performs a distinct set of actions that builds on the scripts that came before, and depends on any number of other scripts or tools. While most of these scripts were originally written for internal use at Macmillan, we've done our best to hone them down to a cross-platform, generic core that can be used out of the box (though there are still a number of dependencies, discussed further down). The scripts all live here, in the core directory.

It's important to note that correct transformation depends on correct application of the Macmillan Word template, a set of styles and rules for Microsoft Word manuscripts that create the initial structure each manuscript needs in order to cleanly transform into valid HTMLBook HTML.

Automatiser et Convertir de nombreux fichiers doc en docx (ou ODT pdf HTML) d'un seul coup en un seul lot (batch conversion).



Il est préférable de s'appuyer sur les outils word de microsoft en automatisant.
Les autres choix sont ici indiqués pour info.

Command line or Macro

here: mac

with the app automator and word business

If you have Office:Mac 2008 Business Edition or Office:Mac 2011 Home/Business Edition, Automator actions are included with those editions.
One of the Automator actions included with those versions of Office:Mac is
"Convert Format of Word Documents",
and one of the options in that Automator action is PDF.
This page has great information about Automator and Office:Mac.
http://www.agentjim.com/MVP/Automator/IntroToAutomator.html

Cette approche est intéressante si on veut aussi ajouter du texte ou du copier/coller, extraire les images, sauvegarder que le texte...

Command line tool 

Command line tool to convert DOC and DOCX files to PDF
http://apple.stackexchange.com/questions/80791/command-line-tool-to-convert-doc-and-docx-files-to-pdf

macro VBA interne à MS Office

Utiliser la batchmacro pour appliquer une macro à tous tes documents.
Le célèbre batchmacro correspond à

"Comment exécuter sur une série de fichiers une macro créée pour un seul fichier ?"

à télécharger à
http://faqword.com/index.php/word/faq-word/vba-solutions/688-comment-executer-sur-une-serie-de-fichiers-une-macro-creee-pour-un-seul-fichier

Enregistrer une macro avec un fichier .doc en le convertissant en .docx.

La macro n'écrasera pas l'ancien fichier doc.

AppleScript

Word peut ouvrir de nombreux fichiers d'un dossier (classer par type rend la chose plus facile). Hélas il ne sauvegarde pas tous les fichiers ouverts...
puis
vous activez ce script applescript suivant.
Il faut juste le mettre dans automator en choisissant processus et applescript.
Tous les fichiers ouverts dans word sont sauvegardés:
"xx.doc" est transformé en "xx.doc.docx"

---

How about a script? 
Paste this one in AppleScript Editor and run it. It will Save As all open files into the .docx. format and add that as an extension. The resulting files are placed next to the original. Try it first with just a few files, then on increasing numbers while Word does not choke.

You can do a Finder's search for names containing .doc, open those files right there from the results window and then run the script. Finally, repeat the find operation in the Finder, Command-Click on the files you no longer need (duplicates), then trash them.


--------------APPLESCRIPT TO PASTE FOLLOWS--------------------

tell application "Microsoft Word"
   repeat with i from 1 to the count of (documents)
      save as the front document file name path of the front document & ".docx" file format format document
      close front document saving no
   end repeat
end tell

https://answers.microsoft.com/en-us/msoffice/forum/msoffice_word-mso_mac/how-can-i-batch-convert-doc-to-docx-for-my-msword/d6f8a3ac-7641-403a-984c-6f89722dbc28

macro applescript
If you have Home/Student Edition instead of Business Edition, or don't have Office at all, you can accomplish it via AppleScript. Mac OS X Hints has an article about bulk converting text files to PDF via AppleScript, and the comments to that article give some options to convert DOC/DOCX to PDF via RTF. That might result in a loss of formatting or linking if you've got very complex DOC/DOCX files, but might be sufficient for files that aren't terribly complex.
http://hints.macworld.com/article.php?story=20110605113316760

Par un outil gratuit de microsoft

Microsoft has a bulk conversion utility that can convert multiple DOC files to DOCX files.
 This utility has been around for a while, but a fair number of people don’t know of its existence.  Because it’s a powerful tool designed to convert all files on a server (or even a bunch of servers), its use is a little cryptic.  This is fine for IT professionals, but if all you want to do is bulk convert a single directory of DOC files, this post shows what you need to do.

  1. Before you can use this tool, you need to install the Microsoft Office Compatibility Pack.  While the compatibility pack is primarily used with Office 2003 to allow it to load and save Open XML files, in essence, the compatibility pack is comprised of file format converters, which the Office File Converter (OFC) uses.  To use OFC, you need to install the compatibility pack even if you only have Office 2007 installed.  Download the compatibility pack.
  2. Next, you need to download and install the Microsoft Office Migration Planning Manager (OMPM).  This contains a bunch of stuff, but for bulk file conversion, we are primarily interested in just one tool, OFC.EXE.  Download the Microsoft Office Migration Planning Manager.

When installing, as usual, you will select the installation directory.  OFC.EXE is in the Tools directory under the installation directory.  In addition, in that directory, there is a sample OFC.INI file.  To run OFC.EXE, you need to create an OFC.INI, and place it in the directory where you run OFC.EXE from.
https://www.microsoft.com/en-us/download/converting-files.aspx
https://blogs.msdn.microsoft.com/ericwhite/2008/09/18/bulk-convert-doc-to-docx/

Ouvrez, modifiez et enregistrez des documents, classeurs et présentations dans les nouveaux formats de fichier Open XML de Microsoft Office Word, Excel et PowerPoint,

télécharger le Pack de compatibilité Microsoft Office pour les formats de fichier Word, Excel et PowerPoint:
https://www.microsoft.com/fr-FR/download/details.aspx?id=3
Que windows.

---
l’objectif n’est pas de repasser sur ses 200 documents Office disséminés dans son arborescence, mais bien de faire le minimum d’opérations pour tous les convertir au format Office 2007.

J’ai trouvé la solution sur le site de Microsoft. Il s’agit de Microsoft Office Migration Manager, une petite suite d’outils très basiques contenant un outil de conversion des documents Office en ligne de commande nommé OFC.
https://www.microsoft.com/en-us/download/details.aspx?id=11454

Avant de continuer je précise que la suite Office 2007 doit être installée sur votre machine pour que vous puissiez exploiter les fichiers convertit.

http://syskb.com/convertir-en-masse-des-documents-office-2003-vers-office-2007/

avec des outils developers

https://msdn.microsoft.com/fr-fr/library/office/gg188063.aspx

par une version gratuite

doc to docx converter (here for mac):
http://download.cnet.com/s/doc-to-docx-converter/mac-free/

Doxillion Free for Mac

bof
logiciel gratuit pour un usage non commercial.
http://www.nchsoftware.com/documentconvert/
While many file converters have a clunky feel, Doxillion Free Mac Document Converter for Mac provides an easy-to-follow user interface that allows you to complete document conversions quickly. The application easily converts file types such as DOC, DOCX, ODT, and PDF to other file formats. However, the files tend to have spacing and alignment issues once converted.
From NCH Software: Doxillion is a free PDF converter to convert docx, doc, rtf, html, xml, wpd, odt, txt and other text file formats. Convert a single file or batch convert several PDFs at a time. Easily add Doxillion to your right click menu to add fast and simple conversion functionality to all supported formats

par un shareware payant

BatchOutput Office Suite

Automate printing and PDF production from
Microsoft Word, Excel and PowerPoint

Batch Docx Converter

You pay 20$
The license key will be available to you right after the purchase. This key activates the demo version.
Convert Docx <-> Doc Files
Software to convert multiple docx/doc files in seconds!

Batch Docx Converter is a desktop program that will quickly convert multiple Microsoft Office docx to doc, or doc to docx file formats on the Mac or Windows in literally seconds. The software allows you to convert those pesky .docx files into .doc format (or vice versa) without any loss of styling or formating- securely on your desktop.

Top Benefits of Batch Docx Converter:
  • Convert an unlimited number of docx/doc files
    Works both ways: docx -> doc or doc -> docx
  • No technical programming to mess with
    Batch convert your files without any loss of styling and formating.
  • Document conversion in 3 simple steps…
    Drop your files into the application's window, and hit convert - that's it!
My .docx files have complex graphics in them, will the formatting/styling and graphics remain intact after I convert them to .doc files?
Yes, using the software to convert docx to doc or doc to docx will not affect the styling or the format after conversion.



autres softs


par du web services


---

many docx and other files to pdf


NW Docx Converter

Open source

mammoth

Convert Word documents (.docx files) to HTML

DocX is a .NET library that allows developers to manipulate Word 2007/2010/2013 files, in an easy and intuitive manner. DocX is fast, lightweight and best of all it does not require Microsoft Word or Office to be installed.

DocX is also available on GitHub.
https://github.com/WordDocX/DocX
DocX is available on both Codeplex and Github.
https://www.codeplex.com/
CodePlex is Microsoft's free open source project hosting site.
https://www.codeplex.com/site/search?query=docx&ac=2

DOCX2TEX: WORD 2007 TO TEX
Docx2tex is a small command line tool that uses standard technologies to help users of Word 2007 to publish publications where typography is relevant or only papers produced by TeX are accepted. Behind the scenes, docx2tex uses common technologies to interpret Word 2007 OOXML

des outils de libreOffice

Pour transformer les fichiers word en ODT
Sous-répertoires compris
Indique que la recherche des fichiers applicables s'effectue également dans les sous-répertoires du répertoire sélectionné.
https://help.libreoffice.org/Common/Document_Converter/fr
https://www.libreoffice.org/download/libreoffice-fresh/
---

Sunday, January 15, 2017

comparison of XML editors and import/export. HTML, DITA, Docbook


Introduction

En anglais: comparison of XML editor and a small selection.
En français: un long développement sur la vision et les outils quark.

XML editor

https://en.wikipedia.org/wiki/XML_editor

An XML editor is a markup language editor with added functionality to facilitate the editing of XML. This can be done using a plain text editor, with all the code visible, but XML editors have added facilities like tag completion and menus and buttons for tasks that are common in XML editing, based on data supplied with document type definition (DTD) or the XML tree.
https://en.wikipedia.org/wiki/Document_type_definition
 DTD is associated with an XML or SGML document by means of a document type declaration (DOCTYPE).

There are also graphical XML editors that hide the code in the background and present the content to the user in a more user-friendly format, approximating the rendered version or editing forms. This is helpful for situations where people who are not fluent in XML code need to enter information in XML based documents such as time sheets and expenditure reports. And even if the user is familiar with XML, use of such editors, which take care of syntax details, is often faster and more convenient.

comparison of XML editor

https://en.wikipedia.org/wiki/Comparison_of_XML_editors

an iframe of a google spreadsheet (copy/paste from wikipedia @janv 2017):




a selection

open CAM


open JEdit

not open oXygen

You must pay!

From Guided Authoring To Advanced XML Development
Now You Have It All!
some plug-in:


web app

Quark Author est un logiciel Web de création de contenu qui, associé à Quark Publishing Platform, permet aux responsables commerciaux et informatiques de rationaliser et d'automatiser les communications client à haute valeur ajoutée sur tous les canaux de publication. 
L'expérience de création en ligne intuitive permet aux experts techniques – où qu'ils soient – de créer, prévisualiser, publier et réutiliser rapidement des contenus. Prenez de l'avance sur vos concurrents, charmez vos clients. Quark Author – Des contenus intelligents pour les entreprises innovantes.

Création de contenus intelligents

Une fois le contenu verrouillé dans un document avec un formatage, il est très difficile et coûteux de le dissocier C'est là le principal obstacle pour les organisations souhaitant créer et actualiser efficacement des communications à forte valeur ajoutée sur tous les canaux de publication. 
Quark Author a été conçu spécifiquement pour les utilisateurs professionnels afin de leur permettre de créer des contenus structurés (XML) au sein d'un environnement familier de type traitement de texte. Les rédacteurs peuvent créer et organiser des composants de contenu au moyen de types de contenu standard comme des sections, des paragraphes, des listes, des tableaux, des graphiques et des figures. Ces composants de contenu peuvent être assemblés dynamiquement pour tout type de sortie. 

Quark Author est basé sur le schéma de contenu intelligent de Quark.

Qui d'autre utilise le XML pour la production de documents ?

Il existe de nombreux schémas XML pour la création et la publication sur le marché. Certains sont très génériques et certains sont spécifiques à une industrie. Chose intéressante, même le HTML4 et les versions ultérieures sont en fait des mises en œuvre d'un schéma XML appelé "XHTML". Parmi les autres schémas XML populaires, on citera :
Et il en existe bien d'autres, y compris chez certaines sociétés qui définissent leur propre schéma personnalisé à partir de zéro, ce qui représente BEAUCOUP de travail, difficile et coûteux pour bien le faire.
Sachant qu'il existe de nombreux schémas de documents XML disponibles, pourquoi Quark a-t-elle créé un nouveau schéma de contenu intelligent ?

Quel est le problème avec le XML?

Le XML pour la production de documents a été adopté en premier par l'industrie des publications techniques. Il est largement utilisé dans la documentation informatique (matériel et logiciel), la fabrication discrète complexe et certaines industries par process où le contenu est publié à terme aux formats papier et PDF, HTML, et dans plusieurs formats de système d'aide tels que HTMLHelp, MSHelp, EclipseHelp, WebHelp, ainsi que d'autres types de sortie. Les schémas de document XML les plus largement utilisés ont été créés par et pour l'industrie des publications techniques, y compris le très populaire schéma DITA.

Le résultat est que ces schémas sont des outils extrêmement puissants, mais aussi extrêmement complexes. Pour emprunter une citation d'un partenaire de services professionnels de Quark, « le DITA est formidable si vos rédacteurs sont capables de penser comme des programmeurs ». C'est parfait pour les rédacteurs techniques qui sont, de par la nature de leur travail, très techniques et bien formés. Ce sont aussi des rédacteurs à plein temps.

Qu'est-ce qui rend ces schémas de création si difficiles ? Ils sont souvent trop restrictifs. Chez Quark, bon nombre de nos premiers adeptes qui utilisaient l'un de ces schémas se plaignaient de ce que le simple fait de couper/coller du contenu d'une zone d'un document vers une autre était bloqué par l'application. Pourquoi était-ce bloqué ? Prenons l'exemple simple suivant d'un titre et d'un paragraphe (nous montrons les balises XML, mais souvenez-vous que la plupart des outils de rédaction XML tentent de masquer les balises) :
<title>Comment faire</title>
<para>Commencez avec les ingrédients de la <keyword>recette pour Thanksgiving</keyword>.</para>
Si l'utilisateur sélectionne et copie la phrase "<keyword>recette pour Thanksgiving</keyword>." et la colle après Faire dans le <title>, l'outil de rédaction pourrait bloquer le collage car le schéma de contrôle ne permet pas <keyword> à l'intérieur d'un élément <title>. C'est frustrant et pire encore, car la raison pour laquelle le collage a échoué est souvent masquée aux yeux de l'utilisateur – lequel ne peut pas comprendre pourquoi c'est bloqué et pense que l'outil ne fonctionne pas correctement.

Détails du schéma de contenu intelligent

Pour les utilisateurs "calés" en XML, le schéma de contenu intelligent emprunte des idées de nombreuses autres implémentations XML incluant, et c'est important, l'idée de types de contenu – parfois appelés classes de contenu ou formes architecturales de contenu. L'idée centrale est relativement simple : il existe un ensemble de types de contenus fondamentaux et tous les autres contenus peuvent être décrits comme appartenant à l'une des classes racine. Pour ceux d'entre vous qui sont familiarisés avec DITA, une autre manière de décrire ceci serait la "spécialisation" de l'une de ces classes racine. Le concept de classes racine et de hiérarchies de classe est commun en programmation informatique, biologie, physique, mathématiques et plus encore.

La valeur des classes racine et des hiérarchies de classe est qu'un système qui sait comment traiter l'élément racine peut assurer un traitement de base de toute spécialisation de cette racine sans connaître quoi que ce soit auparavant de la spécialisation spécifique.

Ceci est moins compliqué que vous pourriez le penser. Prenons un exemple simple, si le système sait que tous les éléments <para> doivent être présentés avec une ligne vide au-dessus et en dessous, si le système traite un contenu qui inclut <para type="blockquote">, il saura au moins qu'un Block Quote doit comporter une ligne vide au-dessus et en dessous. Il existe de nombreuses autres règles de traitement, règles de présentation et interactions utilisateurs pouvant être appliquées à tout contenu de type similaire. La "spécialisation" est créée car un système pourrait aussi ajouter un traitement nouveau et unique comme les retraits droite et gauche pour la présentation d'un Block Quote.

Quelles sont certaines des classes racine ? Le contenu intelligent les représente dans différentes catégories, et voici un tableau qui compare une partie de la terminologie que le contenu intelligent, DITA et le HTML utilisent :



Dans le HTML, la spécialisation d'une balise HTML racine est généralement effectuée pour entraîner le formatage CSS ou pour déclencher un javascript spécifique à une balise et est le plus souvent codée en utilisant un attribut de classe tel que :
<div class="Navigation">…</div>
Toutefois, dans le HTML, il existe très peu de règles concernant où et comment vous pouvez utiliser <div> et il n'existe aucune règle quant à la valeur de l'attribut “class”, de sorte que le HTML est de fait fortement à structure libre et inutile pour la rédaction de contenus de communication à haute valeur ajoutée – bien qu'il soit excellent pour une présentation dans une page Web ou une application mobile.
Dans DITA, la spécialisation d'un élément DITA racine comme <topic> est codée comme suit :
<concept class="- topic/topic concept/concept">…</concept>
Il est au-delà de la portée de ce document d'expliquer pourquoi l'attribut de classe possède une telle valeur apparemment redondante, mais il est facile d'identifier le but, qui est que l'élément "concept" est de la classe "topic" et doit par conséquent être traité comme "topic", sauf lorsqu'un traitement spécifique pour "concept" a été défini.
Dans le contenu intelligent, la spécialisation est codée comme suit :
<section type="purpose">
Ceci est très similaire à la méthode HTML pour spécialisation, mais possède des règles d'implémentation très spécifiques de sorte que, par exemple, la rédaction d'un document de procédure opérationnelle normalisée peut limiter chaque document à un seul "Purpose" et que celui-ci doit être après le titre du document. Le HTML ne limite pas l'utilisation ou même ne valide pas la valeur des attributs de classe.


Il est important de souligner que, dans le HTML et le Contenu intelligent, le nom de l'élément est toujours la racine de la classe. Il s'agit de :
<section type="mySection">, ce n'est pas <mySection class="section">.

Publication multicanal automatisée

Le schéma de contenu intelligent utilisé par Quark Author a été développé avec deux idées en tête : la facilité d'utilisation pour les experts techniques et la sortie multicanal. Quark Author génère des fichiers XML à riche contenu sémantique pouvant être utilisés pour piloter la publication multicanal automatisée de Quark Publishing Platform afin de toucher les employés, les partenaires et les clients. Contenu, mise en forme et image de marque peuvent être personnalisés pour chaque canal, zone géographique, division, etc. afin de maximiser l'efficacité de vos communications à haute valeur ajoutée, que ce soit pour le support papier, les fichiers PDF, le Web ou les apps mobiles.

word et XML et outils quark

Quark XML Author for Microsoft Word
Lancé en 2002, Quark XML Author™ for Microsoft Word est un outil de création XML de nouvelle génération. Il se présente sous la forme d'un module complémentaire pour Microsoft Word qui permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation.
Création de documents XML dans Microsoft Word
Quark XML Author for Microsoft Word permet à tout utilisateur de créer facilement des documents XML, sans connaissance de ce langage ni formation. Quark XML Author est un module d'extension pour Microsoft Word qui permet aux rédacteurs de créer des composants d'information utilisables directement dans Quark Publishing Platform, qui les combine automatiquement de manière appropriée pour produire des documents imprimés de grande qualité ou des versions numériques pour le Web ou d'autres supports électroniques.
http://www.quark.com/fr/Products/Quark_XML_Author/