1 Slouží k načítání souborů ve všelijakých syntaxích (json, ini atd.) tak,
2 aby s nimi následně šlo pracovat jako s XML.
4 SAXParserFactory → SAXParser → XMLReader
6 Nejdůležitější je XMLReader, tam se provádí vlastní načítání exotického souboru.
8 Aby se použila správná (naše) továrna, je potřeba udělat něco z následujícího:
9 – nastavit systémovou vlastnost „javax.xml.parsers.SAXParserFactory“
10 – použít Services API… viz JavaDoc k newInstance()
11 – předat název třídy továrny jako parametr newInstance(…, …);
13 Pak načítáme soubory, jako by to bylo XML:
14 SAXParserFactory továrna = SAXParserFactory.newInstance();
15 SAXParser parser = továrna.newSAXParser();
16 parser.parse(new File("data/vstup.json"), h);
18 Nikde sice nejsou žádné ostré závorky (např. JSON používá {} a []),
19 ale používáme stejné API a všechny navazující nástroje jako u opravdového XML.
21 Náš SAXParser používá SuperXMLReader, který rozhoduje, který konkrétní parser se použije.
24 Moduly řešit přes Features?
26 Kódování pro převod všech znaků na název XML elementu/atributu
28 Možnost zakódovat properties XMLReaderu a skutečné SystemId do URI SystemId.
32 hledá v textu shodu s výrazem (typicky bude končit koncem řádku) a vrací skupiny z výrazu jako elementy
35 komentáře převést na XML komentáře
37 sekce (případně vnořené)
42 zprasené, atributy bez uvozovek, atd.
46 číslování řádků (atribut)
52 standardní struktura výstupního XML
54 https://github.com/sirthias/pegdown
57 atributy souborů (včetně rozšířených)
58 volitelně obsah souborů
59 zpracovat celý podstrom nebo volitelně jen soubory/adresáře vyhovující regulárnímu výrazu
60 vhodné pro konfiguraci programů
66 formátované XML: odsazení + volitelně barvy
71 Souborový systém (stromová struktura adresářů a souborů)
72 YAML, INI, JSON a další formáty
75 --input-file <filename>
76 --input-stdin <systemId>
77 --input-url <systemId>
79 --system-id <systemId> (override SystemId from file/url, pokud začíná # → připojit za název souboru)
81 --reader-property <key> <value>
83 --default-namespace-uri <uri>
84 --default-namespace-prefix <prefix>
86 --output-file <filename>
90 --action-property <key> <value>
91 --action-properties <array> (last option, opaque data follows)
95 po vzoru JDBC ovladačů
96 jak pro vstupní XMLReadery, tak pro výstupní moduly
97 konfigurační volba má: název, titulek, popis, datový typ, výčet hodnot, povinnost
98 společné/generické volby definované na jednom místě
99 → vygenerovat dokumentaci + bash-completion
102 TagSoup: http://mercury.ccil.org/~cowan/XML/tagsoup/
103 HotSAX: http://hotsax.sourceforge.net/ – HotSAX is a small fast SAX2 parser for HTML, XHTML and XML.
104 XOM: http://www.cafeconleche.org/XOM/ – XOM is fairly unique in that it is a dual streaming/tree-based API.
105 Jericho: http://jericho.htmlparser.net/docs/javadoc/net/htmlparser/jericho/StreamedSource.html – Iterátor
106 SAX → DOM: http://www.java2s.com/Code/Java/XML/SaxtoDOMconverter.htm
107 XMLUnit: http://xmlunit.sourceforge.net/api/org/custommonkey/xmlunit/TolerantSaxDocumentBuilder.html
109 http://www.lupa.cz/clanky/asn-1-8211-koncept-abstraktni-syntaxove-notace/
110 http://www.root.cz/clanky/analogie-asn1/
111 http://www.research.ibm.com/trl/projects/xml/xss4j/samples/asn1/Translator.java
112 http://www.bouncycastle.org/ – Pěkná knihovna pro práci s ASN.1 v Javě je součástí Bouncy Castle Crypto APIs
113 https://en.wikipedia.org/wiki/XML_Encoding_Rules – XML Encoding Rules (XER)