Hi,<br>make sure that DTD files are accessible.<br><br>Bohuslav<br><br><div class="gmail_quote">2013/5/8 Matthias Lang <span dir="ltr"><<a href="mailto:matthias@corelatus.se" target="_blank">matthias@corelatus.se</a>></span><br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<br>
Something, I suspect xsltproc, is eating the non-ASCII characters in<br>
the Erlang FAQ. I'm hoping someone here can give me a clue what it is.<br>
<br>
The Erlang FAQ is generated using the same tools as the rest of the<br>
Erlang documentation. But the transformation on <a href="http://erlang.org" target="_blank">erlang.org</a> drops<br>
letters, whereas the same transformation on my PC works fine:<br>
<br>
           Source:  <em>Erlang Programmation</em> (Micka&euml;l R&eacute;mond)<br>
    On <a href="http://erlang.org" target="_blank">erlang.org</a>:  <strong>Erlang Programmation</strong> (Mickal Rmond)<br>
  Output on my PC:  <strong>Erlang Programmation</strong> (Mickaël Rémond)<br>
<br>
Can someone give me a clue as to what's going on?<br>
Can anyone reproduce the bad version? I can't.<br>
I have a workaround, but I'd prefer to know why it's going wrong.<br>
<br>
<br>
More information<br>
----------------<br>
<br>
The Erlang FAQ source is on github:<br>
<br>
   <a href="https://github.com/matthiasl/Erlang-FAQ" target="_blank">https://github.com/matthiasl/Erlang-FAQ</a><br>
<br>
just type 'make' to build it on *nix machines, assuming you have<br>
xsltproc installed. Here's what it looks like on my machine:<br>
<br>
   Erlang-FAQ >make<br>
   erl_docgen_privdir=`escript erl_docgen_privdir.escript`; \<br>
           date=`date +"%B %e %Y"`; \<br>
           xsltproc --stringparam outdir obj --stringparam gendate "$date" --stringparam topdocdir . --xinclude -path $erl_docgen_privdir/docbuilder_dtd -path $erl_docgen_privdir/dtd_html_entities faq_html.xsl faq.xml<br>


   ...<br>
   Erlang-FAQ >grep Mick *.xml obj/*<br>
   obtaining.xml:  French: <em>Erlang Programmation</em> (Micka&euml;l R&eacute;mond)<br>
   obj/obtaining.html:     French: <strong>Erlang Programmation</strong> (Mickaël Rémond)<br>
   Erlang-FAQ >wget -q -O - <a href="http://www.erlang.org/faq/obtaining.html" target="_blank">http://www.erlang.org/faq/obtaining.html</a> | grep Mick<br>
        French: <strong>Erlang Programmation</strong> (Mickal Rmond)<br>
<br>
The version information I have for the '<a href="http://erlang.org" target="_blank">erlang.org</a>' machine which is<br>
generating the input I don't want:<br>
<br>
   $ xsltproc --version<br>
   Using libxml 20623, libxslt 10115 and libexslt 812<br>
   xsltproc was compiled against libxml 20623, libxslt 10115 and libexslt 812<br>
   libxslt 10115 was compiled against libxml 20623<br>
   libexslt 812 was compiled against libxml 20623<br>
<br>
   $ escript erl_docgen_privdir.escript<br>
    /usr/local/otp/releases/sles10_64_R16A/lib/erl_docgen-0.3.4/priv<br>
<br>
I've built exactly the same version of xlstproc, with exactly the same<br>
libraries on my PC, but I don't get the dropped letters in the output.<br>
Raimo is fairly sure that it's not the webserver's fault. So maybe<br>
xsltproc is behaving differently on that machine for some reason. But<br>
why?<br>
<br>
One workaround i have is to write &#233; instead of &eacute;. That<br>
solves the problem, but it's ugly. Might be a clue, though. I haven't<br>
tried seeing what happens if I just type öäå etc. in the XML source;<br>
I'd prefer to keep the FAQ source plain ASCII.<br>
<br>
A brutal workaround would be just to rename people. Mickael Remond,<br>
Clas Wikstrom and Bjorn. ;-)<br>
<br>
Matt<br>
_______________________________________________<br>
erlang-questions mailing list<br>
<a href="mailto:erlang-questions@erlang.org">erlang-questions@erlang.org</a><br>
<a href="http://erlang.org/mailman/listinfo/erlang-questions" target="_blank">http://erlang.org/mailman/listinfo/erlang-questions</a><br>
</blockquote></div><br>