<div dir="ltr"><br><br><div class="gmail_quote">2008/9/25 Tony Cappellini <span dir="ltr"><<a href="mailto:cappy2112@gmail.com">cappy2112@gmail.com</a>></span><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br>
I use Scintilla Text Editor daily for python, Windows batch files,<br>
C/C++ and have no problems.<br>
This is the first language I've worked with that is sensitive to the<br>
encodings used.<br>
<br>
</blockquote></div><br>Yes, some languages support multiple character encodings.  Some will check the first two bytes of the file and assume an encoding based on a byte-order-mark(BOM). Some also support directives that will allow the programmer to specify an encoding (possibly in a comment)<br>
<br>Recent python interpreters do:<br><a href="http://www.python.org/dev/peps/pep-0263/">http://www.python.org/dev/peps/pep-0263/</a><br><br>The XML standard does as well <br><a href="http://www.w3.org/TR/xml11/#sec-guessing-no-ext-info">http://www.w3.org/TR/xml11/#sec-guessing-no-ext-info</a><br>
<br>In any case, I avoid  UCS-2 or or any UTF-16 variant to store source code.  These would effectively double the byte size of my code (I know hard-drives are cheep, but waste-not want-not).  If you do use a lot of non-ascii characters in your python code UTF-8 is the way to go.<br>
<br>You do have me thinking about what it would take to write an alternate Erlang pre-compiler that will do this type of decoding. Hmmm. A weekend research project for me. :)<br><br></div>