Hi Joe,<div><br></div><div>You may try unicode module:</div><div><br></div><div>test() -> unicode:characters_to_list("a∞b",utf8).</div><div><br></div><div>which will return the desired list [97,8734,98]. As Richard said, the default is Latin-1 (0-255 integers).</div>
<div><br></div><div>As for binaries, the same problem (assuming Latin-1).</div><div><br></div><div>CGS</div><div><br></div><div><br></div><div><br><br><div class="gmail_quote">On Mon, Jul 30, 2012 at 2:35 PM, Joe Armstrong <span dir="ltr"><<a href="mailto:erlang@gmail.com" target="_blank">erlang@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">What is a literal string in Erlang? Originally it was a list of<br>
integers, each integer<br>
being a single character code - this made strings very easy to work with<br>
<br>
The code<br>
<br>
    test() -> "a∞b".<br>
<br>
Compiles to code which returns the list<br>
of integers [97,226,136,158,98].<br>
<br>
This is very inconvenient. I had expected it to return<br>
[97, 8734, 98]. The length of the list should be 3 not 5<br>
since it contains three unicode characters not five.<br>
<br>
Is this a bug or a horrible misfeature?<br>
<br>
So how can I make a string with the three characters 'a' 'infinity' 'b'<br>
<br>
test() -> "a\x{221e}b"        is ugly<br>
<br>
test() -> <<"a∞b"/utf8>>   seems to be a bug<br>
                                            it gives an error in the<br>
shell but is ok in compiled code and<br>
                                            returns<br>
<<97,195,162,194,136,194,158,98>> which is<br>
                                            very strange<br>
<br>
test() -> [$a,8734,$b]       is ugly<br>
<br>
/Joe<br>
_______________________________________________<br>
erlang-questions mailing list<br>
<a href="mailto:erlang-questions@erlang.org">erlang-questions@erlang.org</a><br>
<a href="http://erlang.org/mailman/listinfo/erlang-questions" target="_blank">http://erlang.org/mailman/listinfo/erlang-questions</a><br>
</blockquote></div><br></div>