Agreed - utilizing firefox or IE will further allow you to handle javascript generated DOMs much more easily then having to write a javascript parser yourself, which will enable handling of a much larger sets of pages. <br>
<br>But is this *easy* to do within Erlang? <br><br><div><span class="gmail_quote">On 10/23/07, <b class="gmail_sendername">Joe Armstrong</b> <<a href="mailto:erlang@gmail.com">erlang@gmail.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
The point is (or was) that firefox has code to parse virtally any kind of broken<br>warped incomprehensable html - letting firefox figure out the "meaning" of<br>deeply crippled and totally incomprehensible html and then scanning the result
<br>(the generated DOM) seems a lot easier than figuring out how to parse<br>crippled HTML yourself - using other stuff as components to do what they are<br>good at doesn't seem that crazy to me.<br><br>/Joe<br><br><br>
<br>On 10/23/07, Joel Reymont <<a href="mailto:joelr1@gmail.com">joelr1@gmail.com</a>> wrote:<br>><br>> On Oct 23, 2007, at 4:09 PM, Joe Armstrong wrote:<br>><br>> > You could then use Erlang as a coordination language controlling
<br>> > a load of firefoxes on different machines, telling them to go get<br>> > pages and<br>> > scrape the pages for data which they send back to Erlang.<br>><br>> This is nuts!!! /With all due respect to Joe/
<br>><br>> --<br>> <a href="http://wagerlabs.com">http://wagerlabs.com</a><br>><br>><br>><br>><br>><br>><br>_______________________________________________<br>erlang-questions mailing list<br><a href="mailto:erlang-questions@erlang.org">
erlang-questions@erlang.org</a><br><a href="http://www.erlang.org/mailman/listinfo/erlang-questions">http://www.erlang.org/mailman/listinfo/erlang-questions</a><br></blockquote></div><br>