<br>The sync_nodes_timeout setting is only relevant to the <br>distributed application controller, and tells it how long to wait <br>for the other node to appear before proceeding as if they were<br>dead.<br><br>The parameter that ought to be of interest in this case is 
<br>-kernel net_ticktime<br><br>It is by default set to 60 seconds, which means that the nodes<br>will send a tick if they haven't sent anything else to the other<br>node in 60/4 seconds. If nothing has been received from the 
<br>other node after 4 tick intervals, the connection is considered dead.<br>Since the other node is expected to sent ticks at the same interval<br>(that is, net_ticktime must be the same on both sides), something<br>should always be received.
<br><br>The heartbeat code is brilliant. It's very concise and obviously flawless,<br>but I'm convinced that it has a hole in it. (:  It's just that we've experienced<br>nodedowns during extreme situations where our other - less elegant -
<br>heartbeat algorithms have been able to recover.<br><br>One situation that was weird enough to remember was when we had <br>reason to learn about the tcp rexmit settings. We found that with an <br>aggressive net_ticktime (10 seconds, which really shouldn't be 
<br>considered that aggressive), we had to set tcp.rexmit_max so that <br>the TCP retransmission logic didn't wait to long before resending a <br>packet. Not only that, we had to set the rexmit_init value (this was <br>
Solaris 8, and I don't recall the exact syntax) to be low - otherwise<br>the _first_ retransmission wait would trigger the nodedown.<br><br>You would perhaps run Wireshark to try to find out what's actually<br>going on when the nodedown happens. Again, I have a feeling that 
<br>the erlang tick algorithm is sometimes a bit easily offended, but <br>we've not been able to pin down the exact circumstances, nor find<br>an actual flaw in the algorithm.<br><br>BR,<br>Ulf W<br><br><div><span class="gmail_quote">
2007/5/19, Enrique Marcote <<a href="mailto:enrique.marcote@nomasystems.com">enrique.marcote@nomasystems.com</a>>:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
Hi all,<br><br>I'm trying to connect several  erlang nodes over a wifi network. The<br>same application works  perfectly over ethernet but when I go<br>wireless, approximately every 5  minutes I get a noconnection error in
<br>some of the nodes (nodes  reconnect by themselves after a period of<br>time that goes from 5 secs to  1min).<br><br>I'm setting the following kernel parameters  in the sys.config:<br><br>[{kernel, [{sync_nodes_mandatory, []}, {sync_nodes_optional,
<br>['sun@mahe']}, {sync_nodes_timeout, 5000}]},<br><br>Nodes communicate with each other  issuing rpc calls.<br><br>Are there any recommendations you could  point out in order to connect<br>several erlang nodes over a medium quality  wifi network? (quality is
<br>in average 50%). The network quality is  not perfect but seems good<br>enough for other applications (ssh, http...).<br><br>Any help would be greatly appreciated.  Thanks in advance.<br><br>Quique<br><br>---------- Forwarded message ----------
<br>From: Enrique Marcote <<a href="mailto:enrique.marcote@nomasystems.com">enrique.marcote@nomasystems.com</a>><br>Date: Sat, 19 May 2007 13:42:43 +0200<br>Subject: erlang nodes over a wifi network<br>To: <a href="mailto:erlang-questions@erlang.org">
erlang-questions@erlang.org</a><br><br>Hi all,<br><br>I'm doing some tests connecting several erlang nodes over a wifi<br>network.  The same application works perfectly over ethernet but when<br>I go wireless, approximately every 5 minutes I get a noconnection
<br>error in some of the nodes (nodes reconnect by themselves after a<br>period of time that goes from 5 secs to 1min).<br><br>I'm setting the following kernel parameters in the sys.config:<br><br>[{kernel, [{sync_nodes_mandatory, []},
<br>           {sync_nodes_optional, ['sun@mahe']},<br>           {sync_nodes_timeout, 5000}]},<br><br>Nodes communicate with each other issuing rpc calls.<br><br>Are there any recommendations you could point out in order to connect
<br>several erlang nodes over a medium quality wifi network? (quality is<br>in average 50%).  The network quality is not perfect but seems good<br>enough for other applications (ssh, http...).<br><br>Any help would be greatly appreciated.  Thanks in advance.
<br><br>Quique<br>_______________________________________________<br>erlang-questions mailing list<br><a href="mailto:erlang-questions@erlang.org">erlang-questions@erlang.org</a><br><a href="http://www.erlang.org/mailman/listinfo/erlang-questions">
http://www.erlang.org/mailman/listinfo/erlang-questions</a><br></blockquote></div><br>