<div dir="ltr">Dear list,<div>A simple question: am I correct that, when a node is removed because of a net split, you need to have your own application logic to reconnect to it, and nothing in the VM will try doing that for you?</div><div><br></div><div>Let me show you an example. I have two nodes: <a href="mailto:1@127.0.0.1">1@127.0.0.1</a> and <a href="mailto:2@127.0.0.1">2@127.0.0.1</a> that are connected to each other:</div><div><br></div><div><div><font face="monospace, monospace">(<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>)1> nodes().</font></div><div><font face="monospace, monospace">['<a href="mailto:2@127.0.0.1">2@127.0.0.1</a>']</font></div></div><div><br></div><div>On node 2 I listen for nodedown events of node 1:</div><div><br></div><div><font face="monospace, monospace">(<a href="mailto:2@127.0.0.1">2@127.0.0.1</a>)1> monitor_node('<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>', true).<br></font></div><div><font face="monospace, monospace">true</font></div><div><br></div><div>On node 1, I simulate a net splits with the best option I've found until now, i.e suspending the net_kernel process:</div><div><br></div><div><font face="monospace, monospace">(<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>)2> sys:suspend(net_kernel).<br></font></div><div><font face="monospace, monospace">ok</font></div><div><br></div><div>After ~60 seconds on node 2 I get:</div><div><br></div><div><div><font face="monospace, monospace">=ERROR REPORT==== 22-Apr-2016::11:28:21 ===</font></div><div><font face="monospace, monospace">** Node '<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>' not responding **</font></div><div><font face="monospace, monospace">** Removing (timedout) connection **</font></div></div><div><div><font face="monospace, monospace">(<a href="mailto:2@127.0.0.1">2@127.0.0.1</a>)2> flush().</font></div><div><font face="monospace, monospace">Shell got {nodedown,'<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>'}</font></div></div><div><br></div><div>Now the two nodes are disconnected:</div><div><br></div><div><div><font face="monospace, monospace">(<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>)3> nodes().</font></div><div><font face="monospace, monospace">[]</font></div></div><div><br></div><div><span style="font-family:monospace,monospace">(<a href="mailto:2@127.0.0.1">2@127.0.0.1</a>)3> nodes().</span><br></div><div><div><font face="monospace, monospace">[]</font></div></div><div><br></div><div>Even when I resume the net_kernel process:</div><div><font face="monospace, monospace"><br></font></div><div><div><font face="monospace, monospace">(<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>)4> sys:resume(net_kernel). </font></div><div><font face="monospace, monospace">ok</font></div></div><div><br></div><div>The nodes do not reconnect:</div><div><br></div><div><div><font face="monospace, monospace">(<a href="mailto:1@127.0.0.1">1@127.0.0.1</a>)5> nodes().</font></div><div><font face="monospace, monospace">[]</font></div></div><div><br></div><div>I'm ok with this, though I would like to confirm that my understanding is correct.</div><div>If so, does everyone just implement some standard connection manager that does only reconnections?</div><div><br></div><div>Thank you,</div><div>r.</div><div><br></div><div><br></div><div><br></div></div>