I gave that branch a try. I'm still seeing misreported downed nodes. I should see correct gen_leader:down/1 and gen_leader:alive/1 lists on all nodes correct?<div class="gmail_extra"><br clear="all">--<br>Jeremy<br>
<br><br><div class="gmail_quote">On Tue, Nov 27, 2012 at 11:35 PM, Andrew Thompson <span dir="ltr"><<a href="mailto:andrew@hijacked.us" target="_blank">andrew@hijacked.us</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="im">On Tue, Nov 27, 2012 at 12:47:52PM -0500, Jeremy Raymond wrote:<br>
> Hi,<br>
><br>
> I'm using the gen_leader behaviour from [1] in a 3 node Erlang cluster. I'm<br>
> running into a situation where if I down one of the nodes and bring it back<br>
> up, when it rejoins the cluster the other nodes still see it as being down<br>
> as reported by gen_leader:down/1. However the cycled node itself sees the<br>
> other two nodes as being up. If I cycle the other two nodes, then all three<br>
> will agree again on all of the nodes being available. This doesn't happen<br>
> all every time I down a node, but quite often. Another (related?) issue I<br>
> sometimes see is that gen_leader:down/1 sometimes reports the same node as<br>
> being down multiple times in the returned list.<br>
><br>
<br>
</div>Would you mind trying the branch at<br>
<br>
<a href="https://github.com/Vagabond/gen_leader_revival/tree/netsplit-tolerance" target="_blank">https://github.com/Vagabond/gen_leader_revival/tree/netsplit-tolerance</a><br>
<br>
This branch contains a bunch of work I did to work around these kinds<br>
of issues that Basho was seeing with gen_leader.<br>
<br>
Anfrew<br>
_______________________________________________<br>
erlang-questions mailing list<br>
<a href="mailto:erlang-questions@erlang.org">erlang-questions@erlang.org</a><br>
<a href="http://erlang.org/mailman/listinfo/erlang-questions" target="_blank">http://erlang.org/mailman/listinfo/erlang-questions</a><br>
</blockquote></div><br></div>