<div dir="ltr">Hello,<br><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 28, 2015 at 12:47 PM, Roberto Ostinelli <span dir="ltr"><<a href="mailto:roberto@widetag.com" target="_blank">roberto@widetag.com</a>></span> wrote:</div><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><span style="font-size:12.8000001907349px">What I do not understand is why, in a system under stable load, suddenly the eheap blows up like that, eventually crashing the system (this box only has 15GB of RAM).</span><br></div></div></blockquote><div><br></div><div>Could it be that you at this point trigger a lot of garbage collections due to calling erlang:garbage_collect/1? If you do that on a lot of processes at the same time you might get an explosion in eheap memory usage.</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><br></div><div><div><span style="font-size:12.8000001907349px">Any suggestions on the steps I could make to debug this?</span></div></div><div><br></div></div></blockquote><div><br></div><div>If you cannot get a crash dump, I would look for changes in erlang:statistics/1 counters, to see if that can indicate if something in the system is changing drastically at that point, i.e. the number of reductions executed, the number of gc's done etc etc.</div><div><br></div><div>Lukas</div></div></div></div>