<div dir="ltr">Thanks for all for your valuable inputs. I am looking forward for some more variations.<div><br></div><div>Hi Joe, I hope the story below answers all your questions. Hardware is not a limiting factor.</div><div><br></div><div>We are in the process of building a global business-customer discovery/social/engagement platform, out from the cloud. If we succeed, it will be a big platform.</div><div><br></div><div>Contents of the documents will be plain text, and CRUD operations will be performed on the contents. Size - on average, 1MB each. The whole contents of the document must be searchable. There will be replication of static indexes. Security is to be applied on the wires, at the ingress and on sensitive data. Sensitive data will be kept separately, encrypted.</div><div><br></div><div>Regards,</div><div>Theepan</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Sep 3, 2015 at 7:05 PM, Joe Armstrong <span dir="ltr"><<a href="mailto:erlang@gmail.com" target="_blank">erlang@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">On Thu, Sep 3, 2015 at 1:21 AM, Kannan <<a href="mailto:vasdeveloper@gmail.com">vasdeveloper@gmail.com</a>> wrote:<br>
> Team,<br>
><br>
> We are evaluating to select a database that natively supports "full text<br>
> search". Do you have any inputs? The following are key:<br>
><br>
> * Erlang integration<br>
> * Document orientation<br>
> * Weights for different keys or keys at different depths (in a JSON<br>
> document)<br>
> * Performance -- In-memory should be fine.<br>
> * Scalability<br>
<br>
<br>
<br>
</span>Sorry but I have to ask:<br>
<br>
How much memory have to got?<br>
(in-memory might be fine, but it's vague, are we talking GBytes,<br>
Mbytes, TeraBytes?)<br>
How many document/second do you want to index/search?<br>
How many words per document?<br>
How big in the corpus?<br>
What do you want to retrieve (name of file(s) where words occur?)<br>
Is the index write append only or must it be updatable<br>
Is the index replicated?<br>
Security?<br>
What at the input documents (text, html, pdf, ...)?<br>
What languages are the input documents in?<br>
<br>
Without stating your requirement it is impossible to give a good answer<br>
there is an incredible spectrum of answers.<br>
<span class="HOEnZb"><font color="#888888"><br>
/Joe<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
><br>
> Thanks,<br>
> Theepan<br>
><br>
> _______________________________________________<br>
> erlang-questions mailing list<br>
> <a href="mailto:erlang-questions@erlang.org">erlang-questions@erlang.org</a><br>
> <a href="http://erlang.org/mailman/listinfo/erlang-questions" rel="noreferrer" target="_blank">http://erlang.org/mailman/listinfo/erlang-questions</a><br>
><br>
</div></div></blockquote></div><br></div>