<div> 
<div>
<div>
<blockquote>
<div>How large are these matrices ?</div>
</blockquote>

<div> </div>

<div>They can be huge.  2^16 x 2^16 is an average one but can be much larger.</div>

<div>Does the anonymous function trick help me out?</div>

<div> </div>

<div>So basically what you suggest is that I need an external piece of software written in a low level language that uses low level SIMD instructions on the bare CPU or maybe uses GPU.</div>

<div> </div>
</div>
</div>
</div>