<p>Possibly going slightly OT...</p>
<p>On 11/01/2012 11:31 AM, "Greg Troxel" <<a href="mailto:gdt@ir.bbn.com">gdt@ir.bbn.com</a>> wrote:<br>
> I think the key point is about the redundancy that you have vs the<br>
> redundancy that tahoe perceives - it seems dangerous to have 20 nodes<br>
> that appear independent but are all actually on the same box.  If they<br>
> are on 20 physical disks that are independent enough that if the box<br>
> fails you can reconstitute all but of the nodes, it might be ok, but it<br>
> seems subject to correlated failures.<br>
><br>
> If there were a way to have the nodes express their correlation groups,<br>
> and the share placement be aware of this, then I think it might be ok.<br>
> But we don't have that yet, and thus it seems to me that if you want the<br>
> survivability properties tahoe gives you, you should run only one node<br>
> per computer.  And perhaps only one node per site, if you want that kind<br>
> of redundancy.</p>
<p>I think this is an area that would really make Tahoe more acceptable in a wider community.  I've been trying to frame the questions but will jump in semi-prepared...</p>
<p>The lack of "correlations" (nice conceptual name!) between hosts is a major limitation for my intended usage.</p>
<p>I *think* I want to be able to define both physical proximity and network cost. That is, I want to be able to specify that enough shares are on my local nodes for me to download files (cheap bandwidth) BUT that there are enough shares elsewhere (i.e. far enough away) that a local disaster doesn't destroy all copies.</p>

<p>What I was hoping for was to turn some/most/all machines at all our sites into Tahoe nodes and thus reduce and remove the need for secure, hosted, offsite backups.</p>
<p>Most machines seem to under utilize their drives, CPU and network so a Tahoe backup grid seems to be cost effective.</p>
<p>*Of course* there is the issue that getting a file from the network is location independent so, in my ill-defined ramblings, what does "enough local nodes" mean?  I can see that for 3 data sites of multiple nodes each it means 3 shares each (for a 3 of 10 setups), but a generalized solution???</p>

<p>Has anyone run into this or thought about it?</p>
<p>Happy to contribute to discussions to flesh out a general use case.<br></p>
<p>Olaf</p>