<div class="gmail_quote">On Wed, May 2, 2012 at 6:28 AM, Olly Betts <span dir="ltr">&lt;<a href="mailto:olly@survex.com" target="_blank">olly@survex.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div class="im">My understanding is that Lucene doesn&#39;t store [a list of all terms in each document], and handles deletion by adding the document id to a &quot;deleted&quot; list, which has to be excluded from query results;</div>

</blockquote><div><br></div><div>Yes, though these entries get cleaned up during merge/optimize, so there isn&#39;t really a cumulative error like you implied. (i.e. whenever you scan over all terms it&#39;s easy to remove terms for items in the &quot;deleted&quot; list)</div>

<div><br></div></div>