<div dir="ltr"><div><div>During the indexing with omindex, only you need to make sure is indexing with prefix 'S' for title as explained here in Letor documentation: xapian-letor/docs/letor.rst<br><br></div>Previously when I edited omindex.cc it was modified as can be seen <a href="http://trac.xapian.org/browser/svn/branches/gsoc2011-parth/xapian-applications/omega/omindex.cc">here</a> on line 838 and block 1532-1559. <br>
<br></div>But now we have the same as <span class=""> </span><span itemscope="" itemtype="http://data-vocabulary.org/Breadcrumb"><span itemprop="title">xapian-letor</span></span><span class="">/</span><span itemscope="" itemtype="http://data-vocabulary.org/Breadcrumb"><span itemprop="title">bin</span></span><span class="">/</span><span class="">xapian-letor-update.cc so before starting with questletor.cc you need to run it once for each db and in this case all  you need to make sure is below line in omindex.cc while indexing.<br>
<br></span><table class=""><tbody><tr><th id="L838"></th><td><span class="">indexer.index_text(title, 1,"S");<br><br>you can also check the index to see if it is proper by inspecting index using xapian-core/bin/xapian-delve.cc<br>
<br>In order to investigate this, hand create 5 XML/HTML documents of INEX format with one line of content and title, index them, inspect the index using xapian-delve.<br><br>Also while working with INEX, you can make a small index by indexing 2/3 parts out of 4 during development and once everything behaves normally, switch to the bigger index.<br>
<br>Cheers,<br>Parth.<br></span></td></tr></tbody></table><span class=""></span></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Mar 11, 2014 at 8:11 AM, Jiarong Wei <span dir="ltr"><<a href="mailto:vcamx3@gmail.com" target="_blank">vcamx3@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Parth,<br>
<br>
I’ve implemented SVMRanker class and also sorted out most of current Letor APIs.<br>
Now I’m trying to use INEX dataset to verify my implement. But I stuck in the indexing part. You said in the documentation that we have to add prefix when indexing. Also I notice that you set some metadata in omindex.cc of your version. But the omindex.cc has changed since 2011. I think that’s why my result is always wired. Could you give me some suggestions about how to index INEX dataset properly?<br>

<br>
Thank you!<br>
<span class="HOEnZb"><font color="#888888"><br>
Jiarong Wei</font></span></blockquote></div><br></div>