<div dir="ltr">Hello,<div><br></div><div>I'm Ayush from New Delhi, India. I am interested in Letor Stabilisation project for GSoC. I have a good background in machine learning. Sorry for getting in so late, university exams were holding me back. I'll try to cover as much as I can in the coming week. </div><div><br></div><div>I am following the plan of attack suggested on the project page. Following are the things that I have completed:</div><div><br></div><div>1. Getting current master branch building cleanly.</div><div>2. Going through all resources and papers mentioned on the project page.</div><div>3. Generating lcov test coverage reports.</div><div>4. Going through code in current master of xapian-letor and understanding all functionalities.</div><div><br></div><div><br></div><div>Following are the things on which I am currently working on:</div><div><br></div><div>1. Modifying xapian-letor/bin/questletor.cc to use and test core features and API of letor. The current version of questletor.cc has a lot of unusable and broken functions and is custom made for training with INEX 2010 dataset. The intention is to make it usable for a user provided database. Currently I am using xapian-docsprint/data/100-objects-v1.csv as my database and some manually written queries and qrels to make things work. </div><div>2. Going through v-hasu's GSoC 2014 code to understand extra functionalities added by him and planning how to introduce code from his branch. </div><div><br></div><div>In summary, the approach I will follow is going to be:</div><div><br></div><div>1. Creating a code example that lets the user use 100-objects-v1.csv as the database and use Letor features and API to make queries over it. Documenting how to make this example run.</div><div>2. Introducing features from 2014 projects and add to the above example. Document them.</div><div>3. Writing API and unit tests</div><div><br></div><div>I have some question:</div><div><br></div><div>1. Is the procedure I mentioned above the right way to go about it? What are the essential portions (in terms of code) that I should complete before submitting the proposal?</div><div>2. How can I create the test harness for xapian-letor similar to xapian-core and start writing tests? Tests seem somewhat overwhelming to me at the moment, it would be helpful if I could get some assistance on how to go about it.</div><div>3. How important is writing new features for this project (for instance implementing LambdaMART ranking)? Should I focus on them as well in my proposal?</div><div><br></div><div>Thanks,</div><div>Ayush</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div>