Hi Mudit, <br><br>Please do not mail me privately, use the mailing list.<br><br><div class="gmail_quote"><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>It seems quite similar to random forest algorithms, in fact if we remove the step on select boot strap samples of data, both are almost the same, like they select random subset of variables, split node based on threshold criteria and mode data. We will also get all those variable importance matrix and even the proximity matrix I guess. I think I will make my proposal on the same.</div>
</blockquote><div><br>cool.<br> <br></div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<div><br></div><div>I was going through the xapian source and also the Letor tool which was added to xapian. I read the documentation. What I could figure is that I can use those functions already implemented in xapian to construct my feature vector from the data set and since the present implementation uses a SVM based ML method. I have to feed the feature vector to the new Random Forest Algorithm and I will get ranking of pages. One more thing the input vector format with be a pair of document and features(many). Am I right?</div>
</blockquote><div><br>Right, the current input format is listed at the LTR project page<br><br><a href="http://trac.xapian.org/wiki/GSoC2011/LTR">http://trac.xapian.org/wiki/GSoC2011/LTR</a><br><br>and you can use the same features. You basically need to make the framework which  can take the data in that format and return the ranked list, quite similar to the existing approach. If your approach is pairwise/listwise you also need to construct the pairs out of the training data.<br>
<br>Parth.<br></div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div class="im">
<div><br></div><div>Hope to hear from you soon.</div><div><br></div><div>Best Regards,</div><div><br></div><div>Mudit Raj Gupta</div></div><div><div class="h5"><div><br><div class="gmail_quote">On Fri, Mar 30, 2012 at 5:28 PM, Parth Gupta <span dir="ltr">&lt;<a href="mailto:parthg.88@gmail.com" target="_blank">parthg.88@gmail.com</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br><div class="gmail_quote"><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div><br></div><div>Thank you for your reply. I am more inclined towards random forest for ranking. I was planning to complete my proposal soon. Should I include a literature survey of various algorithms in my proposal or should I choose one and concentrate on details?</div>


</blockquote></div><div><br>Well the concrete plan of the project will be necessary. So you should focus more on the algorithm which you plan to implement and how are you planning to go about it.<span><font color="#888888"><br>

<br>Parth. <br></font></span></div><div><div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">

<div><br></div><div>Best,</div><div><br></div><div><font color="#888888">Mudit</font><div><div><br><br><div class="gmail_quote">On Fri, Mar 30, 2012 at 4:48 PM, Parth Gupta <span dir="ltr">&lt;<a href="mailto:parthg.88@gmail.com" target="_blank">parthg.88@gmail.com</a>&gt;</span> wrote:<br>




<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Mudit, <br><br>Good to know about you.<br><div class="gmail_quote"><div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">




<span style="font-family:arial,sans-serif;font-size:13px;border-collapse:collapse;color:rgb(34,34,34)"><div>
<br></div><div>I successfully completed my <b>Google Summer of Code - 2011</b> for the <b>Center for the study of Complex systems - University of Michigan</b>. I implemented various <b>algorithms (ant colony, random walk etc.)</b> related to computational intelligence in Repast S (<b>Coded in Groovy, Java</b>) and wrote <b>extensive documentations and tutorial</b> for the related models with <b>literature reviews</b> on the topics. My <b>contributions to Repast S was a part of the latest release of the software</b>. The detailed documentation and code can be found here:<a href="http://code.google.com/p/cscs-repast-demos/wiki/Mudit" style="color:rgb(17,85,204)" target="_blank">http://code.google.com/p/cscs-repast-demos/wiki/Mudit</a> I have also worked on various projects related to implementation of Machine Learning and Bio-Inspired Evolutionary Algorithms.You can check the code and some documentation on the same on <a href="http://code.google.com" target="_blank">code.google.com</a> my user profile is : <a href="http://code.google.com/u/110675325175605367090/" target="_blank">http://code.google.com/u/110675325175605367090/</a></div>





</span></blockquote></div><div><br>Seems your previous experience with machine learning will help you.<br> <br></div><div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">





<span style="font-family:arial,sans-serif;font-size:13px;border-collapse:collapse;color:rgb(34,34,34)">

<div><br></div><div>I am interested in applying for the project - <b>&quot;Learning to Rank</b><span>&quot;. I have read the pointers on the ideas page and some literature about it. I was thinking, based on my literature review, that something on the lines on Multi-layer Perceptron network with Ant Colony Optimization or an Improved random Forest could be a good option. I selected the same because of my experience on the topic. Although any further details/pointers to the projects would be greatly appreciated. I would also like to request you to please let me know about any specific detail related to the project that is required in the proposal (apart from the ones mentioned on the page)</span></div>





</span></blockquote></div><div><br>There have been plenty of algorithms proposed in the recent past. Based on your choice of ML technique, you can choose one. As you are interested in Neural Net based approaches, ListNet [1], RankNet [2], ListMLE [3], LamdaRank [4] can be of your interest and if you want to explore the random forests based approaches then [5] can be checked out.<br>





<br>[1] Learning to rank: from pairwise approach to listwise approach<br>[2]<font> Learning to Rank using Gradient Descent<br>[3] Listwise Approach to Learning to Rank - Theory and Algorithm<br>[4] Learning to Rank with Nonsmooth Cost Functions<br>





[5] Learning to rank with extremely randomized trees<br><br><br>Regards,<br>Parth.<br><br></font>
<br></div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><span style="font-family:arial,sans-serif;font-size:13px;border-collapse:collapse;color:rgb(34,34,34)">

<div><span></span> </div><div><span>Thank you for your time. Hope to hear from you soon.</span></div><div><span></span> </div><div><span>Best Regards, </span></div><div><span></span> </div><div><span>Mudit Raj Gupta  </span></div>







</span>
<br></div>_______________________________________________<br>
Xapian-devel mailing list<br>
<a href="mailto:Xapian-devel@lists.xapian.org" target="_blank">Xapian-devel@lists.xapian.org</a><br>
<a href="http://lists.xapian.org/mailman/listinfo/xapian-devel" target="_blank">http://lists.xapian.org/mailman/listinfo/xapian-devel</a><br>
<br></blockquote></div><br>
</blockquote></div><br></div></div></div>
</blockquote></div></div></div><br>
</blockquote></div><br></div>
</div></div></blockquote><div><br></div></div><br>