<div dir="ltr"><div><div><div><div>Dear Sidhant,<br><br></div>We do welcome the student's idea but it would be more useful if you introduce your idea with more details. Based on the information you provide and glancing through the attached paper, I have following questions: <br>
<br></div>1. The confidence measure mentioned in the paper assigns multiple weights to the terms which are basically features for the categorization task, how do you perceive it for the query-document setting of IR here in Xapian? Please be more elaborate.<br>
<br>2. "The major problem with text categoriztion is that the system doesn't take into account the context of the query." - Yes, it is certainly a challenge but there are several ways to get this context from the user profiling (personalised search) to diversified IR where you give all the diverse results for the same query. Where do you place your proposal and how do you want to achieve it.<br>
<br></div>Cheers,<br></div>Parth.<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Mon, Mar 3, 2014 at 10:35 AM, Sidhant Panda <span dir="ltr"><<a href="mailto:sidhantpanda@gmail.com" target="_blank">sidhantpanda@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi,<div><br></div><div>I would like to contribute to the "Weighting Schemes" project. I have previously worked with weighting schemes like tf-idf.</div>
<div><br></div><div>My past experience was in a project which was able to successfully classify a text question into its subject (like Physics) and also its sub topic (like reflection, refraction etc) based on an ontology built from crawling wikipedia articles.</div>

<div><br></div><div>The major problem with text categoriztion is that the system doesn't take into account the context of the query.</div><div><br></div><div>I would like to propose an alternate measure based on a "confidence measure". I am currently trying to implement the same in another project. I have attached the paper which talks about this "confidence" measure.</div>

<div><br></div><div>Regards</div><span class="HOEnZb"><font color="#888888"><div>Sidhant Panda</div></font></span></div>
<br>_______________________________________________<br>
Xapian-devel mailing list<br>
<a href="mailto:Xapian-devel@lists.xapian.org">Xapian-devel@lists.xapian.org</a><br>
<a href="http://lists.xapian.org/mailman/listinfo/xapian-devel" target="_blank">http://lists.xapian.org/mailman/listinfo/xapian-devel</a><br>
<br></blockquote></div><br></div>