Hi all:<div><br></div><div>Glad to meet you!!</div><div><br></div><div>My name&#39;s Zhang Fan, a Phd Student from Nankai University, China. I have been doing the information retrieval research work for 3 years. I have several papers published in the top-tier computer science conferences such as WSDM, VLDB, CIKM and ACL. I have many years of coding experiments and participated several projects about search engines.</div>
<div><br></div><div>I want to take part in the suggested project &quot;weighting schemes&quot;. It is a good chance for me to contribute to open source community and add my idea to Xapian. </div><div><br></div><div>Besides DfR, I would like to add two more interesting weighting sachems: term proximity and document structure information.</div>
<div>The term proximity suggest that if the document in which the query terms appear close to each other should have higher relevance score. Some research work already prove this idea.</div><div>The document structure information is: we distinguish different parts of a document, we will assign different weight to title, body, anchor text and url in the documents. </div>
<div><br></div><div>I have two papers involving weighting schemes, please refer to the followings: </div><div><br></div><div><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; "><b>Fan Zhang</b></span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; ">,</span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; "> </span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; "><span style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Shuming Shi</span></span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; ">, Hao Yan, and Ji-Rong Wen. Revisiting Globally Sorted Indexes for Efficient Document Retrieval. Third ACM International Conference on Web Search and Data Mining (</span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; "><strong style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; "><span style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">WSDM&#39;10</span></strong></span><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; ">), New York, 2010.</span></div>
<div><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; "><br></span></div><div><span class="Apple-style-span" style="font-family: verdana; font-size: 13px; line-height: 19px; ">Hao Yan, <span style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">Shuming Shi</span>, <b>Fan Zhang</b>, Torsten Suel and Ji-Rong Wen. Efficient Term Proximity Search with Term-Pair Indexes. In <span style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; text-decoration: none; "><span style="margin-top: 0px; margin-right: 0px; margin-bottom: 0px; margin-left: 0px; ">CIKM&#39;10</span></span></span></div>
<div><font class="Apple-style-span" color="#77AA22" face="verdana"><span class="Apple-style-span" style="line-height: 19px;"><br></span></font></div><div><font class="Apple-style-span" color="#77AA22" face="verdana"><span class="Apple-style-span" style="line-height: 19px;"><br>
</span></font></div><div>!!Please give me some feedback of my ideas. Thank you very much. </div><div>--</div><div>My Homepage: <a href="http://sites.google.com/site/zhfan555/">http://sites.google.com/site/zhfan555/</a><br>
<br>PhD Student at Nankai U and Intern at MSRA<br>
</div>