Hi Lokesh .:) This is a very good place to start if you want the understand the basics of Xapian. It&#39;s quite informative and has some good examples::-<br> <a href="http://getting-started-with-xapian.readthedocs.org/en/latest/">http://getting-started-with-xapian.readthedocs.org/en/latest/</a><br>
<br>Also,if your interested in IR theory, I personally think this is one of the best books out there,it&#39;s detailed and starts from the basics.A couple of friends of mine who have taken IR courses at their university have also recommended it.:<br>
<br><a href="http://nlp.stanford.edu/IR-book/">http://nlp.stanford.edu/IR-book/</a><br><br><div class="gmail_quote">On Tue, Mar 5, 2013 at 5:30 PM,  <span dir="ltr">&lt;<a href="mailto:xapian-devel-request@lists.xapian.org" target="_blank">xapian-devel-request@lists.xapian.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Send Xapian-devel mailing list submissions to<br>
        <a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://lists.xapian.org/mailman/listinfo/xapian-devel" target="_blank">http://lists.xapian.org/mailman/listinfo/xapian-devel</a><br>
or, via email, send a message with subject or body &#39;help&#39; to<br>
        <a href="mailto:xapian-devel-request@lists.xapian.org">xapian-devel-request@lists.xapian.org</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:xapian-devel-owner@lists.xapian.org">xapian-devel-owner@lists.xapian.org</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than &quot;Re: Contents of Xapian-devel digest...&quot;<br>
<br>
<br>
Today&#39;s Topics:<br>
<br>
   1. Need Beginner Guide for Matcher Optimisations Project<br>
      (Lokesh Basu)<br>
   2. Corrected errors in TradWeight test as per feedback . (aarsh shah)<br>
   3. Re: Reading a password-protected PDF (Olly Betts)<br>
   4. Remote database &amp; local database, and adding new weight found<br>
      vtable error (??)<br>
   5. Please take a look at the TfIdf patch (aarsh shah)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Mon, 4 Mar 2013 18:07:20 +0530<br>
From: Lokesh Basu &lt;<a href="mailto:lokesh.basu@gmail.com">lokesh.basu@gmail.com</a>&gt;<br>
Subject: [Xapian-devel] Need Beginner Guide for Matcher Optimisations<br>
        Project<br>
To: <a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a><br>
Message-ID:<br>
        &lt;<a href="mailto:CAF8SOyuYVSsQKTPdHjLWzHTBwxV64t3pU2Mj%2Bm7JQFjRD49_nQ@mail.gmail.com">CAF8SOyuYVSsQKTPdHjLWzHTBwxV64t3pU2Mj+m7JQFjRD49_nQ@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
Hi,<br>
<br>
While searching for a project which matches my interest andskill level, I<br>
found this project named Matcher Optimization. This project is really<br>
challenging and excting from my view point and I would like to be a part of<br>
this project.<br>
<br>
Optimization techniques metioned in the reference links provided will take<br>
some time for me to have a good understanding about them. But I am trying<br>
to get my head into it.<br>
<br>
I am a Computer Science undergraduate so I have a good knowledge about<br>
programming languages, algorthms, copilers, logics and data structures, but<br>
still I&#39;m not into real world development sphere.<br>
<br>
So it was a bit difficult for me to get my hands on the real code, as I<br>
couldn&#39;t find a section which was completely dedicated to New Developers<br>
Just Trying To Start with Xapian.<br>
<br>
Also, since my timezone is +5:30 GMT, so it&#39;s not very easy to get a quick<br>
response on IRC. Hence, it&#39;s really difficult for student like me, who<br>
needs help regarding alost everything.<br>
<br>
So I would be thankful to you if I can get any kind of help regarding my<br>
step towards learning more about deleoping for Xapian.<br>
<br>
<br>
Some idea about the contents of the section that I need is:<br>
<br>
<br>
<br>
For Beginners :<br>
<br>
Prerequisit for developing for Xapian.<br>
Step wise installation of tools for development including source code?<br>
Detailed build instruction for build.<br>
How to start with code evaluation?<br>
How to fix a bus[possibly a start bug like &quot;Hello Xapian&quot; :-) ] ?<br>
How to submit a bug?<br>
Possible reading material for reference regarding development and for<br>
increasig your knowledge about searching.<br>
etc.<br>
[These are just what I could think of, there could be many other thing as<br>
well.]<br>
<br>
<br>
*Lokesh Chandra Basu*<br>
B. Tech<br>
Computer Science and Engineering<br>
Indian Institute of Technology, Roorkee<br>
India(GMT +5hr 30min)<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.xapian.org/pipermail/xapian-devel/attachments/20130304/cfbd65d8/attachment.html" target="_blank">http://lists.xapian.org/pipermail/xapian-devel/attachments/20130304/cfbd65d8/attachment.html</a>&gt;<br>

<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Mon, 4 Mar 2013 19:13:38 +0530<br>
From: aarsh shah &lt;<a href="mailto:aarshkshah1992@gmail.com">aarshkshah1992@gmail.com</a>&gt;<br>
Subject: [Xapian-devel] Corrected errors in TradWeight test as per<br>
        feedback .<br>
To: Xapian Development &lt;<a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a>&gt;<br>
Message-ID:<br>
        &lt;<a href="mailto:CABz8NmRkUK%2BR2nfg6nSF8pNUs3DNSzfiTnAc8P-UnkiwVYMpNg@mail.gmail.com">CABz8NmRkUK+R2nfg6nSF8pNUs3DNSzfiTnAc8P-UnkiwVYMpNg@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
Hey guys,Hi. :) I&#39;ve corrected the mistakes in the TradWeight test commits<br>
that Olly pointed out and have added them to the pull request. Thank you<br>
for the feedback .<br>
<br>
-Regards<br>
-Aarsh<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.xapian.org/pipermail/xapian-devel/attachments/20130304/f1b26c95/attachment-0001.htm" target="_blank">http://lists.xapian.org/pipermail/xapian-devel/attachments/20130304/f1b26c95/attachment-0001.htm</a>&gt;<br>

<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Tue, 5 Mar 2013 06:23:38 +0000<br>
From: Olly Betts &lt;<a href="mailto:olly@survex.com">olly@survex.com</a>&gt;<br>
Subject: Re: [Xapian-devel] Reading a password-protected PDF<br>
To: Zaim Zuhuri &lt;<a href="mailto:mzaimz@gmail.com">mzaimz@gmail.com</a>&gt;<br>
Cc: <a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a><br>
Message-ID: &lt;<a href="mailto:20130305062338.GG27289@survex.com">20130305062338.GG27289@survex.com</a>&gt;<br>
Content-Type: text/plain; charset=us-ascii<br>
<br>
On Wed, Feb 27, 2013 at 03:06:29PM +0800, Zaim Zuhuri wrote:<br>
&gt; I was wondering if it is possible for xapian to read a password-protected<br>
&gt; PDF.<br>
[...]<br>
&gt; 2. all PDF is set with the same password.<br>
&gt; 3. only the content of the PDF is encrypted, not the metadata.<br>
&gt;<br>
&gt; If it is possible could you guys point me in the right direction.<br>
<br>
Xapian runs pdftotext to extract text from PDF files, so the question<br>
really is &quot;can pdftotext read a password-protected PDF?&quot;<br>
<br>
Looking at pdftotext --help, I see:<br>
<br>
  -opw &lt;string&gt;     : owner password (for encrypted files)<br>
  -upw &lt;string&gt;     : user password (for encrypted files)<br>
<br>
Not sure what the difference is, but I&#39;d try both and see which works.<br>
<br>
So I&#39;d try creating a simple wrapper script so when omindex runs<br>
pdftotext it runs your wrapper instead, which runs pdftotext with<br>
extra command line arguments:<br>
<br>
#!/bin/sh<br>
exec /usr/bin/pdftotext -upw &#39;secret-password&#39; &quot;$@&quot;<br>
<br>
Save that as (say) /home/zaim/pdftotext-wrapper/pdftotext, then make it<br>
executable and add that directory to PATH before you run omindex:<br>
<br>
chmod a+x /home/zaim/pdftotext-wrapper/pdftotext<br>
<br>
env PATH=&quot;/home/zaim/pdftotext-wrapper:$PATH&quot; omindex [...]<br>
<br>
Cheers,<br>
    Olly<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Tue, 5 Mar 2013 15:54:59 +0800<br>
From: ?? &lt;<a href="mailto:leedeetiger@gmail.com">leedeetiger@gmail.com</a>&gt;<br>
Subject: [Xapian-devel] Remote database &amp; local database,       and adding<br>
        new weight found vtable error<br>
To: Xapian Development &lt;<a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a>&gt;<br>
Message-ID:<br>
        &lt;CALXXG0Ar=<a href="mailto:TBktqRd03Dkm1FACSHou55JzFXmGedtk55xLp1KHw@mail.gmail.com">TBktqRd03Dkm1FACSHou55JzFXmGedtk55xLp1KHw@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;utf-8&quot;<br>
<br>
Hello, guys.<br>
Q1.<br>
now I have load all the docid and its document data into a dictionary for<br>
faster loading data instead of calling<br>
 Xapian::MSetIterator i;<br>
i.get_document().get_data();<br>
<br>
but I was happened to discover that the dictionaries got by such two method<br>
were different:<br>
<br>
both methods use DB1, DB2<br>
<br>
method 1:<br>
<br>
Xapian::Database db = Xapian::Database(the path of DB1);<br>
Xapian::Database db2 = Xapian::Database(the path of DB2);<br>
<br>
db.add_database(db2);<br>
<br>
I pre-load the docid and its document data into dictionary DT1;<br>
<br>
method 2:<br>
<br>
DB1 and DB2 are opened by Xapian-tcpsrv for remote access.<br>
<br>
Xapian::Database dbr = Xapian::Remote::open(host of DB1, port of DB1, 0, 0);<br>
Xapian::Database dbr2 = Xapian::Remote::open(host of DB2, port of DB2, 0,<br>
0);<br>
<br>
 db.add_database(dbr2);<br>
<br>
Here dictionary DT2 holds the docid and its document data.<br>
<br>
<br>
=============<br>
<br>
Q2.<br>
I want add a weight scheme into Xapian-1.2.12;<br>
I have implemented it by add Myweight.cc in ./weight/ with weight.cc, etc.<br>
and I also added necessary declaration in ./include/xapian/weight.h for<br>
Myweight.<br>
<br>
by add Myweight.cc into ./weight/Makefile.am I have successfully compiled<br>
the source code and got the dynamic library.<br>
<br>
But when I call Myweight scheme in my own c++ program, the compiler told me<br>
that &quot;undefined reference to &#39;vtable for Xapian::Myweight&#39;&quot;.<br>
<br>
I have checked all the virtual function include the destructor and all of<br>
them were re-implemented in Myweight.cc.<br>
<br>
Then I replace all the code about TradWeight by Myweight;<br>
and unfortunately all works well by calling &quot;TradWeight&quot; which actually is<br>
implemented Myweight scheme.<br>
<br>
I know it maybe not the problem of Xapian but my lack of C++ skills.<br>
It would be nice for all your answers.<br>
<br>
<br>
--<br>
Ronghua Lin<br>
College of Computer Science and Technology, Zhejiang University<br>
Hangzhou, China, 310027<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.xapian.org/pipermail/xapian-devel/attachments/20130305/b0ee7d6e/attachment-0001.htm" target="_blank">http://lists.xapian.org/pipermail/xapian-devel/attachments/20130305/b0ee7d6e/attachment-0001.htm</a>&gt;<br>

<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Tue, 5 Mar 2013 17:08:54 +0530<br>
From: aarsh shah &lt;<a href="mailto:aarshkshah1992@gmail.com">aarshkshah1992@gmail.com</a>&gt;<br>
Subject: [Xapian-devel] Please take a look at the TfIdf patch<br>
To: Xapian Development &lt;<a href="mailto:xapian-devel@lists.xapian.org">xapian-devel@lists.xapian.org</a>&gt;<br>
Message-ID:<br>
        &lt;CABz8NmSP132wn5M7mZKhqmh8z=+<a href="mailto:zFCKhLwxoA8016oskjLFf7A@mail.gmail.com">zFCKhLwxoA8016oskjLFf7A@mail.gmail.com</a>&gt;<br>
Content-Type: text/plain; charset=&quot;iso-8859-1&quot;<br>
<br>
Hello guys, :) Please do take a look at the pull request for the TfIdf<br>
patch Ive sent because I want to start working on writing DFR schemes for<br>
us and want to incorporate the feedback into making a good hack for the DFR<br>
schemes.The patch incorporates all normalizations possible with our current<br>
statistics and passed all the tests I wrote for it.Have also attached  the<br>
tests with the pull request.<br>
<br>
-Regards<br>
-Aarsh<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: &lt;<a href="http://lists.xapian.org/pipermail/xapian-devel/attachments/20130305/20cdaf11/attachment-0001.htm" target="_blank">http://lists.xapian.org/pipermail/xapian-devel/attachments/20130305/20cdaf11/attachment-0001.htm</a>&gt;<br>

<br>
------------------------------<br>
<br>
_______________________________________________<br>
Xapian-devel mailing list<br>
<a href="mailto:Xapian-devel@lists.xapian.org">Xapian-devel@lists.xapian.org</a><br>
<a href="http://lists.xapian.org/mailman/listinfo/xapian-devel" target="_blank">http://lists.xapian.org/mailman/listinfo/xapian-devel</a><br>
<br>
<br>
End of Xapian-devel Digest, Vol 95, Issue 6<br>
*******************************************<br>
</blockquote></div><br>