<div dir="auto">Hello devs,<div dir="auto"><br></div><div dir="auto">My name is Richhiey Thomas and I'm studying Computer Engineering under Mumbai University. I had worked with Xapian in GSoC 2016 where I had worked on Clustering of Search Results. I would want to continue working on the project and was wondering whether it would fit the scope of GSoC.</div><div dir="auto"><br></div><div dir="auto">The clustering branch had a clustering API and KMeans clusterer implemented but hasnt been merged yet because it had to be optimized further and due to other smaller issues. I would like to complete work on merging this clustering branch and implementing a hierarchial clusterer.</div><div dir="auto"><br></div><div dir="auto">Also, a main reason for the performance reduction with large document corpus was because of the dimensionality of the document vectors. Therefore a latent semantic analysis to reduce document vectors size is something that could be necessary.</div><div dir="auto"><br></div><div dir="auto">I would like to have your feedback on the same.</div><div dir="auto"><br></div><div dir="auto">Thanks :)</div></div>