<div>Hi all Xapian-devel,</div><div><br></div><div>Gist: <a href="https://gist.github.com/10d2222d8bffe8d7631d">https://gist.github.com/10d2222d8bffe8d7631d</a></div><div><br></div>I&#39;m using Xapian-TermGenerator to extract Norwegian sentences to vsm (vector space model) using TermGenerator. But when I test generating vsm from &#39;Truet med å stevne misfornøyd PC-kunde - PC-leverandøren Asus likte svært dårlig kundens misfornøyde leserbrev.&#39; It doen&#39;t return &#39;asus&#39; result in vsm.<div>

<br></div><div>So I&#39;ve tried to replace &#39;Asus&#39; with other word such as Acer, Apple, Dell, Fujitsu, HP, Lenovo,  LG, NEC, Samsung, Sony and Toshiba. Most brand words I tried are able to get a result except Acer, Apple and Dell, but other words which get its name as result aren&#39;t get &#39;dår&#39;.</div>

<div><br></div><div>This problem may be caused by encoding which I&#39;m investigating now. But it would be great if you guys can help and if you guys have any question regarding this problem please reply to me </div><div>

<br></div><div>Best regards,</div><div>Theerapat</div>