Lucene.Net 3.0.3如何从TokenStream中获取token对象

  Lucene.Net最高版本为3.0.3,并且apache已经不再提供Lucene.Net的更新,没仔细研究过Lucene.Net的所有版本,Lucene.Net3.0.3遍历TokenStream获取Token对象,已经和以前的版本有了很大的区别,很多方法都已经删除了或者过时。
 

  以前版本的Lucene.Net从TokenStream中获取Token时调用Next方法就行了,源代码如下

        public void ReusableTokenStream2()
        {
            string testwords = "web开发网";
            SimpleAnalyzer simple = new SimpleAnalyzer();
            TokenStream ts = simple.ReusableTokenStream("", new StringReader(testwords));
            Token token;
            while ((token = ts.Next()) != null)
            {
                Console.WriteLine(token.TermText());
            }
            ts.Close();
        }

  但是在Lucene.Net3.0.3中TokenStream已经不存在Next方法,而是需要ITermAttribute属性接口来遍历。源代码如下

        public void ReusableTokenStream3()
        {
            Lucene.Net.Analysis.Standard.StandardAnalyzer a = new Lucene.Net.Analysis.Standard.StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30);
            string s = "web开发网";
            System.IO.StringReader reader = new System.IO.StringReader(s);
            Lucene.Net.Analysis.TokenStream ts = a.TokenStream(s, reader);
            bool hasnext = ts.IncrementToken();
            Lucene.Net.Analysis.Tokenattributes.ITermAttribute ita;
            while (hasnext)
            {
                ita = ts.GetAttribute<Lucene.Net.Analysis.Tokenattributes.ITermAttribute>();
                Console.WriteLine(ita.Term);
                hasnext = ts.IncrementToken();
            }
            ts.CloneAttributes();
            reader.Close();
            a.Close();
            Console.ReadKey();
        }

  网上找到的lucene.net的资料都是老版本的,新版本的lucene的资料都是基于java的,lucene.net的很少,只要看下java版本的代码,然后对比lucene.net对应类的源代码了摸索,那个郁闷。。

加支付宝好友偷能量挖...


原创文章,转载请注明出处:Lucene.Net 3.0.3如何从TokenStream中获取token对象

评论(0)Web开发网
阅读(229)喜欢(0)lucene.net/分词技术