Lucene.Net 3.0.3如何从TokenStream中获取token对象

评论(0)浏览(229)分类:lucene.net/分词技术
Lucene.Net 3.0.3如何从TokenStream中获取token对象  Lucene.Net最高版本为3.0.3,并且apache已经不再提供Lucene.Net的更新,没仔细研究过Lucene.Net的所有版本,Lucene.Net3.0.3遍历TokenStream获取Token对象,已经和以前的版本有了很大的区别,很多方法都已经删除了或者过时。  以前版本的Lucene.Net从TokenStream中获取Token时调用Next方法就行了,源代码如下 public void Reusable..

网站搜索升级,采用lucene.net+similarity自定义算法

评论(0)浏览(92)分类:lucene.net/分词技术
网站搜索升级,采用lucene.net+similarity自定义算法  最近改版本站的搜索,采用盘石分词+lucene.net+similarity,去掉了中文停止词的索引,搜索的结果比较靠谱了,的,而等中文停止词已经去掉,不至于搜索出此类的无关信息。  similarity自定义算法,具体可以参考这篇文章:lucene.net实现similarity自定义排序

lucene.net实现similarity自定义排序

评论(0)浏览(168)分类:lucene.net/分词技术
lucene.net实现similarity自定义排序  最近碰到公司要求修改搜索排序,要求和这篇文章说的差不多,Lucene关于实现Similarity自定义排序,非常感谢原作者原创文章,欢迎转载,请注明 Author:kernaling.wong#gmail.comhttp://kernaling-wong.iteye.com/blog/586043  职位搜索的结果排序应该是,相关度优先,然后才是职位的发布时间倒序.即如果关键字匹配是一定要全部命中了才会排在第..

Lucene.Net 2.3.1开发介绍——附录一、如何下载Lucene.Net的各种版本

评论(0)浏览(83)分类:lucene.net/分词技术
Lucene.Net 2.3.1开发介绍——附录一、如何下载Lucene.Net的各种版本首先,你需要一个svn客户端。TortoiseSVN非常好用,可以从官方网站下载。下载地址:http://tortoisesvn.net/downloads。下载完成,就安装,需要重启电脑。然后在d盘下建立一个空文件夹,命名为Lucene.Net。打开文件夹,右键,则出现菜单。如图"附录一 1"。附录一 1发现多了两项,分别是SVN Checkout和TortoiseSVN。点“SVN Checkout”,出现“附..

Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net

评论(0)浏览(85)分类:lucene.net/分词技术
Lucene.Net 2.3.1开发介绍 —— 一、接触Lucene.Net 1、引用Lucene.Net类库 找到Lucene.Net的源代码,在“C#\src\Lucene.Net”目录。打开Visual Studio,我的版本是2008,而Lucene.Net默认的是2005。先创建一个项目,简单起见,创建一个C#控制台程序。图 1.1然后添加Lucene.Net进项目,如图 1.2 - 1.3。图 1.2图 1.3这个过程要进行一个VS2005到2008的转换。添加后,解决方案就有Lucene.Net项目了,..

《Robots.txt 协议标准》介绍

评论(0)浏览(74)分类:lucene.net/分词技术
《Robots.txt 协议标准》介绍近期有很多站长咨询,怎样正确设置"robots.txt"文件。为了解决广大站长朋友们的疑问,我们对《Robots.txt 协议标准》进行了翻译,希望此篇译文能够帮助大家对"robots.txt"文件有更深的了解。Robots.txt 是存放在站点根目录下的一个纯文本文件。虽然它的设置很简单,但是作用却很强大。它可以指定搜索引擎蜘蛛只抓取指定的内容,或者是禁止搜索引..