(转)lucene安装
Posted by gavinkwoe
网上有许多lucene的材料,中文材料大家看的都是车东的那篇(http://www.chedong.com/tech/lucene.html),而大家在网上讨论最多的是中文的全文检索,而对中文的全文检索最有影响力的文章,还是车东写的那篇weblucene(http://www.chedong.com/tech/weblucene.html),但那些都是lucene1.2版本的事,现在不同了,lucene1.3-final据称完全支持中文的全文检索了。
因为在lucene1.3-final.zip包中的changes.txt中的第五项描述如下:
5. Fix StandardTokenizer’s handling of CJK characters (Chinese,
Japanese and Korean ideograms). Previously contiguous sequences
were combined in a single token, which is not very useful. Now
each ideogram generates a separate token, which is more useful.
这说明lucene1.3-final可以检索中日韩等表意文字了。
测试一下:
测试环境:windows 2000 pro,jdk1.3.1或以上版本
1、下载lucene-1.3-final.zip。
2、解压lucene-1.3-final.zip,并将其中的lucene-1.3-final.jar和lucene-demos-1.3-final.jar加入到系统的classpath中。
3、建一个目录,并将一些html或txt文件(文件内容要中文的!)拷入到这个目录中,作为全文检索的材料。如:建一个目录d:\lucenetest\index,在其中拷入一些中文内容的文件,其中也可以有多级子目录的。
OK,环境准备好了,可以试验了!
4、进入dos模式,输入命令:java org.apache.lucene.demo.IndexFiles d:\lucenetest\index
如:c:\>java org.apache.lucene.demo.IndexFiles d:\lucenetest\index 回车,这时会索引d:\lucenetest\index目录下的所有文件,包括子目录中的文件,并将索引文件写入:c:\index目录中(自动创建的,根据你的dos符起始路径,将在其下建index目录)。
好,索引建完了,下面试验检索。
5、输入命令:java org.apache.lucene.demo.SearchFiles
如:c:\>java org.apache.lucene.demo.SearchFiles 回车
Query:在这里输入检索内容,如:“建议最好自己先做一下语法检查”,这么长:)
成功了,结果出来了:
Searching for: “建 议 最 好 自 己 先 做 一 下 语 法 检 查”
1 total matching documents
0. d:\lucenetest\index\学习Lucene的一点心得.txt
可以看出lucene-1.3-final完全支持中文的全文检索了,使用的是单字切分!!
pligg安装步骤
Posted by dengwei
[转]pligg安装步骤
原文地址:http://blog.manboo.info/305.htm
pligg安装步骤
Posted by topcool on 08/16/06 in Web2.0
1.下载安装的文件,现在的版本是Beta 7.2 Nightly 138。
2. 解压缩文件,找到pligg/libs/dbconnect.php.default,重命名为dbconnet.php
config.default.php 重命名为 config.php并用记事本打开找到下面几行:
$trackbackURL = “pligg.com”;
// in this example, pligg is install in http://ashtest1.pligg.com/
//define(’my_base_url’, ‘http://ashtest1.pligg.com’); // the base url to your site.
//define(’my_pligg_base’, ‘’); // if installed in a subfolder. leave blank if installed in root.
去掉//,改成相应的链接,最后不要带/
3. 将所有的文件上传到FTP空间相应的目录
4. 修改下列文件的属性为777,注意是修改文件夹及文件夹下所有的文件。
/configs
/templates_c
/templates
config.php
/libs/dbconnect.php
/libs/options.php
5. 打开浏览器, http://yoururl/install/ 按照说明,一路next就好。当然前提是
你已经先建立了数据库。
6. 安全起见,删除/install 目录,把libs/dbconnect.php文件属性改为655。
现在可以访问http://yourpligg/
登录帐户为god
密码12345
到 god profile , personal data , personal information 旁边的modify修改帐号信息及修改密码
如果想修改god为admin或者其他名字,可以用phpmyadmin到相应数据库,
修改users表的内容。
7.关于提交链接乱码的修改
这个应该是模板编码的问题,还没有想好怎么解决,可以将模板文件都用utf-8编码。先试试这个:
将模板的head.tpl文件中
<meta http-equiv=”Content-Type” content=”text/html; charset=iso-8859-1″/>
改成:
<meta http-equiv=”Content-Type” content=”text/html; charset=utf-8″ />
8.更换模板
更改config.php文件里
$thetemp = “mollio-beat”;这行代码,修改为$thetemp = “模板的名字”;
模板的名字是指templates目录下的文件夹,原始程序里是三个,觉得默认的mollio-beat
好看一些,你可以复制该文件夹并重命名,修改$thetemp = “mollio-beat”;
然后,就可以根据需要来修改你的模板了。
9. 新发现提交以后必须顶的次数超过5才能在首页显示,
这个可以在config.php文件中下面这几行改
// Publishing
define(’votes_to_publish’, 5); // 改这个5为其他数字就可以了。
define(’days_to_publish’, 10); // After this many days posts will not get published
10的意思是10天后,提交的这个新发现就不会被发布到首页了,除非已经
被顶了5次提交到首页了。
关于config.php的详细修改见这里
10. 关于pligg的汉化
可以直接修改libs/lang.conf文件(记事本就可以打开)
也可以登录到后台Admin Panel » Modify Language修改,其实也就是修改lang.conf文件。