精彩推荐
最新更新
- SolarPHP 1.0
- SpeedPHP 框架系统 2.3.8
- 互联网网站即时通信平台(iCenter) 2.1.0
- php分类信息系统 mymps 1.6 正式版 GBK
- php分类信息系统 mymps 1.6 正式版 UTF-8
- CmsEasy_Exp! 1.0 本地环境测试包
- QQ空间模块查询 v1.0
- 禅道项目管理软件(ZenTaoPMS) 0.5 Beta 集成Windows环境
- 禅道项目管理软件(ZenTaoPMS) 0.5 Beta
- eyeOS 1.9.0.1 For Windows 多国语言版
- eyeOS 1.9.0.1 For Linux 多国语言版
- VIM Custom 0.0.9
- PHP MSN Class 1.9
- ZK(Ajax开发框架) 5.0 正式版
- php debug 类(php开发好帮手)
下载排行
百度搜索
ThinkPHP的中英文分词扩展 (含最新版字典)
-
软件简介:
- 上论坛找商业破解网站程序
- 源码使用如需帮助,请到论坛发帖!
可以对全半角混合了标点的中英文句子进行分词。可以自己选择最大词组字长、标点断句最小词组字长、是否保留分词结果中的单个字、是否保留标点符号等功能。更加详细的说明请查看下载包里面的Readme.txt
默认提供一个sqlite的字典文件。如果你的虚拟主机不支持sqlite,你可以将其导入mysql或自己造其他的字典。
由于本人能力有限,可能效率上不能令大家满意,请多包含。
字典的挂载、卸载和查询都将函数分离了,修改起来应该很容易。核心分词算法只需要findinDict返回一个true或者false告诉我字典中是否有这个词就行了。
还有一个需要注意的就是mbstring的扩展是必须的。没办法啊,中英文、全半角混合在一起分词,不用mbstring在计算句子长度等方面都很困难。
程序默认是作为ThinkPHP的扩展提供的,但是你可以去掉extends Base,直接使用分词类。Apache2开源协议,SO,用于商业闭源也无所谓啦,如果你不嫌弃我的程序的话
投一票:



添加到百度搜藏


