网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

Python web server: python-segment 使用示例

浏览数：22 / 时间：2015年06月08日

项目的主页是http://code.google.com/p/python-segment/，如果有问题，可以在上面提交issue，我会收到邮件（google code会么？应该会吧）。如果你希望协助开发，可以加入项目。一些简单问题可以直接看项目的WIKI，Wiki中有的一些内容我不会进一步解释，只会告诉你在那里可以看到。

1.如何获得源码
你可以使用以下代码，直接从版本库中复制一个可用版本出来。

hg clone https://shell909090@code.google.com/p/python-segment/

或者可以从这里下载一个最新版本的包。

2.如何准备环境
你可以看INSTALL，里面讲解的比较详细了。如果你不准备进行安装部署，可以跳过安装和打包这两步。但是如果你打算使用cutter工具，请安装chardet。如果你打算使用spider工具，请安装html2text。
首先按照如下方式生成词典。

gunzip dict.tar.gz./ps_dbmgr create dict.txt
然后，你可以看到生成了frq.db，这是词典的默认文件名。注意，词典文件的格式和具体的版本有关，换用版本后最好重新生成词典。

3.试验分词
假定有一个文本文件，test.txt，里面内容是中文平文本，编码任意。

./ps_cutter cutshow test.txt
cutter会自动推测编码。

4.代码使用

假如当前有一个frq.db词库。

import segmentcut = segment.get_cutter('frq.db')
print list(cut.parse(u'工信处女干事每月经过下属科室都要亲口交代24口交换机等技术性器件的安装工作'))

注意，仅仅使用parse是不会进行分词的，因为parse返回的是一个生成器。

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Python web server: python-segment 使用示例

标签： webserver

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

特斯拉入门两厢车新车预览

特斯拉入门两厢车新车预览

印度强奸犯被民众绑架游街杀害

印度强奸犯被民众绑架游街杀害

奥马巴儿时旧照

奥马巴儿时旧照

福建清光绪正五品官员古墓被盗发现一具干尸

福建清光绪正五品官员古墓被盗发现一具干尸

第十八届深港澳车展

第十八届深港澳车展

深圳宝安机场一奔驰失控撞向行人致9死23伤

深圳宝安机场一奔驰失控撞向行人致9死23伤

刘亦菲神仙姐姐十年颜值一直在线

刘亦菲神仙姐姐十年颜值一直在线

特斯拉 MODEL S 图集

特斯拉 MODEL S 图集

可爱穿搭很重要

可爱穿搭很重要

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

揭朱镕基传奇身世之谜：乱世孤儿乃是朱元璋后裔

您可能还喜欢

更多

美国小姐著比基尼参加水上排球大赛

美国小姐著比基尼参加水上排球大赛

实拍明代干尸开棺全过程(图)

实拍明代干尸开棺全过程(图)

广西桂平石龙镇的5月22日车祸事故

广西桂平石龙镇的5月22日车祸事故

海边比基尼彰显苗条身材

海边比基尼彰显苗条身材

2014春南宁车展部分模特

2014春南宁车展部分模特

金曲奖红毯众星云集张学友陈奕迅角逐歌王

金曲奖红毯众星云集张学友陈奕迅角逐歌王

美女翻译头戴发卡清纯小清新

美女翻译头戴发卡清纯小清新

欧美比基尼精选

欧美比基尼精选

广州一大学中外学生过泼水节女生湿身

广州一大学中外学生过泼水节女生湿身

栩栩如生的街头三维立体画--绝对逼真

栩栩如生的街头三维立体画--绝对逼真