简介
LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of SpeechTagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(CharacterLanguage Modeling)、医学文献下载/解析/索引(MEDLINE Download, Parsing and Indexing)、数据库文本挖掘(DatabaseText Mining)、中文分词(Chinese Word Segmentation)、情感分析(SentimentAnalysis)、语言辨别(Language Identification)等API(来源:oschina)。
使用实例:
首先到http://alias-i.com/lingpipe/web/download.html下载免费版。我是在windows764位下做的测试,你的电脑需要安装3个软件:eclipse,jdk1.7,ant.
Eclipse下载地址:http://www.eclipse.org/downloads/
Jdk1.7下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html
Ant下载地址:http://ant.apache.org/
Eclipse是一个集成开发工具,jdk1.7是java编译器,ant类似c/c++中的make很强大,我也是菜鸟,ant入门教程:
http://www.java3z.com/cwbwebhome/article/article2/2764.html?id=1271
下面你们可以参考:
LingPipe拼写检查http://blog.csdn.net/fancyerii/article/details/6314130
语种识别(window下):
f:
cd F:\software\应用API\语种识别\lingpipe-4.1.0
cd demos/tutorial/langid
java -cplanguageId.jar;../../../lingpipe-4.1.0.jar RunLanguageId../../models/langid-leipzig.classifier "hello"