Home fnlp初试
Post
Cancel

fnlp初试

安装

需要注意的是,去先Releases下载三个文件放入源码目录内的”models”文件夹里,其中

  1. seg.m 分词模型
  2. pos.m 词性标注模型
  3. dep.m 依存句法分析模型
1
2
3
4
 git clone https://github.com/xpqiu/fnlp.git
 cd fnlp/
 mvn install -Dmaven.test.skip=true
 mvn dependency:copy-dependencies -DoutputDirectory=libs

其中最后边这条是命令行调用需要的

命令行调用

中文分词

1
2
fnlp]# java -Xmx1024m -Dfile.encoding=UTF-8 -classpath "fnlp-core/target/fnlp-core-2.1-SNAPSHOT.jar:libs/trove4j-3.0.3.jar:libs/commons-cli-1.2.jar" org.fnlp.nlp.cn.tag.CWSTagger -s models/seg.m "自然语言是人类 交流和思维的主要工具,是人类智慧的结晶。"
自然 语言 是 人类 交流 和 思维 的 主要 工具 , 是 人类 智慧 的 结晶 。

中文词性标注

1
2
fnlp]# java -Xmx1024m -Dfile.encoding=UTF-8 -classpath "fnlp-core/target/fnlp-core-2.1-SNAPSHOT.jar:libs/trove4j-3.0.3.jar:libs/commons-cli-1.2.jar" org.fnlp.nlp.cn.tag.POSTagger -s models/seg.m models/pos.m "周杰伦出生于台湾,生日为79年1月18日,他曾经的绯闻女友是蔡依林。"
周杰伦/人名 出生/动词 于/介词 台湾/地名 ,/动词 生日/名词 为/介词 79年/时间短语 1月/时间短语 18日/时间短语 ,/标点 他/人称代词 曾经/形容词 的/结构助词 绯闻/名词 女友/名词 是/动词 蔡依林/人名 。/标点

实体名标注

1
2
java -Xmx1024m -Dfile.encoding=UTF-8 -classpath "fnlp-core/target/fnlp-core-2.1-SNAPSHOT.jar:libs/trove4j-3.0.3.jar:libs/commons-cli-1.2.jar" org.fnlp.nlp.cn.tag.NERTagger -s models/seg.m models/pos.m "詹姆斯·默多克和丽贝卡·布鲁克斯 鲁珀特·默多克旗下的美国小报《纽约邮报》的职员被公司律师告知,保存任何也许与电话窃听及贿赂有关的文件。"
{美国=地名, 纽约=地名, 詹姆斯·默多克=人名, 鲁珀特·默多克=人名, 丽贝卡·布鲁克斯=人名}

HanLP

NLPIR

BosonNLP

http://bosonnlp.com/demo

This post is licensed under CC BY 4.0 by the author.