gojieba包特性:
1.其实是 封装了 C++版本的CppJieba 第三方包;
2.内部调用了静态文件(各种utf8文件),而且不是通过embed方式调用; 编译时无法包含静态文件;运行时 会报错如下:
表示无法打开对应的文件
/go/pkg/mod/github.com/ttys3/gojieba@v1.1.3/deps/cppjieba/DictTrie.hpp:203
FATAL exp: [ifs.is_open()] false
open /go/pkg/mod/github.com/ttys3/gojieba@v1.1.3/dict/jieba.dict.utf8 failed.
针对如上错误的解决方法:
在本地开发时,因为静态文件都在固定的位置,运行时能找到对应文件,所以不会报错;
在测试或生产环境时,因为 都是编译好后 直接运行二进制文件,无法在 对应的位置找到utf8 文件,所以报错;
如下代码 兼容 不同环境, 在测试和生产时, 在项目运行的根目录下 新建一个dict文件夹,里面放入对应的utf8文件即可解决; 在docker部署时,通过挂载方式实现dict文件夹在宿主机供其使用;
//
// @Description: 初始化jieba
//
func SetUp() {
//本地开发使用
if DevelopmentStage {
JiebaObj = gojieba.NewJieba()
} else {
//编译部署测试服,生产服使用
//从程序运行的当前目录下的dict文件夹中读取utf8文件
dictDir := path.Join(filepath.Dir(os.Args[0]), "dict")
jiebaPath := path.Join(dictDir, "jieba.dict.utf8")
hmmPath := path.Join(dictDir, "hmm_model.utf8")
userPath := path.Join(dictDir, "user.dict.utf8")
idfPath := path.Join(dictDir, "idf.utf8")
stopPath := path.Join(dictDir, "stop_words.utf8")
JiebaObj = gojieba.NewJieba(jiebaPath, hmmPath, userPath, idfPath, stopPath)
}
}
linux编译方法
针对 特性1,因为其内部包含C++代码的原因,需要 CGO_ENABLED=1 ;
如下在 linux系统编译对应的自身平台的文件;
export GO111MODULE=on
export GOPROXY=https://goproxy.io,direct
GOOS=linux CGO_ENABLED=1 GOARCH=amd64 go build -ldflags="-s -w" -installsuffix cgo -o startApp main.go
注意点:
1.编译时尽量不要跨平台编译,因为需要安装需要额外的软件,耗时费力,而且最后还可能 编译好后,对应平台无法运行;
相关链接: