中文分词算法
Heap: Sizing and Swapping Heap: Sizing and Swapping Give Half Your Memory To Lucene Don’t Cross 30.5G Swapping Is the Death of Performance
Lucene Score 评分机制 先来看几个数学公式,参考官方文档对TFIDFSimilarity的说明 分值算法公式: [score(q,d)=coord(q,d)queryNorm(q)\sum_{t\ in\ d }(tf( t\ in\ d )idf(t)^2t.getBoost()norm(t,d)] 其中 tf(t in d) 表示词频,Term在当前文档中出现...
安装配置 这里使用的2.3.3版本,这个版本默认不能用root直接启动。 具体参考Bootstrap.java中的代码 1 2 3 4 5 6 7 8 9 10 11 public static void initializeNatives(Path tmpFile, boolean mlockAll, boolean seccomp, boolean ctrlHandler) { f...
爬虫相关
添加Latex支持数学公式
A new version of content is available.