摘要:
nutch开发(二) 文章目录 nutch开发(二)开发环境 1.爬取后生成的目录结构crawldblinkdbsegments 2.阅读TestCrawlDbMergercreateCrawlDb读取crawldb 3.关于索引的建立4.创建一个一步式的爬虫启动类创建启动类关于如何配置solr服务 阅读全文
posted @ 2022-02-16 11:39
鸭梨的药丸哥
阅读(46)
评论(0)
推荐(0)
摘要:
solr 使用IK分词器 1.jar包下载地址 https://repo1.maven.org/maven2/com/github/magese/ik-analyzer/ 使用wget下载 wget https://search.maven.org/remotecontent?filepath=co 阅读全文
posted @ 2022-02-16 03:09
鸭梨的药丸哥
阅读(19)
评论(0)
推荐(0)

浙公网安备 33010602011771号