《Dubbo 实现原理与源码解析 —— 精品合集》 《Netty 实现原理与源码解析 —— 精品合集》
《Spring 实现原理与源码解析 —— 精品合集》 《MyBatis 实现原理与源码解析 —— 精品合集》
《Spring MVC 实现原理与源码解析 —— 精品合集》 《数据库实体设计合集》
《Spring Boot 实现原理与源码解析 —— 精品合集》 《Java 面试题 + Java 学习指南》

摘要: 原创出处 jianshu.com/p/05a6c0de4fff 「逍遥追梦游」欢迎转载,保留摘要,谢谢!


🙂🙂🙂关注**微信公众号:【芋道源码】**有福利:

  1. RocketMQ / MyCAT / Sharding-JDBC 所有源码分析文章列表
  2. RocketMQ / MyCAT / Sharding-JDBC 中文注释源码 GitHub 地址
  3. 您对于源码的疑问每条留言将得到认真回复。甚至不知道如何读源码也可以请教噢
  4. 新的源码解析文章实时收到通知。每周更新一篇左右
  5. 认真的源码交流微信群。

因为中文分词IK Analyzer 2012FF只能适合solr5的版本,但是我需要使用solr8.2.0怎么办??

1、配置ik-analyzer中文分词器

​ 需要下载新版本的:ik-analyzer-8.1.jar 以前旧版本的2012不支持有启动时会报异常

​ 下载地址:https://search.maven.org/search?q=com.github.magese(只能下jar包)

​ 或者

​ GitHub地址:https://github.com/magese/ik-analyzer-solr (可以下载源码,并附有详细的源码,可以导入eclipse运行编译,推荐

我们以GitHub地址为例,点击链接,如下:

下载zip包,如下:

将下载的zip包解压后导入到eclipse maven项目中(聪明的你肯定知道)

在eclipse中打开导入的项目如下:

点击IKAnalzyerDemo类

发现了我们熟悉的main函数,启动试试。。。如下:

这就是我们ik分词的结果。

因为这不是一个打包好的jar文件,我们需要手动打包,打包方式如下:

点击 maven install 稍等片刻即可打包好啦

出现如下提示:

表示打包成功!

此时在我们导入的项目中多了一个target文件夹(没有的化刷新哈呗)

其中包含我们需要的ik-analyzer-8.1.1.jar包;

现在为我们的solr8.2.0添加中文分词

​ 第一步、将eclipse中的ik-analyzer-8.1.1.jar包复制到我们的D:\apache\apache-tomcat-9.0.22\webapps\solr\WEB-INF\lib目录下,同时还要将:D:\apache\solr-8.2.0\contrib\analysis-extras\lucene-libs目录下的lucene-analyzers-smartcn-8.2.0.jar文件也要复制到D:\apache\apache-tomcat-9.0.22\webapps\solr\WEB-INF\lib目录下,(不明白出可以再看下我上篇文章)

第二步、将eclipse中的,如下文件(红框中)

​ ① IKAnalyzer.cfg.xml ② ext.dic ③ stopword.dic ④ ik.conf ⑤ dynamicdic.txt

这5个文件复制到:D:\apache\apache-tomcat-9.0.22\webapps\solr\WEB-INF\classes目录下

如下:

修改D:\apache\apache-tomcat-9.0.22\webapps\solr\solrhome\collection1\conf中的managed-schema(一般没有文件扩展名,可以使用editplus工具打开),在文档的最后,添加如下代码:

<!-- ik分词器 -->

<fieldType name="text_ik" class="solr.TextField">

<analyzer type="index">

<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldType>

添加如图:(千万记得是在managed-schema文件中添加,而不是solrconfig.xml中添加,否则显示不出啦哦)

添加好后,重启tomcat服务器......

等服务器启动好后,在浏览器中打开solr admin管理端:

浏览器输入:http://localhost:8980/solr/index.html#/ 之后进行如下操作

点击Analyse Values 按钮后出现如下界面:

此时我们的中文分词已经添加成功啦,哈哈!歇会吧

以上均是在win7环境下测试,并且通过,也没用加入solr8.2.0集群,仅供参考学习!

文章目录
  1. 1. 1、配置ik-analyzer中文分词器