博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
搜索中文Solr Analysis And Solr Query -- Solr分析以及查询
阅读量:5260 次
发布时间:2019-06-14

本文共 3772 字,大约阅读时间需要 12 分钟。

工作之余抽点时间出来写写博文,希望对新接触的朋友有帮助。今天在这里和大家一起学习一下搜索中文

           在应用Solr中文分词器IkAnalizer时,查询时其实不会对搜索句语停止切分词。比如搜索:华为手机,到得的结果只含包与“华为手机”完整配匹的Document,而题标,或者Tag含包"华为"或"手机"的Document并没有被搜索出来。基于这个原因,停止搜索时,须要先对搜索句语停止分词,组装终究搜索句语,然后停止搜索。

    1.应用IKAnalyzer来对中文停止析分

      <!-- for searching Chinese words -->

<fieldType name="text_chinese" class="solr.TextField" >
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer">
</analyzer>
</fieldType>

    2.应用此型类于关相属性

    <!--其他域在此略省..... -->

     <field name="product_name"     type="text_chinese"   indexed="true"  stored="true"  multiValued="false" /> <!-- 含包中文的产品名 -->

    <field name="product_tags" type="text_chinese" indexed="true" stored="true" /><!-- 含包中文的产品签标 -->

    3.对查询句语停止析分(应用text_chinese型类停止分词)

    public String analysisBeforeQuery(String queryTerm)

{
String nextQuery = "";

    

    SolrQuery query = new SolrQuery();

query.add(CommonParams.QT, "/analysis/field"); // query type
query.add(AnalysisParams.FIELD_VALUE, queryTerm);
query.add(AnalysisParams.FIELD_TYPE, "text_chinese");
//query.add(AnalysisParams.FIELD_NAME, "product_name");

    try

{

    /* solr应用text_chinese停止析分的结果

* {responseHeader={status=0,QTime=1},analysis={field_types={text_chinese={index={org.wltea.analyzer.lucene.IKTokenizer=[{text=华为,raw_bytes=[e5 8d 8e e4 b8 ba],start=0,end=2,type=CN_WORD,position=1,positionHistory=[1]}, {text=手机,raw_bytes=[e6 89 8b e6 9c ba],start=2,end=4,type=CN_WORD,position=2,positionHistory=[2]}, {text=手,raw_bytes=[e6 89 8b],start=2,end=3,type=CN_WORD,position=3,positionHistory=[3]}, {text=机,raw_bytes=[e6 9c ba],start=3,end=4,type=CN_CHAR,position=4,positionHistory=[4]}]}}},field_names={}}}
*/ 

    //对响应停止析解

    每日一道理
生活中受伤难免,失败跌倒其实不可怕,可怕的是因此而一蹶不振,失去了对人生的追求与远大的理想。没有一个人的前进道路是平平稳稳的,就算是河中穿梭航行的船只也难免颠簸,生活中所遇上的坎坷磨难不是偶尔给予的为难,而是必然所经受的磨练。

    NamedList<Object> analysis =  (NamedList<Object>) response.getResponse().get("analysis");// analysis node

NamedList<Object> field_types =  (NamedList<Object>) analysis.get("field_types");// field_types node
NamedList<Object> text_chinese =  (NamedList<Object>) field_types.get("text_chinese");// text_chinese node
NamedList<Object> index =  (NamedList<Object>) text_chinese.get("index");// index node
List<SimpleOrderedMap<String>> list =  (ArrayList<SimpleOrderedMap<String>>) index.get("org.wltea.analyzer.lucene.IKTokenizer");// tokenizer node

    // 在个每词条间中加上空格,为个每词条停止或算运

    for(Iterator<SimpleOrderedMap<String>> iter = list.iterator(); iter.hasNext();)

{
nextQuery += iter.next().get("text") + " ";
}

    

catch (SolrServerException e)
{
e.printStackTrace();
}
return nextQuery.trim(); // 去掉最后一个空格并返回组装的字符串

    }

    4.停止终究查找

    public void queryDocuments(String queryTerm)

{
String query_term = analysisBeforeQuery(queryTerm);
SolrQuery solrQuery = new SolrQuery(query_term);
solrQuery.add("defType", "dismax");
solrQuery.add("qf", "product_name product_tags^10");
solrQuery.add("fl", "*");

    try

{
QueryResponse queryResponse = solrServer.query(solrQuery);
for(SolrDocument doc : queryResponse.getResults())
{
// 执行操纵

    //.....

    }

catch (SolrServerException e)
{
e.printStackTrace();
}
}

    

    这里,略省了SolrServer的命生:private static HttpSolrServer solrServer = new HttpSolrServer("http://localhost:8080/solr/product/");

    至此,我们可以搜索到期望的结果了.....

    

    Next Blog, Readers.....

    

    

    

文章结束给大家分享下程序员的一些笑话语录: 大家喝的是啤酒,这时你入座了。

你给自己倒了杯可乐,这叫低配置。
你给自已倒了杯啤酒,这叫标准配置。
你给自己倒了杯茶水,这茶的颜色还跟啤酒一样,这叫木马。
你给自己倒了杯可乐,还滴了几滴醋,不仅颜色跟啤酒一样,而且不冒热气还有泡泡,这叫超级木马。
你的同事给你倒了杯白酒,这叫推荐配置。
菜过三巡,你就不跟他们客气了。
你向对面的人敬酒,这叫p2p。
你向对面的人敬酒,他回敬你,你又再敬他……,这叫tcp。
你向一桌人挨个敬酒,这叫令牌环。
你说只要是兄弟就干了这杯,这叫广播。
有一个人过来向这桌敬酒,你说不行你先过了我这关,这叫防火墙。
你的小弟们过来敬你酒,这叫一对多。
你是boss,所有人过来敬你酒,这叫服务器。
酒是一样的,可是喝酒的人是不同的。
你越喝脸越红,这叫频繁分配释放资源。
你越喝脸越白,这叫资源不释放。
你已经醉了,却说我还能喝,叫做资源额度不足。
你明明能喝,却说我已经醉了,叫做资源保留。
喝酒喝到最后的结果都一样
你突然跑向厕所,这叫捕获异常。
你在厕所吐了,反而觉得状态不错,这叫清空内存。
你在台面上吐了,觉得很惭愧,这叫程序异常。
你在boss面前吐了,觉得很害怕,这叫系统崩溃。
你吐到了boss身上,只能索性晕倒了,这叫硬件休克。

转载于:https://www.cnblogs.com/xinyuyuanm/archive/2013/05/07/3065677.html

你可能感兴趣的文章
hdu 1032 The 3n + 1 problem
查看>>
static关键字
查看>>
转:linux终端常用快捷键
查看>>
009.栈实现队列
查看>>
A-Softmax的总结及与L-Softmax的对比——SphereFace
查看>>
关于软件盘覆盖住布局
查看>>
Unity3D 控制物体移动、旋转、缩放
查看>>
UVa 11059 最大乘积
查看>>
UVa 12545 比特变换器
查看>>
数组分割问题求两个子数组的和差值的小
查看>>
10个著名的思想实验1
查看>>
composer 报 zlib_decode(): data error
查看>>
linux下WPS的使用
查看>>
java 中 finally里面写了return 会发生什么?
查看>>
Web Api 利用 cors 实现跨域
查看>>
hdu 3938 并查集
查看>>
谈谈hashcode和equals的用法
查看>>
instanceof
查看>>
BZOJ 题目1036: [ZJOI2008]树的统计Count(Link Cut Tree,改动点权求两个最大值和最大值)...
查看>>
《深入分析Java Web技术内幕》读书笔记之JVM内存管理
查看>>