搜索中文Solr Analysis And Solr Query -- Solr分析以及查询-白红宇

搜索中文Solr Analysis And Solr Query -- Solr分析以及查询

阅读量：5260 次

发布时间：2019-06-14

本文共 3772 字，大约阅读时间需要 12 分钟。

工作之余抽点时间出来写写博文，希望对新接触的朋友有帮助。今天在这里和大家一起学习一下搜索中文

在应用Solr中文分词器IkAnalizer时，查询时其实不会对搜索句语停止切分词。比如搜索：华为手机，到得的结果只含包与“华为手机”完整配匹的Document，而题标，或者Tag含包"华为"或"手机"的Document并没有被搜索出来。基于这个原因，停止搜索时，须要先对搜索句语停止分词，组装终究搜索句语，然后停止搜索。

1.应用IKAnalyzer来对中文停止析分

</analyzer>

</fieldType>

2.应用此型类于关相属性

3.对查询句语停止析分（应用text_chinese型类停止分词）

public String analysisBeforeQuery(String queryTerm)

{

String nextQuery = "";

SolrQuery query = new SolrQuery();

query.add(CommonParams.QT, "/analysis/field"); // query type

query.add(AnalysisParams.FIELD_VALUE, queryTerm);

query.add(AnalysisParams.FIELD_TYPE, "text_chinese");

//query.add(AnalysisParams.FIELD_NAME, "product_name");

try

{

/* solr应用text_chinese停止析分的结果

* {responseHeader={status=0,QTime=1},analysis={field_types={text_chinese={index={org.wltea.analyzer.lucene.IKTokenizer=[{text=华为,raw_bytes=[e5 8d 8e e4 b8 ba],start=0,end=2,type=CN_WORD,position=1,positionHistory=[1]}, {text=手机,raw_bytes=[e6 89 8b e6 9c ba],start=2,end=4,type=CN_WORD,position=2,positionHistory=[2]}, {text=手,raw_bytes=[e6 89 8b],start=2,end=3,type=CN_WORD,position=3,positionHistory=[3]}, {text=机,raw_bytes=[e6 9c ba],start=3,end=4,type=CN_CHAR,position=4,positionHistory=[4]}]}}},field_names={}}}

//对响应停止析解

每日一道理

生活中受伤难免，失败跌倒其实不可怕，可怕的是因此而一蹶不振，失去了对人生的追求与远大的理想。没有一个人的前进道路是平平稳稳的，就算是河中穿梭航行的船只也难免颠簸，生活中所遇上的坎坷磨难不是偶尔给予的为难，而是必然所经受的磨练。

NamedList<Object> analysis = (NamedList<Object>) response.getResponse().get("analysis");// analysis node

NamedList<Object> field_types = (NamedList<Object>) analysis.get("field_types");// field_types node

NamedList<Object> text_chinese = (NamedList<Object>) field_types.get("text_chinese");// text_chinese node

NamedList<Object> index = (NamedList<Object>) text_chinese.get("index");// index node

List<SimpleOrderedMap<String>> list = (ArrayList<SimpleOrderedMap<String>>) index.get("org.wltea.analyzer.lucene.IKTokenizer");// tokenizer node

// 在个每词条间中加上空格，为个每词条停止或算运

for(Iterator<SimpleOrderedMap<String>> iter = list.iterator(); iter.hasNext();)

{

nextQuery += iter.next().get("text") + " ";

}

catch (SolrServerException e)

{

e.printStackTrace();

}

return nextQuery.trim(); // 去掉最后一个空格并返回组装的字符串

}

4.停止终究查找

public void queryDocuments(String queryTerm)

{

String query_term = analysisBeforeQuery(queryTerm);

SolrQuery solrQuery = new SolrQuery(query_term);

solrQuery.add("defType", "dismax");

solrQuery.add("qf", "product_name product_tags^10");

solrQuery.add("fl", "*");

try

{

QueryResponse queryResponse = solrServer.query(solrQuery);

for(SolrDocument doc : queryResponse.getResults())

{

// 执行操纵

//.....

}

catch (SolrServerException e)

{

e.printStackTrace();

}

这里，略省了SolrServer的命生：private static HttpSolrServer solrServer = new HttpSolrServer("http://localhost:8080/solr/product/");

至此，我们可以搜索到期望的结果了.....

Next Blog, Readers.....

文章结束给大家分享下程序员的一些笑话语录：大家喝的是啤酒，这时你入座了。

你给自己倒了杯可乐，这叫低配置。

你给自已倒了杯啤酒，这叫标准配置。

你给自己倒了杯茶水，这茶的颜色还跟啤酒一样，这叫木马。

你给自己倒了杯可乐，还滴了几滴醋，不仅颜色跟啤酒一样，而且不冒热气还有泡泡，这叫超级木马。

你的同事给你倒了杯白酒，这叫推荐配置。

菜过三巡，你就不跟他们客气了。

你向对面的人敬酒，这叫p2p。

你向对面的人敬酒，他回敬你，你又再敬他……，这叫tcp。

你向一桌人挨个敬酒，这叫令牌环。

你说只要是兄弟就干了这杯，这叫广播。

有一个人过来向这桌敬酒，你说不行你先过了我这关，这叫防火墙。

你的小弟们过来敬你酒，这叫一对多。

你是boss，所有人过来敬你酒，这叫服务器。

酒是一样的，可是喝酒的人是不同的。

你越喝脸越红，这叫频繁分配释放资源。

你越喝脸越白，这叫资源不释放。

你已经醉了，却说我还能喝，叫做资源额度不足。

你明明能喝，却说我已经醉了，叫做资源保留。

喝酒喝到最后的结果都一样

你突然跑向厕所，这叫捕获异常。

你在厕所吐了，反而觉得状态不错，这叫清空内存。

你在台面上吐了，觉得很惭愧，这叫程序异常。

你在boss面前吐了，觉得很害怕，这叫系统崩溃。

你吐到了boss身上，只能索性晕倒了，这叫硬件休克。

转载于:https://www.cnblogs.com/xinyuyuanm/archive/2013/05/07/3065677.html

你可能感兴趣的文章

hdu 1032 The 3n + 1 problem

A-Softmax的总结及与L-Softmax的对比——SphereFace

composer 报 zlib_decode(): data error

查看>>

linux下WPS的使用

查看>>

java 中 finally里面写了return 会发生什么？

BZOJ 题目1036: [ZJOI2008]树的统计Count（Link Cut Tree，改动点权求两个最大值和最大值）...

查看>>

《深入分析Java Web技术内幕》读书笔记之JVM内存管理

查看>>