翻译自 Apache Solr Reference Guide
solr一个最基本的设计原则是简洁, 你告诉他很多信息,然后问他一些问题,他会给你回答的一段信息,你喂给他的这部分叫做 indexing, 你问他的问题叫做 query。
一个理解solr的方法是举个例子,我们用一个美食的活页本,每一次你加一个活页到这本书中,你更新在最后面的索引,你列举菜的每个成分和页码在最后,设想一下你加了一百个美食,你能很快找到含有豆腐这个食材的美食,用索引能非常快的找到你想要的东西相比直接一页一页的翻着查找。
schema就是你告诉solr 在输入的文档中打算用什么做索引的。
solr眼中的世界是什么样子的。
document是solr中最基本的单元,一个美食的document可能包含这些美食的材料,需要做哪些准备,需要哪些工具,烹饪的时间等等,一个人的document可能包含这个人的名字,年龄,毕业院校等等。
在solr中,document由field组成,field可能描述信息的一些片段,鞋号可能是一个field,姓名也可能是一个field。
fields可能包含不同种类的数据。一个name field ,一般会被定义成text的,一个年龄,可能是float的,如果很好的定义这些类型,solr能够正确的探测到他们,你的用户会得到更好的query。
Field analysis
field analysis 告诉solr应该怎么用过来的数据建索引,一个更加精确的过程可以试processing,或者digestion. 举个例子,一个个人传记中的内容应该都被索引,这样你能快速找到一个对机器学习特别有研究的人,然而有些词是你需要了解的或者说对于你根本没有意义,比如说 你,的,好,而有的词是比较重要的比如机器学习,这种比较有代表性的词,solr解决这类问题的方法是你告诉solr如果这个field做切分,比如去停用词,比如把所有的字母小写。
Field Type定义和属性
一个field的type包含以下4类信息:
1. type名字
2. 继承类的名字
3. 如果type是TextField,定义如何分析它
4. field属性
schema api
使用rest接口可以获取现在collection的fields的一些定义,包括dynamicfields,name ,version,uniquekey等等。
DocValue
这个概念是新加进去的,方便用在sort,facet这些功能中,这样不需要便利这个索引,就能完成一些操作,类似于正排的一些信息。
相关推荐
Apache Solr lucene 搜索模块设计实现 Solr 模块 架构 lucene 搜索
solr schema solrconfig 配置文件解析 solr schema solrconfig 配置文件解析
3.4.1 Solr Schema 设计(如何定制索引的结构?) 34 3.5 如何进行索引操作? 36 3.5.1 基本索引操作 36 3.5.2 批量索引操作 37 3.6 如何进行搜索 39 3.6.1 搜索语法 39 3.6.2 排序 42 3.6.3 字段增加权重 42 3.6.4 ...
Apache Solr 架构分析内部设计篇PDF Solr 源码 架构 分析 设计
solr中的schema.xml说明
毕业设计基于Springboot的个人博客系统源码,集成solr服务器毕业设计基于Springboot的个人博客系统源码,集成solr服务器毕业设计基于Springboot的个人博客系统源码,集成solr服务器毕业设计基于Springboot的个人博客...
solrconfig.xml和schema.
solr.warsolr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包solr.war包...
包括solr的所有资源文件文件清单如下: IKAnalyzer.cfg.xml ik-analyzer-solr5-5.x.jar ...managed-schema mysql-connector-java-5.1.7-bin.jar solrconfig.xml data-config.xml ext.dic stopword.dic
基于Solr的搜索引擎的设计与实现
solr
3.3.3 Document 6 3.3.4 Field 6 3.3.5 IndexWriter 6 3.3.6 IndexSearcher 6 3.3.7 Directory 6 3.3.8 Segment 7 3.3.9 QueryParser 7 3.3.10 Hits 7 4.应用示例 7 4.1 创建索引 7 4.1 删除索引 7 4.1 索引查询 8 5...
solr
solr文档
solr搜索框架的中文分词器文件及配置详解供大家下载,亲测可用....编辑cor下路径的managed-schema文件(solr-8.1.1\server\solr\configsets\_default\conf下拷贝到solr_home的具体CORE名称文件夹下的schema文件)
It explains how a Solr schema defines the fields and field types which Solr use to organize data within the document files it indexes. : This section explains how Solr prepares Understanding ...
他的主要特性包括:高效,灵活的缓存功能,垂直搜索功能,高亮下试搜索结果,通过索引复制来提高可用性,提供一套强大的data schema 来定义字段,类型和设置文本分析,提供基于web的管理界面等。
solr manageschema 配置文件,增加了分词器后的配置文件
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http G Solr et操作提出查找请求,并得到XML...