Solr自动生成ID配置实践

Solr基于Lucene的索引,而索引中的最基本的单元式Document,在Solr中,管理每一个Document(更新、删除、查询),基本都会用到对应的ID,类似关系数据表中的主键。但是,如果我希望Solr能够自动生成这个唯一的ID,有时候也省去了不少的工作,而只需要在Solr中进行配置即可。
下面,通过实例来说明,如何配置Solr支持的UUID。首先,示例的schema.xml对应的表结构,如图所示:

在Solr中配置生成唯一UUID,需要修改两个配置文件:

  • schema.xml

schema.xml文件的配置内容,增加如下类型配置:

<fieldType name="uuid" class="solr.UUIDField" indexed="true" />

再增加ID字段的类型,如下所示:

<field name="id" type="uuid" indexed="true" stored="true" multiValued="false" required="true" />

这样还不够,还需要指定在更新索引的时候,使用这个更新策略,即配置一个requestHandler元素。

  • solrconfig.xml

配置solrconfig.xml文件,修改更新索引的requestHandler 配置,内容如下所示:

     <requestHandler name="/update" class="solr.UpdateRequestHandler">
          <lst name="defaults">
               <str name="update.chain">dispup</str>
          </lst>
     </requestHandler>

上面的update.chain就是我们实际要指定的使用UUID进行更新的策略的配置,如下所示:

     <updateRequestProcessorChain name="dispup">
          <processor class="solr.UUIDUpdateProcessorFactory">
               <str name="fieldName">id</str>
          </processor>
          <processor class="solr.LogUpdateProcessorFactory" />
          <processor class="solr.DistributedUpdateProcessorFactory" />
          <processor class="solr.RunUpdateProcessorFactory" />
     </updateRequestProcessorChain>

经过上面两步配置,在进行索引的时候,就不需要指定Document所要求的ID了,完全有Solr自动生成这个ID字符串。下面看看,我们配置后,生成的Document的信息,示例如下所示:

<response>
     <lst name="responseHeader">
          <int name="status">0</int>
          <int name="QTime">1</int>
     </lst>
     <result name="response" numFound="86773" start="0">
          <doc>
               <int name="log_id">6410</int>
               <long name="start_time">87318</long>
               <long name="end_time">88282</long>
               <int name="prov_id">1</int>
               <int name="city_id">105</int>
               <int name="area_id">0</int>
               <int name="idt_id">5100</int>
               <int name="cnt">29</int>
               <int name="net_type">5</int>
               <int name="time_type">1</int>
               <int name="time_id">20130810</int>
               <str name="id">4cb43476-eb96-498e-a3a0-8d13c0a6c8c5</str>
               <long name="_version_">1443405623457742848</long>
          </doc>
          <doc>
               <int name="log_id">6410</int>
               <long name="start_time">87318</long>
               <long name="end_time">88282</long>
               <int name="prov_id">1</int>
               <int name="city_id">105</int>
               <int name="area_id">0</int>
               <int name="idt_id">5101</int>
               <int name="cnt">29</int>
               <int name="net_type">5</int>
               <int name="time_type">1</int>
               <int name="time_id">20130810</int>
               <str name="id">faef555d-1587-489e-889a-c7c696607d3b</str>
               <long name="_version_">1443405623459840000</long>
          </doc>
     </result>
</response>

可见,正好满足我们的需要。

Creative Commons License

本文基于署名-非商业性使用-相同方式共享 4.0许可协议发布,欢迎转载、使用、重新发布,但务必保留文章署名时延军(包含链接:http://shiyanjun.cn),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请与我联系

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>