使用搜索溢出系数微调搜索

除了了解和利用搜索标记与搜索特性的基础知识,以返回更精确的 Vault 搜索(请参见搜索 Vault),管理员还可以通过修改 web.config 文件中的“搜索溢出系数”来控制用户收到的 Vault 搜索结果的“范围”。

“搜索溢出系数”用于确定搜索短语中的任意两个词语之间可以存在多少位置,并且仍被视为相匹配。这些位置的范围介于完全匹配的搜索字符串与此字符串的多个组合之间。

“溢出”是一个编辑距离,其中距离单位是指在查询短语中可以偏离位置并且在搜索中仍然能够捕获的标记移动数。例如,若要切换搜索中两个词语的顺序,需要两次移动。第一次移动将词语放在另一个词语的上方,第二次移动对它们进行重新排序。因此,若要允许对具有两个词语或标记的搜索字符串进行重新排序,溢出必须至少设置为 2。

简单来说,溢出系数可确定从在搜索结果中排除之前,允许的搜索标记顺序颠倒的程度。默认情况下,匹配越精确,优先级越高,但是该值可以直接影响搜索结果的总数。

配置溢出系数

  1. 从 Web.config 文件 (C:\Program Files\Autodesk\Vault Server 20xx) 中,找到以下两行:

    !-- slop factor provided to lucene search -->
    
    <add key="SearchSlopFactor" value="10" />
  2. 在 ADMS 服务器上修改“SearchSlopFactor”来指定搜索返回的结果。根据您所做的更改,将具有更多优化或公开的搜索结果集。

    默认情况下,溢出值设置为 10。最低可以将此值设置为 0(表示仅限精确匹配),也可以将此范围增加至所需的值。

    注: 请记住,这些更改将如何影响用户搜索体验。如果该值太低,用户可能会因找不到正确的数据而失望。如果该值太高,用户可能需要对太多的搜索结果进行排序。

示例 1:通过多个标记搜索

示例 2:使用较少的标记进行搜索