Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

dp2书目检索中组合检索的检索速度以及测试结果——探测检索 #1195

Open
Branddddy opened this issue Nov 5, 2024 · 0 comments

Comments

@Branddddy
Copy link

该issue将讨论书目查询窗中组合页面中使用多条数据进行批量检索的问题
批量检索中首先的问题如下

检索速度的探索

系统经过优化更新之后更新了 BatchSearch() API 原有的批检索API为 BiblioSearch() 更新后,我进行了一次检索,检索样本用例的数量为364条确认重复的书目数据,使用原 BiblioSearch() API情况下在书目数据库为16000条左右时,完成检索的时间为1:03.16,使用BatchSearch()之后检索速度为 0:33.56 ,检索提升在50%左右,考虑到批检索实际上是把原BiblioSearch()中逐条检索变成了每十条一检索,在样本量或书目数据库数据量更大的时候,提升会更明显

探测检索模式的探索

在实际使用中,有客户提出如果批检索字段中存在空格会出现检索不准的情况,本次测试将空格加入对于探索模式的批检索进校了研究。使用样本为10的ISBN数据与本地书目库16000条数据进行测试结果如下

  • 使用单一的ISBN检索,不使用组配检索,不采用探测检索,检索样本为10,命中结果23行
  • 单一一行使用探测检索,在未对数据进行修改的情况下,进行检索,命中结果23行
  • 在第一行ISBN下加一个(空格+ISBN)此ISBN与馆内所有书籍不重复新增ISBN为7-01-001943-6进行检索,命中结果23行
  • 将新增ISBN为7-01-001943-6放在第一行isbn前,并用空格隔开,命中结果与上述结果相同
  • 将一个系统中确定重复的ISBN加入其中一行,并用空格隔开 978-7-5667-3653-6 命中结果为21行仅命中空格前的ISBN号,空格后方的ISBN未被检索到
  • ISBN不变,题名后加空格再加一个题名(题名不重复)添加题名为:人民 最后检索结果为23条,新增的人民字段未作为检索字段
  • ISBN不变,题名前加空格再加一个题名(题名不重复)添加题名为:人民 最后检索结果为12条,新增的人民字段未作为检索字段,新增的人民作为检索字段且未命中图书馆中任何数据

由此得出结论,探索模式会使用空格隔开检索词

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant