Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Pour un appariement spécifique, permettre avec une option d'accepter l'absence de lieu de naissance sans pénalité (blindScore) #239

Open
cristianpb opened this issue May 14, 2021 · 1 comment

Comments

@cristianpb
Copy link
Member

cristianpb commented May 14, 2021

Par exemple:

https://deces.matchid.io/deces/api/v1/search?birthDate=23/01/1928&deathDate=2020

{
  "request": {
    "sort": [
      {
        "score": "desc"
      }
    ],
    "birthDate": "23/01/1928",
    "deathDate": "2020"
  },
  "response": {
    "total": 2114,
    "maxScoreES": 20.128998,
    "size": 20,
    "page": 1,
    "delay": 56,
    "persons": [
      {
        "score": 0,
        "source": "2020",
        "sourceLine": 26,
        "scores": {
          "birthDate": 1,
          "birthLocation": {
            "score": 0.75
          },
          "deathDate": 0.25,
          "score": 0.34,
          "es": 0.1,
          "multiMatchPenalty": 0.51,
          "multiMatch": 20
        },
....

Le premier résultat devrait pas avoir birthLocation dans le score parce qu'il n'y a pas de lieu de naissance dans la requête.

@cristianpb cristianpb added the bug Something isn't working label May 14, 2021
@rhanka
Copy link
Member

rhanka commented May 14, 2021

C'est volontaire - même si discutable.

Attention, la suppression du score engendrerait un profond déséquilibre dans toutes les évaluations menées à ce stade.

L'absence de lieu de naissance doit être pénalisée puisqu'elle rend incertain le matching.

La seule fonction de multimatch ne palie pas à une carence du doute non quantifié "homonymie parmi les vivants". Il est donc indispensable de conserver un scoring de type "blindScore".

Le problème est lorsqu'on a un dataset mixte :

nom         prénom       lieu        date
jean        martin                   01/02/1915
maire       dupont       Lyon        15/10/1931

Proposition: mettre des options pour désactiver les pénalités de "blindScores", mais seulement si explicitement assumées par la personne qui soumet le matching.

@rhanka rhanka removed the bug Something isn't working label May 14, 2021
@rhanka rhanka changed the title Location score apparait même quand il n'y a pas de lieu de naissance Permettre d'accepter l'absence de lieu de naissance sans pénalité (blindScore) avec une option pour certains cas particuliers May 14, 2021
@rhanka rhanka changed the title Permettre d'accepter l'absence de lieu de naissance sans pénalité (blindScore) avec une option pour certains cas particuliers Pour un appariement spécifique, permettre avec une option d'accepter l'absence de lieu de naissance sans pénalité (blindScore) May 14, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants