Normalisation du lemme et de l’Unicode
Recherche IA Normalise les mots fléchis et les glyphes Unicode pendant l’indexation et au moment de la requête de recherche. La normalisation améliore la mémorisation des recherches et permet aux utilisateurs de trouver du contenu avec des variantes de leurs termes de requête de recherche.
Les fonctionnalités de normalisation sont automatiquement activées et ne sont pas configurables.
Normalisation du lemme
De nombreuses langues incluent des formes fléchies de termes, telles que des noms pluriels ou des temps verbaux. Recherche IA Normalise les termes fléchis trouvés dans le contenu indexé et les requêtes de recherche. La normalisation permet une correspondance basée sur une forme racine, telle que le singulier pour un nom pluriel ou la forme de base pour un verbe conjugué. Cette forme racine est appelée lemme, et ce processus est appelé normalisation du lemme.
Par exemple, lorsqu’un enregistrement source inclut le verbe conjugué vendre, Recherche IA développe le terme indexé pour inclure la forme lemme vendre en plus de vendre. Lorsqu’un utilisateur recherche le formulaire conjugué au passé vendu,Recherche IA développe le terme de requête de recherche pour inclure le lemme sous forme vendre ou vendu. Étant donné que le terme indexé et le terme de la requête de recherche incluent des formulaires correspondants, la recherche de l’utilisateur renvoie l’enregistrement de vente en conséquence.
Décomposition
En plus de normaliser les lemmes pour allemand, coréen, norvégien (bokmål) et suédois, Recherche IA indexe les mots composés et les mots qui les composent. Par exemple, lors de l’indexation d’un enregistrement allemand qui contient le mot composé Humanressourcen, Recherche IA indexe les termes composants Human et ressourcen en plus du terme composé.
Normalisation Unicode
Recherche IA Effectue la normalisation Unicode sur les termes indexés et les termes de requête de recherche. Cette normalisation permet de rechercher les glyphes Unicode alphabétiques à l’aide des caractères équivalents les plus proches.
Par exemple, lors de l’indexation d’un enregistrement contenant le terme cv, Recherche IA développe le terme pour inclure également le formulaire cv non accentué. Cet enregistrement s’affiche en tant que résultat de recherche lorsque les utilisateurs recherchent soit un curriculum vitae , soit un curriculum vitae.
La normalisation Unicode comprend les étapes NFKD (décomposition de compatibilité) et NFKC (composition de compatibilité). Pour plus d’informations sur ces formulaires de normalisation, consultez l’annexe de la norme Unicode #15, https://www.unicode.org/reports/tr15/.
Interaction avec d’autres fonctionnalités de recherche
Le tableau suivant décrit les interactions entre la normalisation et d’autres fonctionnalités de recherche.
| Fonctionnalité | Interaction avec le lemme et normalisation Unicode |
|---|---|
| Résultats Genius | Les termes de requête de recherche ajoutés par lemme ou normalisation Unicode ne peuvent pas déclencher de configurations de résultat Genius avec des conditions de déclenchement à terme. |
| Règles d'amélioration des résultats | Un terme de requête de recherche ajouté par lemme ou normalisation Unicode peut déclencher une règle d’amélioration de résultat s’il correspond au déclencheur de requête de la règle. |
| Mots vides | Si un terme de requête de recherche est défini comme un mot vide, Recherche IA supprime ce terme sans le normaliser. |
| Synonymes | Si un terme de requête de recherche est défini comme un synonyme, Recherche IA cela ne le normalise pas. |
| Traitement des erreurs de frappe | Recherche IA Effectue une normalisation lemme et Unicode sur les termes de requête de recherche corrigés automatiquement. |