Zing génère des résultats de recherche en quatre phases

  • Rversion finale: Zurich
  • Mis à jour 31 juil. 2025
  • 1 minute de lecture
  • Générez des résultats de recherche en divisant les documents entre les partitions, en recherchant des documents de partition, en notant les documents de partition et en fusionnant les scores dans un index.

    Zing génère des résultats de recherche en quatre phases :
    1. Répartissez les documents consultables entre les partitions d’index.
    2. Rechercher et filtrer les documents de partition.
    3. Partitionner des documents.
    4. Fusionner les scores des documents de partition dans un index.

    Phase 1 : Diviser les documents consultables entre les partitions d’index

    Lorsqu’une recherche est exécutée, le système répartit de manière égale tous les documents pouvant faire l’objet d’une recherche entre 10 partitions d’index. Chaque partition possède une liste unique de documents.

    Pour optimiser l’efficacité de la recherche, le système crée 10 threads de requête pour rechercher simultanément chaque partition d’index.

    Figure 1. Répartir les documents entre les partitions d’index
    Le système divise tous les documents consultables en 10 partitions d’index, de la partition 0 à la partition 9.

    Phase 2 : rechercher et filtrer les documents de partition

    Chaque thread de requête parcourt sa liste de partitions pour identifier les documents qui correspondent aux critères de recherche. Par exemple, si vous recherchez « réseau wifi », le système renvoie tous les documents contenant à la fois « wifi » et « réseau » sans ordre particulier.
    Remarque :
    Une recherche de mots multiples équivaut à plusieurs recherches de mots simples reliées par un opérateur ET. Par exemple, [contient][wifi][ET][contient][réseau].

    Le thread de requête attribue à chaque document correspondant une valeur numérique (un ID de document) pour l’identifier de manière unique. Tous les autres documents sont ignorés.

    Phase 3 : Partitionner des documents

    Le thread de requête note chaque document de partition correspondant.

    Figure 2. Threads de requête Rechercher, filtrer et noter les documents de partition
    Le système crée 10 threads de requête pour rechercher, filtrer et noter les documents de partition.

    Phase 4 : fusionner et trier les scores des documents de partition

    Le système fusionne les scores des documents dans un index unique et trie les documents du score le plus élevé au plus bas. Les documents avec le score de document le plus élevé sont les plus pertinents pour la requête de recherche.

    Figure 3. Fusionner et trier les scores des partitions
    Fusionner et trier les scores des partitions.