Dans cet article, nous verrons ce qui est l'indexation et pourquoi il est important dans un moteur de recherche.

Chaque moteur de recherche a 3 composants principaux-

  1. Rampant.
  2. Indexage.
  3. Le traitement des requêtes.

Qu'est-ce que l'indexation / Un index?

Laissez-nous l'imagerie vous avez un site qui vend des ordinateurs portables en ligne. L'une des tâches que vous est de créer un moteur de recherche qui permet de rechercher dans votre inventaire des ordinateurs portables. Nous supposons également que vous avez une liste d'ordinateurs portables, leurs noms, prix etc dans un fichier csv.l'indexation du livre

Avant de pouvoir rechercher à travers ces données, vous devez créer un index de moteur de recherche. Avoir un index aide à obtenir des résultats de recherche plus rapide et plus rapide. Si non, le moteur de recherche devra effectuer des recherches dans tous les produits un par un qui prendra une grande quantité de temps. (moins de temps de traitement).

Ceci est similaire à un indice que vous verriez à la fin d'un livre qui vous aide à trouver le contenu plus rapide.

Qu'est-ce qu'un index inversé?

Dans un index inversé, chacun des points de terme indexés sur une liste de documents qui contiennent le terme. Voici un exemple qui montre comment un index inversé ressemble.

Comparez cela avec un indice de livre ordinaire . Pouvez-vous voir la similitude

Comment l'indexeur obtenir les données –

  1. XML, alimentation JSON
  2. CSV
  3. crawl Web
  4. flux RSS ou ATOM.

Comment les données index?

Voici des outils open source vous permettra de créer un index gratuitement. (vous aurez besoin d'avoir des connaissances de codage)

  1. SOLR
  2. elasticsearch
  3. Sphinx

Expertrec est une solution payante qui prend en charge l'indexation une fois que vous téléchargez un document dans les formats mentionnés ci-dessus. (aucun codage requis).

Comment augmenter la vitesse d'indexation?

  1. Réduire le nombre de champs à indexer.
  2. Utilisez les disques SSD.
  3. Augmenter la RAM des machines qui sont l'indexation.

 

 

 

Catégories: indexage

Muthali Ganesh

Muthali aime écrire sur les technologies émergentes et des solutions faciles pour les questions de technologie complexes. Vous pouvez le rejoindre à travers le chat ou en soulevant un ticket de support sur le côté gauche de la page.