Comment démarrer un moteur de recherche
Des milliers de programmeurs du monde entier tapent tranquillement sur leurs claviers pour essayer de créer le prochain meilleur moteur de recherche. Sergey Brin et Lawrence Page, les célèbres créateurs de Google, admettent que "la conception d'un moteur de recherche est une tâche difficile". Un moteur de recherche est utilisé pour trouver des informations sur le Web. Un moteur explore Internet et indexe des millions de pages d'informations, crachant des résultats lorsque quelqu'un effectue une recherche.
Obtenir un robot d'exploration Web
Étape 1
Acquérir un robot d'indexation Web, qui est l'araignée ou le bot qui rampe sur Internet en collectant des pages du Web. Une araignée visite des pages Web, les lit et suit des liens vers d'autres pages. Vous pouvez trouver un robot d'exploration open source ou créer le vôtre. Si vous souhaitez créer votre propre robot d'exploration, obtenez une liste d'URL avec lesquelles amorcer votre robot d'exploration. Un robot d'exploration lent est facile à créer, mais créer un robot d'exploration hautes performances pour indexer des millions et des millions de pages est plus difficile.
Étape 2
Obtenez autant de bande passante que vous pouvez vous permettre. Vous avez besoin de cette bande passante pour votre robot d'exploration lorsqu'il se déplace sur le Web pour obtenir des pages.
Étape 3
Construire un index. Tout ce que votre crawler trouve va dans l'index du moteur de recherche. L'index est comme un livre géant ou un catalogue contenant une copie de chaque page Web trouvée par le robot. Anna Patterson de l'Université de Stanford recommande d'indexer uniquement les données dont vous avez besoin pour servir votre type de résultats de recherche. Elle conseille également de ne pas essayer d'indexer "l'évier de la cuisine", mais plutôt "d'obtenir quelque chose de présentable".
Étape 4
Classez vos résultats sur l'index à l'aide d'une base de données performante et de toutes les informations sur vos serveurs issues de votre crawling Web. Vous devez traiter éventuellement des millions de pages Web pour créer votre index. Les pages enregistrées dans votre index doivent être classées dans l'ordre de ce qui est le plus pertinent pour vos internautes.
Étape 5
Créez un site Web attrayant pour renvoyer les résultats de recherche.
Étape 6
Lancez et commercialisez votre moteur de recherche. Selon Laszlo Xalieri de Search Engine Watch.com, un moteur de recherche gratuit devrait emmener les utilisateurs là où ils veulent aller rapidement et avec élégance. Il explique que pour gérer un moteur de recherche performant, "votre objectif est d'attirer les consommateurs et d'en vendre l'accès aux spécialistes du marketing".
Avertissement
N'importe quel programmeur peut démarrer un moteur de recherche, mais fournir des résultats pertinents est le véritable défi.