Différence entre les SGBD distribués et les bases de données parallèles
Depuis février 2012, la plupart des bases de données se composent d'un logiciel serveur et d'un ensemble de fichiers qui résident tous sur un seul ordinateur. Des approches plus avancées utilisent plusieurs ordinateurs et de nombreux fichiers, parfois à des emplacements différents. Les méthodes parallèles et distribuées améliorent la vitesse d'accès pour les très grandes bases de données, l'accès pour les organisations géographiquement dispersées et la fiabilité des applications qui dépendent de la disponibilité.
Structure
Une base de données distribuée héberge des données dans deux ou plusieurs ordinateurs serveurs à des emplacements distincts. Par exemple, un siège social à Chicago a une base de données et un entrepôt à Kansas City en a une autre. Les deux partagent un lien sur Internet, de sorte que la base de données de Chicago reçoit chaque nuit les enregistrements d'expédition de Kansas City. Une base de données parallèle typique réside dans un emplacement avec un ensemble de fichiers, bien que plusieurs ordinateurs partagent la charge de travail.
Vitesse
Le principal avantage d'une base de données parallèle est la rapidité. Comme une base de données standard exécutée sur un ordinateur, une base de données parallèle reçoit le langage de requête structuré ou les requêtes SQL des utilisateurs. Le serveur les décompose en une série d'étapes, puis les exécute. Un serveur de base de données standard exécute toutes les étapes par lui-même, tandis qu'une base de données parallèle attribue des étapes à différents ordinateurs. Lorsque chaque ordinateur termine sa tâche, la base de données assemble les informations et renvoie les résultats à l'utilisateur. Étant donné que chaque ordinateur ne travaille que sur une partie du travail, ils terminent ensemble une requête SQL en beaucoup moins de temps. Au fur et à mesure que les besoins en base de données d'une organisation augmentent, vous ajoutez des ordinateurs à la base de données parallèle pour répondre à l'augmentation de la charge de travail.
Accès
Les bases de données distribuées améliorent l'accès, car chaque bureau local possède sa propre base de données. La plupart des transactions SQL ont lieu au niveau du bureau sans les retards occasionnés par les réseaux de données longue distance. Chaque base de données locale a des informations en commun avec les autres, mais peut également avoir des données uniques à l'emplacement. Périodiquement, les bases de données locales se synchronisent sur un réseau longue distance pour rester à jour les unes avec les autres. En revanche, une base de données parallèle n'améliore pas l'accès aux emplacements distants.
Fiabilité
Les bases de données distribuées et parallèles abordent la fiabilité de différentes manières. Une base de données exécutée sur un seul ordinateur dépend entièrement de la fiabilité de cette machine :dès que l'ordinateur tombe en panne, la base de données devient indisponible. La plupart des bases de données parallèles ont une fonctionnalité qui surveille l'état de chaque ordinateur; en cas d'échec, le programme serveur le supprime du service mais la base de données reste disponible, mais avec des performances réduites. Pour une base de données distribuée, les serveurs locaux restants continuent à traiter les informations si l'on développe un problème; la panne n'affecte que les utilisateurs locaux de l'ordinateur défaillant.