Télécharger le PDF
1) Expliquez ce qu'est Cassandra?
Cassandra est un système de stockage de données open source développé chez Facebook pour la recherche dans la boîte de réception et conçu pour stocker et gérer de grandes quantités de données sur des serveurs de base. Il peut servir à la fois
- Système de stockage de données en temps réel pour les applications en ligne
- Également en tant que base de données intensive en lecture pour le système de business intelligence
2) A quoi sert Cassandra et pourquoi utiliser Cassandra?
Cassandra a été conçu pour gérer les charges de travail Big Data sur plusieurs nœuds sans aucun point de défaillance unique. Les différents facteurs responsables de l'utilisation de Cassandra sont
- Il est tolérant aux pannes et cohérent
- Évolutivité de gigaoctets à pétaoctets
- C'est une base de données orientée colonnes
- Pas de point de défaillance unique
- Pas besoin de couche de mise en cache séparée
- Conception de schéma flexible
- Il dispose d'un stockage de données flexible, d'une distribution facile des données et d'écritures rapides
- Il prend en charge les propriétés ACID (atomicité, cohérence, isolation et durabilité)
- Compatible avec plusieurs centres de données et cloud
- Compression de données
3) Expliquez ce qu'est le type composite dans Cassandra?
Dans Cassandra, le type composite permet de définir une clé ou un nom de colonne avec une concaténation de données de type différent. Vous pouvez utiliser deux types de type composite
- Clé de ligne
- Nom de colonne
4) Comment Cassandra stocke les données?
- Toutes les données stockées sous forme d'octets
- Lorsque vous spécifiez un validateur, Cassandra garantit que ces octets sont codés conformément aux exigences
- Puis un comparateur ordonne la colonne en fonction de l'ordre spécifique à l'encodage
- Alors que les composites ne sont que des tableaux d'octets avec un codage spécifique, pour chaque composant, il stocke une longueur de deux octets suivie du composant codé en octets suivi d'un bit de terminaison.
5) Mentionner quels sont les principaux composants du modèle de données Cassandra?
Les principaux composants du modèle de données Cassandra sont
- Grappe
- Espace clé
- Colonne
- Colonne et famille
6) Expliquez ce qu'est une famille de colonnes dans Cassandra?
La famille de colonnes de Cassandra est référencée pour une collection de lignes.
7) Expliquez ce qu'est un cluster à Cassandra?
Un cluster est un conteneur pour les espaces de clés. La base de données Cassandra est segmentée sur plusieurs machines qui fonctionnent ensemble. Le cluster est le conteneur le plus externe qui organise les nœuds dans un format en anneau et leur attribue des données. Ces nœuds disposent d'un réplica qui prend en charge en cas d'échec de la gestion des données.
8) Énumérez les autres composants de Cassandra?
Les autres composants de Cassandra sont
- Nœud
- Centre de données
- Grappe
- Journal de validation
- Table de mémoire
- SSTable
- Filtre de floraison
9) Expliquez ce qu'est un espace de clés dans Cassandra?
Dans Cassandra, un espace de clés est un espace de noms qui détermine la réplication des données sur les nœuds. Un cluster se compose d'un espace de clés par nœud.
10) Quelle est la syntaxe pour créer un espace de clés dans Cassandra?
La syntaxe de création d'espace de clés dans Cassandra est
CREATE KEYSPACE
11) Mentionner quelles sont les valeurs stockées dans la colonne Cassandra?
Dans la colonne Cassandra, il y a essentiellement trois valeurs
- Nom de colonne
- Évaluer
- Horodatage
12) Mentionnez quand vous pouvez utiliser Alter keyspace?
ALTER KEYSPACE peut être utilisé pour modifier des propriétés telles que le nombre de répliques et le durable_write d'un espace de clés.
13) Expliquez ce qu'est Cassandra-Cqlsh?
Cassandra-Cqlsh est un langage de requête qui permet aux utilisateurs de communiquer avec sa base de données. En utilisant Cassandra cqlsh, vous pouvez effectuer les opérations suivantes
- Définir un schéma
- Insérez une donnée et
- Exécuter une requête
14) Mentionner ce que déterminent les commandes shell «Capture» et «Consistency»?
Il existe différentes commandes shell Cqlsh dans Cassandra. La commande «Capture», capture la sortie d'une commande et l'ajoute à un fichier tandis que la commande «Cohérence» affiche le niveau de cohérence actuel ou définit un nouveau niveau de cohérence.
15) Qu'est-ce qui est obligatoire lors de la création d'une table dans Cassandra?
Bien que la création d'une clé primaire de table soit obligatoire, elle est constituée d'une ou plusieurs colonnes d'une table.
16) Mentionner ce qui doit être pris en compte lors de l'ajout d'une colonne?
Lors de l'ajout d'une colonne, vous devez veiller à ce que
- Le nom de colonne n'est pas en conflit avec les noms de colonne existants
- La table n'est pas définie avec l'option de stockage compact
17) Mentionner ce que sont les collections Cassandra-CQL?
Les collections Cassandra CQL vous aident à stocker plusieurs valeurs dans une seule variable. Dans Cassandra, vous pouvez utiliser les collections CQL des manières suivantes
- Liste : il est utilisé lorsque l'ordre des données doit être maintenu et qu'une valeur doit être stockée plusieurs fois (contient la liste des éléments uniques)
- SET : Il est utilisé pour le groupe d'éléments à stocker et renvoyé dans des ordres triés (contient des éléments répétitifs)
- MAP : C'est un type de données utilisé pour stocker une paire d'éléments clé-valeur
18) Expliquez comment Cassandra écrit les données?
Cassandra écrit les données en trois composants
- Écriture du journal de validation
- Écriture Memtable
- Ecriture de la table
Cassandra écrit d'abord les données dans un journal de validation, puis dans une structure de table en mémoire memtable et enfin dans SStable
19) Expliquez ce qu'est Memtable à Cassandra?
- Cassandra écrit les données dans une structure en mémoire appelée Memtable
- Il s'agit d'un cache en mémoire avec un contenu stocké sous forme de clé / colonne
- Par clé, les données Memtable sont triées
- Il existe un Memtable distinct pour chaque ColumnFamily, et il récupère les données de colonne de la clé
20) Expliquez en quoi consiste SStable?
SStable se compose principalement de 2 fichiers
- Fichier d'index (filtre Bloom et paires de décalage de clé)
- Fichier de données (données de colonne réelles)
21) Expliquez à quoi sert Bloom Filter à Cassandra?
Un filtre de floraison est une structure de données économe en espace utilisée pour tester si un élément est membre d'un ensemble. En d'autres termes, il est utilisé pour déterminer si un SSTable a des données pour une ligne particulière. Dans Cassandra, il est utilisé pour enregistrer les E / S lors d'une recherche de clé.
22) Expliquez comment Cassandra écrit les données modifiées dans le commitlog?
- Cassandra concatène les données modifiées dans commitlog
- Commitlog agit comme un journal de reprise après incident pour les données
- Tant que les données modifiées ne sont pas concaténées à l’opération d’écriture de commitlog, l’opération d’écriture ne sera jamais considérée comme réussie
Les données ne seront pas perdues une fois que le commitlog est vidé dans le fichier
23) Expliquez comment Cassandra supprime les données?
Les SSTables sont immuables et ne peuvent pas supprimer une ligne de SSTables. Lorsqu'une ligne doit être supprimée, Cassandra attribue à la valeur de colonne une valeur spéciale appelée Tombstone. Lorsque les données sont lues, la valeur Tombstone est considérée comme supprimée.