Les opérations de table telles que la création, la modification et la suppression de tables dans Hive peuvent être observées dans ce didacticiel.
Dans la capture d'écran ci-dessous, nous créons une table avec des colonnes et modifions le nom de la table.
1. Création de la table guru_sample avec deux noms de colonnes tels que "empid" et "empname"
2. Affichage des tables présentes dans la base de données guru99
3. Guru_sample affiché sous les tableaux
4. Modification de la table "guru_sample" en "guru_sampleNew"
5. Encore une fois, lorsque vous exécutez la commande "show", le nouveau nom Guru_sampleNew s'affiche.
Dropping table guru_sampleNew:
Types de table et son utilisation:
Venir aux tables, c'est comme la façon dont nous créons dans les bases de données relationnelles traditionnelles. Les fonctionnalités telles que le filtrage, les jointures peuvent être effectuées sur les tables.
Hive traite deux types de structures de table, telles que les tables internes et externes, en fonction du chargement et de la conception du schéma dans Hive.
Tables internes
- La table interne est étroitement couplée dans la nature.Dans ce type de table, nous devons d'abord créer une table et charger les données.
- Nous pouvons appeler celui-ci des données sur le schéma .
- En supprimant cette table, les données et le schéma seront supprimés.
- L'emplacement de stockage de cette table sera dans / user / hive / warehouse.
Quand choisir la table interne:
- Si les données de traitement disponibles dans le système de fichiers local
- Si nous voulons que Hive gère le cycle de vie complet des données, y compris la suppression
Exemple d'extrait de code pour la table interne
1. Pour créer la table interne
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Chargez les données dans la table interne
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Affichez le contenu du tableau
Hive>select * from guruhive_internaltable;
4. Pour supprimer la table interne
Hive>DROP TABLE guruhive_internaltable;
Si vous avez supprimé guruhive_internaltable, ses métadonnées et ses données seront supprimées de Hive.
À partir de la capture d'écran suivante, nous pouvons observer la sortie
Dans le code ci-dessus et à partir de la capture d'écran, nous faisons les choses suivantes,
- Créer la table interne
- Chargez les données dans la table interne
- Afficher le contenu du tableau
- Pour supprimer la table interne
Tables externes
- La table externe est de nature faiblement couplée. Les données seront disponibles dans HDFS. La table va se créer sur les données HDFS.
- En d'autres termes, on peut dire comme sa création de schéma sur les données .
- Au moment de supprimer la table, il ne supprime que le schéma, les données seront toujours disponibles dans HDFS comme auparavant.
- Les tables externes offrent une option pour créer plusieurs schémas pour les données stockées dans HDFS au lieu de supprimer les données à chaque fois que le schéma est mis à jour
Quand choisir une table externe:
- Si traitement des données disponibles dans HDFS
- Utile lorsque les fichiers sont utilisés en dehors de Hive
Exemple d'extrait de code pour une table externe
1. Créer une table externe
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Si nous ne spécifions pas l'emplacement au moment de la création de la table, nous pouvons charger les données manuellement
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Affichez le contenu du tableau
Hive>select * from guruhive_external;
4. Pour supprimer la table interne
Hive>DROP TABLE guruhive_external;
À partir de la capture d'écran suivante, nous pouvons observer la sortie
Dans le code ci-dessus, nous faisons les choses suivantes
- Créer la table externe
- Chargez les données dans la table externe
- Afficher le contenu du tableau
- Supprimer une table externe
Différence entre les tables internes et externes
Fonctionnalité | Interne | Externe |
---|---|---|
Schéma | Données sur le schéma | Schéma sur les données |
Emplacement de stockage | / usr / ruche / entrepôt | Emplacement HDFS |
Disponibilité des données | Dans le système de fichiers local | Dans HDFS |