Comment télécharger & Installez NLTK sur Windows / Mac

Table des matières:

Anonim

Dans ce tutoriel, vous apprendrez -

  • Installation de NLTK sous Windows
  • Installer Python sous Windows
  • Installation de NLTK sous Mac / Linux
  • Installation de NLTK via Anaconda
  • Ensemble de données NLTK
  • Comment télécharger tous les packages de NLTK
  • Exécution du script NLP
  • Comment exécuter le script NLTK

Installation de NLTK sous Windows

Dans cette partie, nous allons apprendre comment faire la configuration NLTK via le terminal (Invite de commande dans windows).

Les instructions données ci-dessous sont basées sur l'hypothèse que vous n'avez pas installé python. La première étape consiste donc à installer python.

Installation de Python sous Windows:

Étape 1) Suivre le lien https://www.python.org/downloads/ , et sélectionnez la dernière version pour Windows.

Remarque : si vous ne souhaitez pas télécharger la dernière version, vous pouvez visiter l'onglet de téléchargement et voir toutes les versions.

Étape 2) Cliquez sur le fichier téléchargé

Étape 3) Sélectionnez Personnaliser l'installation

Étape 4) Cliquez sur SUIVANT

Étape 5) Dans l'écran suivant

  1. Sélectionnez les options avancées
  2. Donnez un emplacement d'installation personnalisé. Dans mon cas, un dossier sur le lecteur C est choisi pour faciliter son fonctionnement
  3. Cliquez sur Installer

Étape 6) Cliquez sur le bouton Fermer une fois l'installation terminée.

Étape 7) Copiez le chemin de votre dossier Scripts.

Étape 8) Dans l'invite de commande Windows

  • Accédez à l'emplacement du dossier pip
  • Entrez la commande pour installer NLTK
    pip3 install nltk
  • L'installation doit être effectuée avec succès

REMARQUE : pour Python2, utilisez la commandepip2 install nltk

Étape 9) Dans le menu Démarrer de Windows, recherchez et ouvrez PythonShell

Étape 10) Vous pouvez vérifier si l'installation est précise en fournissant la commande ci-dessous

import nltk

Si vous ne voyez aucune erreur, l'installation est terminée.

Installation de NLTK sous Mac / Linux

L'installation de NLTK sous Mac / Unix nécessite le gestionnaire de packages python pip pour installer nltk. Si pip n'est pas installé, veuillez suivre les instructions ci-dessous pour terminer le processus

Étape 1) Mettez à jour l'index du package en tapant la commande ci-dessous

sudo apt update

Étape 2) Installation de pip pour Python 3:

sudo apt install python3-pip

Vous pouvez également installer pip en utilisant easy_install.

sudo apt-get install python-setuptools python-dev build-essential 

Maintenant, easy_install est installé. Exécutez la commande ci-dessous pour installer pip

sudo easy_install pip

Étape 3) Utilisez la commande suivante pour installer NLTK

sudo pip install -U nltksudo pip3 install -U nltk

Installation de NLTK via Anaconda

Étape 1) Veuillez installer anaconda (qui peut également être utilisé pour installer différents packages) en visitant https://www.anaconda.com/products/individual et sélectionnez la version de python que vous devez installer pour anaconda.

Remarque: reportez-vous à ce didacticiel pour connaître les étapes détaillées d'installation d'anaconda

Étape 2) Dans l'invite Anaconda,

  1. Entrez la commande
    conda install -c anaconda nltk
  2. Vérifiez la mise à niveau du package, la rétrogradation, les informations d'installation et entrez oui
  3. NLTK est téléchargé et installé

Ensemble de données NLTK

Le module NLTK a de nombreux ensembles de données disponibles que vous devez télécharger pour les utiliser. Plus techniquement, cela s'appelle corpus . Certains des exemples sont des mots vides , gutenberg , framenet_v15 , large_grammars et ainsi de suite.

Comment télécharger tous les packages de NLTK

Étape 1) Exécutez l'interpréteur Python sous Windows ou Linux

Étape 2)

  1. Entrez les commandes
import nltknltk.download ()
  1. Ouverture de la fenêtre téléchargée de NLTK. Cliquez sur le bouton Télécharger pour télécharger l'ensemble de données. Ce processus prendra du temps, en fonction de votre connexion Internet

REMARQUE: vous pouvez modifier l'emplacement de téléchargement en cliquant sur Fichier> Modifier le répertoire de téléchargement

Étape 3) Pour tester les données installées, utilisez le code suivant

>>> from nltk.corpus import brown>>>brown.words()

['Le', 'Fulton', 'Comté', 'Grand', 'Jury', 'a dit',…]

Exécution du script NLP

Nous allons discuter de la manière dont le script NLP sera exécuté sur notre PC local. Il existe de nombreuses bibliothèques pour le traitement du langage naturel présentes sur le marché. Le choix d'une bibliothèque dépend donc de l'adaptation à vos besoins. Voici la liste des bibliothèques PNL.

Comment exécuter le script NLTK

Étape 1) Dans votre éditeur de code préféré, copiez le code et enregistrez le fichier sous " NLTKsample.py "

from nltk.tokenize import RegexpTokenizertokenizer = RegexpTokenizer(r'\w+')filterdText=tokenizer.tokenize('Hello Guru99, You have build a very good site and I love visiting your site.')print(filterdText)

Explication du code:

  1. Dans ce programme, l'objectif était de supprimer tout type de ponctuation d'un texte donné. Nous avons importé "RegexpTokenizer" qui est un module de NLTK. Il supprime toute expression, symbole, caractère, numérique ou tout ce que vous voulez.
  2. Vous venez de passer l'expression régulière au module "RegexpTokenizer".
  3. De plus, nous avons tokenisé le mot en utilisant le module "tokenize". La sortie est stockée dans la variable "filterdText".
  4. Et les a imprimés en utilisant "print ()".

Étape 2) Dans l'invite de commande

  • Accédez à l'emplacement où vous avez enregistré le fichier
  • Exécutez la commande Python NLTKsample.py

Cela affichera la sortie comme:

['Hello', 'Guru99', 'You', 'have', 'build', 'a', 'very', 'good', 'site', 'and', 'I', 'love', ' visitant ',' votre ',' site ']