Comment convertir un fichier PDF en texte modifiable à l'aide de la ligne de commande sous Linux

Comment convertir un fichier PDF en texte modifiable à l'aide de la ligne de commande sous Linux
Comment convertir un fichier PDF en texte modifiable à l'aide de la ligne de commande sous Linux

Vidéo: Comment convertir un fichier PDF en texte modifiable à l'aide de la ligne de commande sous Linux

Vidéo: Comment convertir un fichier PDF en texte modifiable à l'aide de la ligne de commande sous Linux
Vidéo: Comment CALIBRER l'écran de son MAC M1  (Macbook pro / iMac)? - YouTube 2024, Avril
Anonim
Vous pouvez convertir un fichier PDF en texte modifiable pour plusieurs raisons. Peut-être devez-vous réviser un ancien document et n’avoir que la version PDF de celui-ci. La conversion de fichiers PDF sous Windows est simple, mais qu’en est-il de l’utilisation de Linux?
Vous pouvez convertir un fichier PDF en texte modifiable pour plusieurs raisons. Peut-être devez-vous réviser un ancien document et n’avoir que la version PDF de celui-ci. La conversion de fichiers PDF sous Windows est simple, mais qu’en est-il de l’utilisation de Linux?

Pas de soucis. Nous allons vous montrer comment convertir facilement des fichiers PDF en texte modifiable à l'aide d'un outil de ligne de commande appelé pdftotext, qui fait partie du paquet «poppler-utils». Cet outil est peut-être déjà installé. Pour vérifier si pdftotext est installé sur votre système, appuyez sur “Ctrl + Alt + T” pour ouvrir une fenêtre de terminal. Tapez la commande suivante à l'invite et appuyez sur “Entrée”.

dpkg –s poppler-utils

Remarque: lorsque nous disons quelque chose dans cet article et qu'il y a des guillemets autour du texte, ne tapez pas les guillemets, sauf indication contraire.

Si pdftotext n'est pas installé, tapez la commande suivante à l'invite et appuyez sur «Entrée».
Si pdftotext n'est pas installé, tapez la commande suivante à l'invite et appuyez sur «Entrée».

sudo apt-get install poppler-utils

Tapez votre mot de passe lorsque vous y êtes invité et appuyez sur «Entrée».

Le paquet poppler-utils contient plusieurs outils permettant de convertir un fichier PDF en différents formats, de manipuler des fichiers PDF et d’extraire des informations à partir de fichiers.
Le paquet poppler-utils contient plusieurs outils permettant de convertir un fichier PDF en différents formats, de manipuler des fichiers PDF et d’extraire des informations à partir de fichiers.
Voici la commande de base pour convertir un fichier PDF en un fichier texte modifiable. Appuyez sur “Ctrl + Alt + T” pour ouvrir une fenêtre de terminal, tapez la commande à l'invite, puis appuyez sur “Entrée”.
Voici la commande de base pour convertir un fichier PDF en un fichier texte modifiable. Appuyez sur “Ctrl + Alt + T” pour ouvrir une fenêtre de terminal, tapez la commande à l'invite, puis appuyez sur “Entrée”.

pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Modifiez le chemin d'accès à chaque fichier pour qu'il corresponde à l'emplacement et au nom de votre fichier PDF d'origine et à l'emplacement où vous souhaitez enregistrer le fichier texte obtenu. Changez également les noms de fichiers pour qu'ils correspondent aux noms de vos fichiers.

Le fichier texte est créé et peut être ouvert comme n'importe quel autre fichier texte sous Linux.
Le fichier texte est créé et peut être ouvert comme n'importe quel autre fichier texte sous Linux.
Le texte converti peut comporter des sauts de ligne à des endroits que vous ne souhaitez pas. Les sauts de ligne sont insérés après chaque ligne de texte du fichier PDF.
Le texte converti peut comporter des sauts de ligne à des endroits que vous ne souhaitez pas. Les sauts de ligne sont insérés après chaque ligne de texte du fichier PDF.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Si vous souhaitez uniquement convertir une plage de pages dans un fichier PDF, utilisez les indicateurs «-f» et «-l» (un «L» minuscule) pour spécifier les première et dernière pages de la plage à convertir.
Si vous souhaitez uniquement convertir une plage de pages dans un fichier PDF, utilisez les indicateurs «-f» et «-l» (un «L» minuscule) pour spécifier les première et dernière pages de la plage à convertir.

pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Pour convertir un fichier PDF protégé et crypté avec un mot de passe du propriétaire, utilisez l’indicateur «-opw» (le premier caractère de l’indicateur est une lettre minuscule «O», pas un zéro).
Pour convertir un fichier PDF protégé et crypté avec un mot de passe du propriétaire, utilisez l’indicateur «-opw» (le premier caractère de l’indicateur est une lettre minuscule «O», pas un zéro).

pdftotext -opw ‘password’ /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Remplacez «mot de passe» par celui utilisé pour protéger le fichier PDF d'origine en cours de conversion. Assurez-vous qu'il existe des guillemets simples, et non doubles, autour de «mot de passe».

Si le fichier PDF est protégé et crypté avec un mot de passe utilisateur, utilisez l'indicateur «-upw» à la place de l'indicateur «-opw». Le reste de la commande est la même.
Si le fichier PDF est protégé et crypté avec un mot de passe utilisateur, utilisez l'indicateur «-upw» à la place de l'indicateur «-opw». Le reste de la commande est la même.
Vous pouvez également spécifier le type de caractère de fin de ligne appliqué au texte converti. Ceci est particulièrement utile si vous envisagez d’accéder au fichier sous un système d’exploitation différent, tel que Windows ou Mac. Pour ce faire, utilisez l'indicateur «-eol» (le caractère du milieu de l'indicateur est une lettre minuscule «O», pas un zéro) suivi d'un espace et du type de caractère de fin de ligne que vous souhaitez utiliser (« unix”,“dos”ou“mac”).
Vous pouvez également spécifier le type de caractère de fin de ligne appliqué au texte converti. Ceci est particulièrement utile si vous envisagez d’accéder au fichier sous un système d’exploitation différent, tel que Windows ou Mac. Pour ce faire, utilisez l'indicateur «-eol» (le caractère du milieu de l'indicateur est une lettre minuscule «O», pas un zéro) suivi d'un espace et du type de caractère de fin de ligne que vous souhaitez utiliser (« unix”,“dos”ou“mac”).
REMARQUE: Si vous ne spécifiez pas de nom de fichier pour le fichier texte, pdftotext utilise automatiquement la base du nom de fichier PDF et ajoute l’extension «.txt». Par exemple, «fichier.pdf» sera converti en «fichier.txt». Si le fichier texte est spécifié comme «-», le texte converti est envoyé à stdout, ce qui signifie que le texte est affiché dans la fenêtre du terminal et n'est pas enregistré dans un fichier.
REMARQUE: Si vous ne spécifiez pas de nom de fichier pour le fichier texte, pdftotext utilise automatiquement la base du nom de fichier PDF et ajoute l’extension «.txt». Par exemple, «fichier.pdf» sera converti en «fichier.txt». Si le fichier texte est spécifié comme «-», le texte converti est envoyé à stdout, ce qui signifie que le texte est affiché dans la fenêtre du terminal et n'est pas enregistré dans un fichier.

Pour fermer la fenêtre du terminal, cliquez sur le bouton “X” dans le coin supérieur gauche.

Pour plus d'informations sur la commande pdftotext, tapez «man page pdftotext» à l'invite de la fenêtre du terminal.

Conseillé: