Perl (langage)

Infos
Perl est un langage de programmation créé par Larry Wall en 1987 et reprenant des fonctionnalités du langage C et des langages de scripts sed, awk et shell (sh). Larry Wall donne deux interprétations de l'acronyme "PERL":
- Practical Extraction and Report Language ou langage pratique d'extraction et de génération de rapports
- Pathetically Eclectic Rubbish Lister ou collectionneur de déchets pathétiquement éclectiques Ces noms s
Perl (langage)

Perl est un langage de programmation créé par Larry Wall en 1987 et reprenant des fonctionnalités du langage C et des langages de scripts sed, awk et shell (sh). Larry Wall donne deux interprétations de l'acronyme "PERL":
- Practical Extraction and Report Language ou langage pratique d'extraction et de génération de rapports
- Pathetically Eclectic Rubbish Lister ou collectionneur de déchets pathétiquement éclectiques Ces noms sont des rétro-acronymes. L'association en charge du développement et de la promotion de Perl est The Perl Foundation. En France, les Mongueurs de Perl promeuvent ce langage, notamment via les Journées Perl.

Origines et mises en œuvre

Le but

Perl est né du besoin de disposer d'un langage optimisé pour l'extraction d'informations de fichiers textes et la génération de rapports. Avant la naissance de Perl, les traitements sur le texte devaient être faits au moyen de scripts shell, en utilisant les programmes sed, awk, grep, cut, test et expr. Beaucoup de limites apparaissaient quand on utilisait cette programmation : format des données d'entrée pas toujours souple, difficulté de passer des données d'un processus à l'autre, lenteur due au lancement de multiples programmes (le coût du lancement d'un processus n'était pas négligeable), dépendance à une mise en œuvre particulière d'une commande, bogues intrinsèques à certains langages (awk ne différencie pas la comparaison de nombres et de chaînes de caractères). Perl regroupe et emprunte sa syntaxe concrète à tous ces mini langages, dont le shell, en ajoutant une partie de la syntaxe du C et les fonctions des bibliothèques système en C. Voici quelques-unes des devises qui lui sont couramment associées :
- There Is More Than One Way To Do It (TIMTOWTDI) qui pourrait se traduire par Il y a plus d'une façon de le faire : Perl propose tellement de bibliothèques et de fonctions que vous trouverez souvent 3 ou 4 manières de réaliser une même opération.
- Perl : la tronçonneuse suisse des langages de programmation pour les même raisons.
- Perl : l'assistant idéal des administrateurs de système la majorité les fichiers de configuration étant en texte sous Unix. Sa souplesse autorise l'emploi de plusieurs modèles de programmation : procédurale, fonctionnelle et orientée objet.

Les moyens

Perl vise la commodité pour le programmeur (existence de raccourcis qui le font qualifier de langage « diagonal ») plutôt qu'un souhait esthétique d'architecture stricte (langages « orthogonaux »). Perl est un langage de script, très complet et multiplateforme, et a été qualifié de « ciment assurant la cohésion du web », étant le langage le plus populaire pour l'écriture de script CGI. Perl est également capable d'exécuter des scripts 'in-process' dans un serveur web apache, grâce à l'extension . Cette solution offre des performances équivalente à celles de PHP, voire de servlets Java. Perl a un statut de logiciel libre, distribué double licence : artistique et GPL. Perl est porté sur la plupart des systèmes d'exploitation mais excelle particulièrement en environnement POSIX (Linux, Mac OS X, Cygwin sous Microsoft Windows etc.) ; il devient populaire aussi sous Microsoft Windows (hors Cygwin) grâce à la facilité d'installation de la distribution gratuite ActivePerl (dont la version 5.8 permet l'usage de l'Unicode ou de l'interface graphique) et d'environnements de développement gratuits comme SciTE ou pour eclipse, ou commerciaux comme .

Syntaxe et sémantique

Perl est un langage impératif dont la syntaxe est dérivée du langage C et des shells UNIX. Comme en shell, le caractère dièse introduit un commentaire. La syntaxe de Perl est riche ce qui permet d'exprimer de manière concise des expressions qui, dans d'autres langages, nécessiteraient l'usage d'appel à des fonctions de bibliothèques . Mais on peut se restreindre initialement à un sous-ensemble du langage. On décrit Perl généralement comme un langage typé dynamiquement. Cette caractérisation est incomplète car Perl est aussi typé statiquement mais comporte peu de types. En effet le premier caractère des identificateurs de variable est un caractère non alphanumérique appelé sigil. Comme pour les shells Unix, le sigil dollar dénote une variable scalaire, le sigil arobase désigne une variable tableau et le sigil pourcentage un tableau associatif, aussi appelé hashage ou hash. Les tableaux peuvent être utilisés comme des piles ou des files. Perl supporte des déclarateurs qui désignent la portée des variables déclarées : my $s = 'toto' ;
- variable scalaire à portée lexicale local $level += 1;
- variable scalaire avec une valeur à portée dynamique our @s = (1, $s, 3.14);
- variable tableau globale au module courant Les sigils permettent de reconnaître les noms de variables dans des chaînes de caractères et d'interpoler ces variables. print "la variable toto vaut $toto"; Perl permet de construire facilement des structures complexes et composites. Là encore, beaucoup d'autres langages imposeraient l'appel explicite de constructeurs d'instances. my %a = ( clef1 => , clef2 => ); Le module disponible sur le CPAN permet de supporter des littéraux de type XML de manière similaire à l'extension normalisée E4X d'ECMAScript. Le langage Perl est en constante évolution mais avec un soin tout particulier au maintien de la compatibilité descendante.

L'avenir proche

La prochaine version majeure de Perl, la 5.10, incluera des fonctionnalités inspirées par le futur Perl 6 comme une structure de contrôle switch beaucoup plus puissante que celle de C, et les captures nommées pour l'opérateur match. L'effort de conception de Perl 6 débouche donc déjà sur une vigueur renouvelée de Perl 5.

L'avenir à moyen terme

Perl 6 est en cours de développement. Il tournera dans la machine virtuelle Parrot. Le développement de Parrot a atteint une étape critique au début de l'été 2006 avec la mise en œuvre du système de règles Perl 6 ce qui permet de s'affranchir d'outils externes comme yacc ou lex. En parallèle, Audrey Tang, aidée d'un petit groupe, développe un interpréteur Perl 6 en Haskell nommé Pugs. Cette mise en œuvre permet de valider et d'affiner les spécifications et d'écrire et faire tourner des jeux de tests. De nombreuses fonctionnalités mises en œuvre par des bibliothèques en Perl 5 seront disponibles nativement en Perl 6. Ainsi l'analyse syntaxique sera intégrée dans le moteur d'expressions rationnelles. Aujourd'hui un analyseur LALR peut s'écrire par le module , clone de yacc. est un module qui permet l'écriture d'un analyseur récursif descendant.

L'intégration dans l'existant

Les programmes Perl sont intégralement portables entre GNU/Linux, Mac OS X (ou autre UNIX) et Windows malgré les désignations de fichiers différentes de ces systèmes (Perl remplace tout seul si besoin les « / » par des « \ »). Un exemple du champ d'action de Perl est son utilisation comme script CGI pour faire tourner Wikipedia jusqu'en janvier 2002. Il constitue en effet un bon langage de prototypage. Perl permet l'usage du moteur d'interface graphiques Tk pour effectuer des entrées-sorties conformes à l'état de l'art. On désigne parfois l'ensemble sous le nom générique Perl/Tk. L'extension Tk est intégrée à ActivePerl depuis la version 5.8 du langage. Des interfaces graphiques autre que le vieillissant Tk sont supportés par des bibliothèque de CPAN. TkZinc apporte un look rajeuni de Tk. PerlQt supporte Qt 3.x. Gtk2 supporte Gtk 2.x. wxperl supporte wxWidgets. wxWidgets a l'avantage de fournir le look natif du système de fenêtrage utilisé. Sous Mac OS X, CamelBones donne accès à l'API de Cocoa.

Les ressources

Plus de 15 millions de lignes de modules Perl d'utilisation libre, allant des mathématiques avancées aux connexions aux bases de données, en passant par les réseaux, la simulation d'un calculateur quantique et bien davantage, peuvent être téléchargées depuis un réseau de sites appelé CPAN : Comprehensive Perl Archive Network.
- http://www.cpan.org/

Le mécanisme

Perl5 est un langage dont la nature hautement dynamique rend assez floue la distinction entre les phases de compilation et d'exécution. De plus, la phase de compilation ne génère pas un bytecode comme c'est le cas de beaucoup d'autres langages interprétés, mais un arbre syntaxique (AST, Abstract Syntax Tree). En pratique, Perl commence par traduire le code source, instruction par instruction, en AST, qui est par la suite optimisé. Si des instructions sont situées dans un bloc spécial comme BEGIN ou CHECK, elles sont exécutés dès leur compilation (et donc avant que le reste du code source soit compilé). C'est le cas en particulier des modules chargés par l'instruction use. L'AST en lui-même est un peu plus élaboré qu'un AST usuel car il contient déjà les chemins d'exécution. Lors de la phase d'exécution, l'interpréteur suit donc les chemins présents dans l'AST et exécute les instructions restantes. Pour plus de détails sur ces blocs et leur ordre exact d'exécution, consulter de . Contrairement à ce que certains peuvent croire, Perl5 n'utilise donc à aucun moment de bytecode. Le projet de compilation en bytecode commencé lors de Perl 5.005 par Malcom Beattie n'a jamais totalement abouti, n'a jamais été vraiment fonctionnel, et sera donc probablement retiré de Perl 5.10. Ce n'est toutefois pas une grande perte car l'arrivée de Parrot offre une solution qui, si elle n'est pas encore fonctionnelle, sera clairement plus stable et plus pérenne. La compilation de Perl6 passe par le moteur de règles (l'équivalent plus avancé des expressions rationnelles actuelles), qui produit un AST classique. Celui-ci est ensuite transcrit dans un autre langage, par défaut le bytecode Parrot. Le compilateur expérimental Pugs permet de transcrire l'AST dans des langages aussi variés que Perl 5, Parrot, JavaScript, Haskell. Dans le cas du bytecode Parrot, celui-ci est exécuté par la machine virtuelle du même nom, qui dispose de plusieurs modes de fonctionnement internes, dont un système de compilation à la volée pour offrir les performances maximales sur chaque architecture hôte.

Exemples de code

Certaines personnes affirment avec humour que Perl veut dire 'Pathologically Eclectic Rubbish Lister' (collectionneur pathologique de déchets variés) à cause de l'utilisation intensive de caractères spéciaux chargés de sens dans la syntaxe du langage, comme on peut le voir dans cet exemple de programme:
- Un exemple de programme en Perl $message = "À l'endroit : 'camel'.\n"; print $message; $message =~ s/endroit/envers/; $message =~ s/('\w+')/reverse($1)/e; print $message; exit 0 et sa sortie à l'écran : À l'endroit : 'camel'. À l'envers : 'lemac'. Les troisième et quatrième lignes de cet exemple montrent l'usage d'expressions rationnelles. Ces caractères spéciaux sont liés à la puissance de traitement de Perl :
-scalaires désignés par $ : $nom = "Toto"; $z=3;
-tableaux désignés par @, indexés par : $nom = "Val d'Oise"; (le 96e élément du tableau est comme les autres un scalaire!)
-tableaux associatifs, ou hashs désignés par %, indexés par : $code = 95; (leurs éléments sont des scalaires aussi)

Faux amis

Certains mots ont un sens différent en Perl que celui dans la littérature non Perl. Pour chaque mot, nous donnons le nom français, le nom anglais entre parenthèses, et la définition en terme du vocabulaire du wikipédia.
- Une fonction (function) est une fonction prédéfinie par le langage.
- Une routine, aussi appelée sous-routine, (subroutine) est une fonction définie dans le programme ou une bibliothèque utilisée.

Aspects communautaires

Perl a une base d'utilisateurs vaste et diversifiée. Pour plusieurs types d'utilisateurs du langage, c'est d'ailleurs leur seul point commun. Les administrateurs système en sont friands, les développeurs en apprécient la concision et la puissance, des linguistes et des biologistes - habituellement peu enclins à se pencher sur le code - l'utilisent comme langage de référence dans leurs applications métiers. Perl est particulièrement apprécié en bio-informatique où les programmes font l'objet de remaniements constants. La base CPAN regroupe et met gratuitement à la disposition des utilisateurs de Perl du monde entier 15, 4 millions de ligne de code (juillet 2004) sous forme de modules Perl et de synopsis montrant comment les mettre en œuvre. L'effet boule de neige est indiscutable. La synergie aussi.

Trivia

On écrit généralement le nom de ce langage avec un P majuscule pour désigner le langage et un p minuscule en parlant de l'interpréteur : « seul perl analyse correctement Perl. » Une conséquence est qu'un système de coloration syntaxique d'un programme Perl devrait utiliser l'interpréteur perl pour être totalement correct. En pratique, des modules pur Perl comme et arrivent à comprendre correctement la majeure partie du code courant. Un canular organisé par l'équipe de direction de l'éditeur O'Reilly avec la complicité de Larry Wall et Guido van Rossum (avec annonce d'un livre imaginaire dont l'annonce donnait le fac-simile) a annoncé à une époque la fusion en un langage unique nommé aussi Parrot de Perl 6 et de Python, à la grande panique de certains aficionados des deux langages. Compte-tenu du rôle qu'a eu Perl dans le développement de la « nouvelle économie », une boutade prêtait à la mairie de New York l'intention de rebaptiser Wall Street du nom de son inventeur, ce qui aurait au moins le mérite de ne pas entraîner du tout de frais pour le contribuable !

Logiciels écrits en Perl

- Diverses bibliothèques couvrent le continuum des systèmes de gestion de contenu, des wikis et des blogs. Perl est au cœur de sites comme Slashdot, Everything2, Kuro5hin, LiveJournal
- , un système de gestion de bugs
- GNU Automake génère des makefiles portables
- Fink est un projet open source destiné à porter vers Mac OS X des applications originellement écrites pour UNIX
- SVK est un système de gestion de version de code. C'est une extension de Subversion
- Movable Type est une plateforme de publication pour entreprises, utilisée par des sociétés comme General Motors
- Blosxom (prononcer «blossomme») est un logiciel de blog et un système de gestion de contenu
- Sympa, gestionnaire de listes de diffusion
- SpamAssassin, filtre courriel anti-spam
- Bugzilla, gestionnaire de bugs
- Webmin, logiciel de configuration d'une machine via une interface web
- Drakconf, le système interactif de configuration de Mandriva
- Urpmi, le gestionnaire de packages de Mandriva, ainsi que l'installeur et les outils de configuration sont tous écrits en Perl
- Frozen Bubble, jeu d'arcade
- Open Webmail
- AWStats, analyseur de logs
- Mioga, outil de travail collaboratif
- Rational : ClearCase (gestion de configuration), ClearQuest
- SysTran : logiciel de traduction linguistique
- Des robots IRC sont écrits en Perl (infobot) ou proposent des interfaces Perl (eggdrop)
- Koha, Premier SIGB sous licence libre

Annexes

Bibliographie

Généralités

- Larry Wall, Tom Christiansen et Jon Orwant (2001), Programmation en Perl, ISBN 2-84177-140-7

Applications

- James Tisdall, Introduction à Perl pour la bioinformatique, O'Reilly, ISBN 2841772063

Voir aussi

- APL | Lisp | Python | Ruby | Tcl
- Expression rationnelle
- SciTE
- Perl et le calcul quantique
- DWIM
- Principe de Huffman ===
Sujets connexes
APL (langage)   AWStats   Alphanumérique   Analyse syntaxique   Artistic License   Audrey Tang   Automake   Awk   BASIC   Bas-de-casse   Base de données   Bibliothèque logicielle   Bio-informatique   Blog   Blosxom   Bourne shell   Bugzilla   Bytecode   C (langage)   Caractère (informatique)   ClearCase   Cocoa (Apple)   Code source   Coloration syntaxique   Commentaire (informatique)   Common Gateway Interface   Compilateur   Compilation à la volée   Constructeur (programmation informatique)   Cygwin   DWIM   E4X   ECMAScript   Expr   Expression rationnelle   Fichier texte   File   Fink   Fonction (informatique)   Frozen Bubble   General Motors   Grep   Guido van Rossum   Haskell   Humour   Identificateur   Instance (programmation)   Janvier 2002   JavaScript   Journées Perl   Koha   Langage de programmation   Langage de script   Larry Wall   Licence publique générale GNU   Linux   Lisp   LiveJournal   Logiciel libre   Mac OS X   Machine virtuelle   Mandriva   Microsoft Windows   Mise en œuvre   Mongueurs de Perl   Movable Type   Multiplate-forme   O'Reilly Media   POSIX   Parrot (machine virtuelle)   Perl   Perl 6   Pile (informatique)   Portabilité   Portée (informatique)   Principe de Huffman   Processus (informatique)   Programmation fonctionnelle   Programmation impérative   Programmation orientée objet   Programmation procédurale   Prototypage   Pugs   Python (langage)   Qt   Robot IRC   Ruby   SVK (informatique)   Scalaire   SciTE   Sed   Sed (logiciel)   Shell (informatique)   Sigil (informatique)   Slashdot   SpamAssassin   Spécification (informatique)   Subversion (logiciel)   Synergie   Syntaxe   Système d'exploitation   Système de fenêtrage   Système de gestion de contenu   Tableau (structure de données)   Tableau associatif   Test (informatique)   The Perl Foundation   Tk (informatique)   Tool Command Language   Typage dynamique   Typage statique   UNIX   Unicode   Urpmi   Variable   Wall Street   Webmin   Wiki   WxWidgets  
#
Accident de Beaune   Amélie Mauresmo   Anisocytose   C3H6O   CA Paris   Carole Richert   Catherinettes   Chaleur massique   Championnat de Tunisie de football D2   Classement mondial des entreprises leader par secteur   Col du Bonhomme (Vosges)   De viris illustribus (Lhomond)   Dolcett   EGP  
^