OpenScheme : Plus loin avec les ports
Par :
Guilhem de Wailly (gdw@erian-concept.com)
et :
Fernand Boéri (boeri@unice.fr)
Résumé
Notre connaissance du langage Scheme nous permet maintenant d'entrevoir toute la puissance de ce langage en concevant des applications plus complexes. Cela est rendu possible en exploitant les possibilités d'OpenScheme couvrant un large spectre de fonctionnalités.
Ici, nous examinerons les extensions d'OSM en matière de ports, puis nous programmerons une petite application permettant de connaître le nombre de mails électroniques en attente sur un serveur POP (Cette application ne fonctionnera qu'avec la version 1.3.4 de l'environnement).
L'environnement OpenScheme est disponible sur le CDROM de Linux Magazine. Il est aussi disponible sur www.open-scheme.com. Cet environnement existe en version libre ou commerciale.
Port Scheme
Les ports sont des objets Scheme rattachés à des fichiers. Le langage Scheme standard ne propose que peu de fonctions pour manipuler les ports. Nous avons vu dans Linux Magazine n° 5 d'avril 1999 les fonctions standard d'entrées/sortie proposées par la norme du langage Scheme. L'article est disponibles en ligne à l'adresse http://www.linuxmag-france.org/lm5/sommaire.html.
Ces fonctions sont suffisantes pour effectuer des travaux simples sur les fichiers.
Ce mois-ci, nous proposons d'examiner les extensions d'OpenScheme pour manipuler les fichiers. Notamment, OSM dispose de puissantes fonctions de manipulation de ports en mémoires ou de clients FTP ou HTTP. Dans un prochain article, nous utiliserons ces possibilités pour programmer des clients simples de services internet et/ou d'un environnement d'exécution parallèle sur plusieurs machines.
Le lecture se reportera à Linux Magazine n°5. Les fonctions définies par la norme du langage Scheme sont:
(call-with-input-file
fichier proc)
(call-with-output-file fichier
proc)
(current-input-port)
(current-output-port)
(with-input-from-file
fichier proc)
(with-output-to-file fichier
proc)
(open-input-file fichier)
(open-output-file
fichier)
(close-input-port port)
(close-output-port
port)
(input-port? objet)
(output-port?
objet)
(read [port])
(eof-object?
object)
(read-char [port])
(peek-char
[port])
(char-ready? [port])
(load
fichier)
(write objet [port])
(display objet
[port])
(newline [port])
(write-char caractère
[port])
Extensions OpenScheme
L'environnement OSM étend la notion de port aux ports virtuels. Parmi les ports virtuels, on trouve les chaînes de caractères (ports d'entrées/sorties en mémoire), les connexions réseau par sockets, les clients FTP ou HTTP... De plus, l'environnement propose une puissante fonction de sortie formatée ainsi que des fonctions d'entrée/sortie bas niveau.
Fonctions d'entrée / sorties de bas niveau
Dans la spécification du langage Scheme, les ports ne peuvent être accédés que de manière séquentielle de manière à lire des caractère ou des objets Scheme. OSM permet de lire toutes sorte de données et de le faire en accès direct.
A chaque port est associé un pointeur de fichier. Pour les ports en correspondance avec un fichier sur le disque, ce pointeur de fichier peut être consulté et/ou déplacé à loisir, permettant un accès direct à toutes les parties du fichier.
ï‚· La fonction (port-tell [port]) retourne la valeur du pointeur de fichier sous la forme d'un entier. Si le port est omis, le port d'entrée standard est utilisé.
ï‚· La fonction (port-seek n [port]) permet de modifier la valeur d'un pointeur de fichier. Si port n'est pas renseigné, le port d'entrée standard est utilisé.
ï‚· La fonction (port-length [port]) retourne la valeur maximale d'un pointeur de fichier. Cette valeur correspond en fait à la taille en octets du fichier. Si le port n'est pas indiqué, le port d'entrée standard est utilisé.
ï‚· La fonction (port-read n [port]) lit n octets d'un port et retourne la chaîne de caractères formée des octets lus à partir du pointeur de fichier. Si port n'est pas indiqué, le port d'entrée standard est utilisé.
ï‚· Enfin, la fonction (port-write str n [port]) écrit n octets de la chaîne de caractères str à la position du pointeur de fichier d'un port. Si port est omis, le port de sortie standard est utilisé.
Caractère spéciaux
Les chaînes de caractères destinées aux sorties peuvent contenir tous les caractères imprimables classiques. OSM reconnaît aussi des caractères spéciaux. Ceci sont préfixés par le caractères d'échappement anti-slash :
Caractère |
Signification |
\n |
Saut de ligne |
\r |
Début de ligne |
\t |
Tabulation |
\b |
Signal sonore |
Par exemple :
Osm> (display
"123\r456\t789\n012\n")
456 789
012
=> #unspecified
Sortie formatée
La fonction format permet l'affichage formaté des ses arguments sur le port spécifié. Sa syntaxe générale est (format port pilote arguments...).
Les arguments :
ï‚· port est soit un port de sortie, soit la valeur #t pour désigner le port de sortie courant, soit la valeur #f pour indiquer que la sortie doit s'effectuer dans une chaîne de caractères qui sera retournée.
ï‚· pilote est la chaîne de format proprement dite. Tous les caractères qu'elle contient sont affichés tel quels. Certains caractères préfixés par le caractère tilde indique que l'argument correspondant doit être affiché selon la spécification désirée.
Les spécifications sont :
ï‚· ~a ou ~A est remplacé par la représentation imprimable de l'argument correspondant.
ï‚· ~s ou ~S est remplacé par la représentation réelle de l'argument correspondant.
ï‚· ~d ou ~D est remplacé par la représentation imprimable de l'argument correspondant. Lorsque l'argument est une structure cyclique, le cycle est cassé et remplacé par trois points.
ï‚· ~w ou ~W est remplacé par la représentation réelle de l'argument correspondant dans lequel les cycles sont cassés et remplacés par trois points.
ï‚· ~x or ~X est remplacé par la représentation en hexadécimal de l'objet (valeur ou référence en mémoire).
ï‚· ~~ est remplacé par un simple tilde.
Par exemple :
Osm> (format #f "A test.")
=> A test.#unspecified
Osm> (format #f "A ~a." "test")
=> "A test."#unspecified
Osm> (define l '(1 2 3))
=> #unspecified
Osm> (set-car! (cdr l) l)
=> #unspecified
; une liste récursive est construite
Osm> (format #t "list
= ~w\n)
(1 ... 3)
=> #unspecified
Osm> (display l)
=> Segmentation fault
Lecture de lignes entières
Il est souvent utile de pouvoir lire un fichier lignes à lignes. Pour cela, OSM définit la fonction (read-line [port]) qui retourne une chaîne de caractères contenant la ligne en cours dans le port, s'il est spécifié ou dans le port d'entrée standard, sinon.
Lorsque la fin du fichier est atteinte, la fonction retourne un objet validant le prédicat eof-object?.
Port en mémoire
Les ports virtuels ouverts en mémoire permettent de bénéficier des fonctions standard d'entrée/sortie. Le port en mémoire peut être ouvert en lecture avec (open-input-string chaîne). La fonction retourne un port d'entrée accessible par les fonctions standard :
Osm> (define port (open-input-string "12345"))
=> #unspecified
Osm> (let loop
([i 1])
(let ([c (read-char
port)])
(if (not
(eof-object? c))
(begin
(format #t "~a: ~a\n" i c)
(loop (+ i 1))))))
1:
#\1
2: #\2
3: #\3
4: #\4
5: #\5
=> #unspecified
Osm> (close-input-port port)
=> #unspecified
Lorsque tous les caractères ont été lus, les fonctions de lecture retournent la fin de fichier qui peut être testée avec la fonction eof-object?. Le port ouvert se referme avec la fonction standard.
Les fonctions call-with-input-string et with-input-from-string sont aussi disponibles et fonctionnent comme leurs homologues opérant sur les fichiers.
La fonction input-string? retourne #t si son argument est un port d'entrée en mémoire et #f sinon.
Un port en mémoire en sortie est ouvert avec la fonction (open-output-string). Cette fonction retourne un port de sortie sur lequel les fonctions de sorties standard sont utilisables. Lorsque le travail est fini, il est possible de convertir le port en chaîne de caractères avec la fonction (get-output-string port).
Osm> (define port (open-output-string))
=> #unspecified
Osm> (display "message" port)
=> #unspecified
Osm> (display "- autre message" port)
=> #unspecified
Osm> (get-output-string port)
=> "message - autre message"
Osm> (close-output-port port)
=> #unspecified
Les fonctions call-with-output-string et with-output-to-string se comportent comme leurs homologues sur les fichiers.
Répertoires locaux
Les fonctions d'ouverture de port d'OSM opèrent aussi sur les répertoires. Le comportement des fonctions d'entrée/sorties voient leur comportement adapté à ce type de port.
Un répertoire est ouvert simplement en indiquant son nom à l'une des fonctions opérant à l'ouverture des fichiers. Par exemple :
Osm> (define tmp (open-input-port "/tmp"))
=> #unspecified
Lorsque le port associé à un répertoire est ouvert en lecture, il retourne les noms des fichiers contenus dans ce répertoire, séparés par des retour chariot :
Osm> (let loop ([rep
(read-line tmp)])
(if
(not (eof-object? rep))
(begin
(format
#t "entrée: ~a\n" rep)
(loop (read-line tmp)))))
entrée:
93499~df
entrée: 9e3499~df.tmp
entrée:
943327993-gtkrc-41306685
entrée: IMG_PARAMS.db
entrée:
archive.500
entrée: axinstall.log
entrée:
emacsEMFYx6
entrée: fvwmrcTPYp4h
=>
#unspecified
La fonction port-seek permet de positionner le pointeur de fichier sur le numéro de l'entrée du répertoire correspondante, à partir de zéro. La fonction port-tell retourne le numéro de l'entrée courante.
Informations sur les fichiers d'un répertoire
Lorsque qu'un répertoire est ouvert, il est pratique de pouvoir obtenir des informations sur les fichiers qu'il contient. Pour cela, nous disposons de la fonction (port-stat nom [répertoire]). Cette fonction retourne un vecteur contenant les informations relatives au fichier nommé nom du répertoire spécifié. Si aucun répertoire n'est spécifié, le fichier d'entrée standard est utilisé. Si une erreur se produit #f est la valeur de retour.
Le vecteur retourné contient les éléments suivants :
ï‚· #t si nom désigne un répertoire, #f sinon.
ï‚· #t si nom désigne un fichier régulier, #f sinon.
ï‚· #t si nom désigne un lien, #f sinon.
ï‚· Une chaîne de caractères représentant les droits sur le fichiers, selon le format Unix.
ï‚· La taille du fichier nom.
ï‚· Date de dernière modification du fichier, sous la forme d'un réel. Ce réel peut être manipulé avec les fonctions date->string et date->vector.
ï‚· Date de création du fichier, sous la forme d'un réel.
ï‚· Date de dernier accès du fichier, sous la forme d'un réel.
Le plugin OS offre plus de fonctions pour manipuler les fichiers et les répertoires, comme la copies de hiérarchies, le déplacement, la suppression, la gestions des droits, etc.
Port en lecture ET écriture
Par défaut, le langage Scheme permet d'ouvrir des fichiers en lecture ou en écriture mais pas les deux. Lorsque le fichier est ouvert en écriture alors qu'il existe déjà, le contenu précédant est perdu et la taille du fichier est fixée à zéro.
L'environnement OSM permet d'ouvrir des ports en lecture et écriture. Si le fichier existe, son contenu n'est pas perdu. Cependant, il sera écrasé si le pointeur de fichier n'est pas positionné à la fin de celui-ci. Les fonctions relatives à ces ports sont open-input-output-file, open-input-output-string et close-input-output-port.
De plus, les ports peuvent être ouverts en écriture de manière à ce que le contenu précédent ne soit pas altéré. Ces ports sont ouverts et fermés avec les fonctions open-append-file, close-append-port, call-with-append-file et with-append-to-file.
Connexion réseau
Les communications inter machines utilisent souvent les ports au sens de Unix ; l'objet ouvert est souvent connu sous le nom de socket. L'utilisation des sockets est maintenant disponibles sous d'autres environnement que Unix, comme des machines Windows ou Macintoch.
L'environnement OSM permet ouvrir des ports distants et d'y accéder avec les fonctions d'entrées/sorties standards.
Pour ouvrir un socket, on utilise les fonctions standard d'ouverture de fichier, comme open-input-port en précisant le nom du fichier de la manière suivante : socket://machine:port. Les sockets sont des ports permettant par nature l'écriture et la lecture. Aussi, on les ouvrira de préférence avec des fonctions bidirectionnelles comme open-input-output-file.
Les fonctions pour manipuler le pointeur de fichier sont inactives sur ce type de port. Les fonctions de lecture/écriture en mode caractères sont utilisables comme si le socket était un fichier local.
Connexions FTP / HTTP
Le protocole FTP (File Transfert Protocol) et le protocole HTTP (Hyper Text Transfert Protocol) sont très utilisés pour transférer des fichiers depuis ou vers un hôte distant. OSM permet d'accéder à ces protocoles en utilisant les fonctions standards d'ouverture. Pour cela, le fichier est spécifié de la manière suivante : ftp://[utilisateur[:pass]@]hôte/fichier ou http://[utilisateur[:pass]@]hôte/fichier
Le client HTTP ne sera disponible que dans la version 1.3.4 d'OSM prévue pour l'été.
Le nom d'utilisateur et le mot de passe sont optionnels. Le fichier peut spécifié soit un fichier ouvert en lecture soit en écriture. Les fonctions manipulant le pointeur de fichier sont actives.
Le plugin NET offre des clients plus complets sur les principaux protocoles réseau comme le mail, ftp, http. Il permet aussi de concevoir des scripts CGI de manière très simples.
Exemple
Dans cet exemple, nous utilisons les ports sockets pour nous connecter à un serveur de mail POP afin de savoir si nous avons des mails disponibles.
Le protocole POP est très simple. Voici à la main, comment nous pouvons connaître le nombre de mail en attente.
Supposons que votre serveur de mail soit pop.serveur.fr et votre nom de login pour le mail soit cmoi et votre mot de passe mdp. Avec telnet, nous ouvrons le port 110 du serveur POP comme suit :
$ telnet pop.serveur.fr
110
Trying 192.101.21.253...
Connected to
pop.serveur.fr.
Escape character is '^]'.
+OK POP3
pop.serveur.fr v5.12 server ready
USER cmoi
+OK User
name accepted, password please
PASS mdp
+OK Mailbox
open, 1 messages
LIST
+OK Mailbox scan listing
follows
1 7503
.
QUIT
+OK Sayonara
Connection
closed by foreign host.
$
Sont marquées en gras les commandes que nous tapons. Nous commençons par nous identifier avec les commandes USER et PASS ; le nombre des messages est indiqués par le serveur. Avec la commande LISTE, nous obtenons la liste des messages ; lorsqu'il n'y a plus de message, un point est affiché. Enfin, la commande QUIT termine la session avec le serveur.
Tout cela est très simple, et nous allons programmer cela en OSM ! Notez que ce programme ne peut fonctionner qu'avec la version 1.3.4 d'OSM disponible sur le WEB ou dans le CDROM.
#! /usr/local/bin/osm
--banner=off --exec
(define (mail? server user
pass)
(let* (; port du serveur POP
[port
110]
; adresse à ouvrir
[url
(format #f
"socket://~a:~a"
server
port)]
;
le port lié à la socket
[port
(open-input-output-file url)]
; port pour le
debug:
; #t écran,
; #f
pas de message
[debug #t])
(if port
(begin
; lire l'invite du serveur
(format debug "~a\n" (read-line
port))
; envoyer le nom
d'utilisateur
(format port "USER ~a\r\n"
user)
; lire le résultat
(format
debug "~a\n" (read-line port))
; envoyer le mot de passe
(format port "PASS
~a\r\n" pass)
; lire le résultat
(format debug "~a\n" (read-line
port))
; demander la
liste des messages
(display "LIST\r\n"
port)
; lire le résultat
(format
debug "~a\n" (read-line port))
; lire la liste des messages
(let ([n (let
loop ()
(let ([l (read-line port)])
(format debug "~a\n" l)
(if (or (eof-object? l)
; si c'est un point
;
terminer
(eqv? l "."))
0
; ajouter un et continuer
(+ 1 (loop)))))])
; terminer la session
(display
"QUIT\r\n" port)
; lire le résultat
(format debug "~a\n" (read-line port))
; fermer le port
(close-input-output-port port)
; retourner la valeur
n))
(error
"Incapable d'ouvrir l'URL ~a"
url))))
;
programme principal
(let ([n (mail? "pop.serveur.fr"
"cmoi" "mdp")
(format
#t
"Vous avez ~a
mail~a en attente\n"
n
(if
(> n 1) "s" "")))
Le lecteur pourra s'il le désire consulter les RFC (Request For Comments) concernant le protocole POP et réaliser un client POP complet avec réception et émission de mail.
Nous sommes maintenant parés pour utiliser toutes les fonctionnalités concernant les ports et nous en ferons abondamment usage par la suite.
Les auteurs
Guilhem de Wailly, directeur de la société Erian Concept : support, formations, configurations, administration, développements Linux. Environnement OpenScheme.
http://www.erian-concept.com
Pr Fernand Boéri, Professeur à l'Université de Nice - Sophia-Antipolis, membre de l'unité SPORTS du laboratoire I3S, spécialiste en modélisation, évaluation de performances et architectures parallèles.
http://www.i3s.unice.fr
Références
Scheme
 Structure et Interprétation
des programmes informatiques
H. Abelson, GJ.
Sussman
InterEdition
 The Scheme Programming
Languages - Ansi Scheme
R. Kent Dybvig
Prentice Hall
 Les langages Lisps -
Christian Queinnec
InterEdition
 Programmer avec Scheme
- J. Chazarin
Thomson Publishing
 Revised4 Report on the
Algorithmic Language Scheme
W. Clinger, J.
Rees
ftp://ftp.nj.nec.com/pub/kelsey
Environnements Scheme
 Scm - A.
Jaffer
http://www-swiss.ai.mit.edu/~jaffer
La
référence des interprètes Scheme. Très
petit, rapide, pour beaucoup de plates-formes, extensible.
 PCScheme - Texas
Instrument
ftp://cui.unige.ch/public/pcs/pcscheme.exe
Un
très bon environnement de programmation Scheme pour DOS, avec
éditeur intégré.
 DrScheme -
Rice University
http://www.cs.rice.edu/CS/PLT/
Environnement
Scheme libre très avancé.
 ChezScheme -
Cadence, Inc
http://www.scheme.com/
Environnement
Scheme très performant.
 Inlab Scheme - Inlab
Software GmbH
http://www.munich.net/inlab/scheme/
Environnement
commercial
 EdScheme, 3Dscheme -
Scheme, Inc
http://www.schemers.com/
Environnement
de programmation Scheme pour Windows.
 OpenScheme -
Erian Concept
http://www.open-scheme.com
Environnement
professionnel de programmation Scheme comprenant un interprète,
un compilateur et un débogueur symbolique.
Existe en
version libre et commerciale, pour Linux, FreeBSD, Solaris, Windows
et BeOS, sur systèmes Intel.