Un serveur WEB en OpenScheme

Scripts CGI côté serveurs

Par :

Guilhem de Wailly (gdw@erian-concept.com)



Résumé

Dans cet article, nous continuons la programmation d'un serveur WEB élémentaire en Scheme. Nous utilisons l'environnement Open-Scheme disponible librement sur le site www.open-scheme.com. Certaines fonctionnalités utilisées sont des extensions à la norme du langage qui peuvent être assez facilement portées vers d'entres systèmes Scheme.

Cette étude sera le prétexte pour mieux comprendre par la pratique comment fonctionnent les serveurs WEB.

Le mois dernier, nous avons ajouté au serveur la possibilité d'exécuter les scripts CGI.

Ce mois-ci, nous allons mettre en place un environnement d'exécution de manière à pourvoir inclure du code Scheme dans les pages HTML, code Scheme qui sera exécuté par le serveur. L'avantage immédiate est l'augmentation sensible de la vitesse d'exécution par rapport aux scripts CGI traditionnels.

L'environnement Open-Scheme est amélioré en fonction de ce projet. Aussi, il est nécessaire de se procurer la version la plus récente. Nous faisons notre maximum pour fournir l'environnement en temps et en heure, et librement, sur le serveur WEB d'Open-Scheme (www.open-scheme.com), sur le CDROM de Linux Magazine ou dans l'archive http://www.erian-concept.com/pub/ows.tgz.

Si je ne me trompe pas, cet article est prévu pour juillet-août, donc bonne vacances à tous !

Description

Les scripts CGI ont comme intérêt d'être complètement indépendants de tous langages de programmation : ils sont considérés par le serveur comme des programmes exécutables répondant à un certain protocole de communication. Leur inconvénient majeur est de consommer beaucoup de ressources système pour s'exécuter, surtout si se sont des programmes interprétés. Dans ce cas, l'interprète du langage doit être chargé en mémoire et initialisé à chaque invocation du script.

C'est pour cette raison que sont apparus des environnements d'exécution liés aux serveurs WEB qui économisent le temps de chargement et d'initialisation de l'interprète. On connaît les ASP sous Windows, mais surtout l'environnement PHP (www.php.net) sous Unix. Ces environnements permettent d'intégrer du code directement dans les pages WEB. Le serveur détecte la présence de ce code et le communique à l'interprète qui est en permanence en attente.

Ce mois-ci, nous proposons de modifier le serveur WEB en Open-Scheme de manière à ce qu'il soit capable d'évaluer des portions de code Scheme incluses dans les pages WEB. Pour ce faire, nous utiliserons les fonctions existantes dans Open-Scheme et qui permettent aux scripts CGI classiques d'être des pages WEB executables incluant des portions de code Scheme.

Là encore, nous constaterons avec quelle facilité le langage Scheme se comporte dans des situations complexes.

Réalisation

Pour détecter la présence de code Scheme inclus, nous proposons de nous baser sur l'extension du fichier en choisissant, par exemple .esm pour tout fichier HTML contenant du code Scheme. Nous appellerons dans la suite ce type de page ``des pages ESM'' pour simplifier.

Nous allons modifier le serveur WEB pour qu'il prenne en compte ce nouveau type de fichiers.

Type MIME

Nous ajoutons l'extension .esm dans la liste des types mime reconnus :

(define *mimes*
'(("htm" "text/html" "Page WEB")
("html" "text/html" "Page WEB")
("txt" "text/plain" "Texte")
("css" "text/css" "Style HTML")
  ("gif" "image/gif" "Image GIF")
...
("osm" "text/html" "OpenScheme source")
("esm" "text/html" "OpenScheme embedded")
("scm" "text/html" "Scheme source")
...
))

Classes

Il est ensuite nécessaire de modifier les classes <server> et <query> : la première reçoit un nouveau champ embedded-suffix contenant la liste des extensions des fichiers ESM et la seconde, un champ permettant d'indiquer la présence d'une ressource ESM et qui sera utilisé lors du traitement des requêtes :

(define-class <server> #f
[name :initform ""]
[address :initform ""]
[port :initform 0]
[root-directory :initform ""]
[script-alias :initform '()]
[script-suffix :initform '()]
[embedded-suffix :initform '()]
[default-indexes :initform '()]
[browse :initform #f]
[access-log :initform #f]
[error-log :initform #f]
[error :initform #f])

et :

(define-class <query> #f
[date :initform 0.0]
[method :initform ""]
[uri :initform ""]
[protocol :initform ""]
[headers :initform '()]
[url :initform ""]
[cgi :initform #f]
[embedded :initform #f]
[string :initform ""]
[resource :initform ""])

Création du serveur

Le serveur doit être créé avec un nouveau champ contenant la liste des suffixes des pages ESM :

(let ([server
       (build
        <server>
 :name "http://www.dummy.com"
:address "1.1.1.1"
:port 8080
:root-directory "/home/html"
:script-alias '("/cgi-bin" ".")
:script-suffix '(".cgi"
".bat"
".sh"
".osm"
".cgi")
:embedded-suffix '(".esm")
:default-indexes '("index.html"
"index.htm"
"index.cgi")
:browse #t
:access-log "ows.log"
:error-log "ows.err")])
  ...

Sans cela, les pages ESM ne seront pas reconnues. On pourra ajouter ici autant d'extension que nécessaire.

Traitement de la requête

Le traitement de la requête doit détecter si la ressource demandée est une page ESM. Dans ce cas, la fonction positionne l'indicateur embedded de l'objet query :

(define (process-query server query)
(if (not (os:directory?
(<server>:root-directory server)))
    ...

; Vérifier s'il s'agit d'un script CGI
(let ([url (<query>:url query)]
[alias (<server>:script-alias server)])
    ....

; Vérifier s'il s'agit d'une page ESM
(if (not (<query>:cgi query))
(
let ([url (<query>:url query)])
(let loop ([suffix (<server>:embedded-suffix
server)])
(
if (not (null? suffix))
(
if (string-tail? url (car suffix))
(<query>:embedded! query #t)
(loop (
cdr suffix)))))))

; Vérifier si le répertoire se termine par /
(let ([url (<query>:url query)])
    ...

La fonction compare l'extension du fichier aux extensions des ESM afin de déterminer si la ressource est une page ESM. Si c'est le cas, l'indicateur embedded de l'objet requête est positionné.

Production des sorties

La fonction de sortie a subi quelques modifications de manière à tenir compte des ESM :

(define (output-resource server query)
(let* ([resource (<query>:resource query)]
[protocol (<query>:protocol query)]
[path? (path? resource)]
[ext (if path? #f (os:extname resource))]
[mime (if path? #f (assoc ext *mimes*))]
[mime (if mime (cadr mime) #f)]
[mime (if mime mime "text/plain")])
(format *current-error-port* "mime = ~s\n" mime)
(if (and (or (string=? protocol "HTTP/1.0")
(string=? protocol "HTTP/1.1"))
(or (string=? mime "text/plain")
(string=? mime "text/html")))
(begin
(print-header query "200 OK")
(format #t
"Last-Modified: ~a\r\n"
(format-date (os:modified resource)))
(format #t "Content-Type: ~a\r\n" mime)))

(cond [(string-ci=? (<query>:method query) "head")
; Demande de l'entête seulement.
(format *current-error-port*
"header requested\n")
(format #t
"Content-Length: ~a\r\n\r\n"
(
os:size resource))
'nothing]

[path?
; Affichage des répertoires
(format *current-error-port*
"tree requested\n")
(format #t
"Content-Length: ~a\r\n\r\n"
(
os:size resource))
(output-tree server query)]

[(<query>:cgi query)
; Prise en compte des CGI
(format *current-error-port*
"cgi requested\n")
(format #t
"Content-Length: ~a\r\n\r\n"
(
os:size resource))
(output-cgi server query)]

[(<query>:embedded query)
; Prise en compte des ESM
(
format *current-error-port*
"html requested\n")
(output-html server query)]

[else
; Addichage d'une ressource simple.
(format *current-error-port*
"file requested\n")
(format #t
"Content-Length: ~a\r\n\r\n"
(
os:size resource))
(output-file server query)])))

La prise en compte des pages ESM est assurée en détectant le champ embedded de l'objet requête. L'entête HTML Content-length est affichée directement lorsque la taille de la ressource est connue à l'avance ou bien elle est affichée au moment où la ressource est produite (cas des ESM).

Production des ESM

La fonction output-html est le coeur du système de production des ESM. Cette fonction est chargée de préparer un environnement pour l'évaluation des portions de code Scheme dans les pages HTML dans lequel elle définit ou redéfinit des fonctions et des variables. Puis elle évalue le code inclus dans la page et affiche le code HTML produit :

(define (output-html server query)
(let* (; Environnement d'execution.
[env (osm:env:new)]
; Retourne une valeur d'entête.
[get (lambda (name)
(let ([c (assoc name
(<query>:headers query))])
(if c (cdr c) #f)))]
; Valeur du nouveau cookie, ou #f
[new-cookie #f]

La fonction commence par créer un environnement d'évaluation initialement vide, une fonction locale get qui retourne la valeur d'un entête connaissant son nom et la variable contenant la nouvelle valeur du cookie (voir plus bas).

Nous définissons ensuite une liste de variables utiles pour l'exécution du script. Ces variables seront définies dans l'environnement d'évaluation du script et correspondent aux variables d'environnement des scripts CGI. La valeur de ces variables est obtenue soit à partir des entêtes HTML, soit à partir de la requête :

; Variables Scheme liées
[vars
`((http-cookie .
 ,(get "HTTP-COOKIE" ))
(auth-type .
,(get "AUTH-TYPE" ))
(content-length .
,(get "CONTENT-LENGTH" ))
(content-type .
,(get "CONTENT-TYPE" ))
(path-info .
,(get "PATH-INFO" ))
(path-translated .
,(get "PATH-TRANSLATED" ))
(query-string .
,(<query>:string query ))
(remote-addr .
,(get "REMOTE-ADDR" ))
(remote-host .
,(get "REMOTE-HOST" ))
(remote-ident .
,(get "REMOTE-IDENT" ))
(remote-user .
,(get "REMOTE-USER" ))
(script-name .
,(<query>:resource query ))
(server-name .
,(<server>:name server ))
(server-address .
,(<server>:address server ))
(server-port .
,(<server>:port server ))
(server-protocol .
,(<query>:protocol query ))
(server-software .
,*server* )
(request-uri .
,(<query>:uri query ))
(request-method .
,(<query>:method query ))
(document-root .
,(<server>:root-directory server))
)]

La fonction recherche ensuite la liste des champs de formulaire pour les définir comme des variables Scheme dans l'environnement d'évaluation des scripts. Cette recherche est effectuée à l'aide de la très puissante fonction net:cgi:parse-input du module NET d'OpenScheme qui permet d'extraire la valeur des champs de formulaires avec les méthodes GET et POST ainsi qu'avec des requêtes multi-parties (multi-part encoding) :

; Liste des couples nom-valeur des champs des
; formulaires.

[couples (net:cgi:parse-input
(get "CONTENT-TYPE")
(get "CONTENT-LENGTH")
(<query>:method query)
(<query>:uri query))])

La fonction initialise ensuite l'environnement, ce qui à pour effet de dupliquer toutes les définitions de l'environnement standard d'OpenScheme. L'utilisation d'un environnement particulier a pour effet de protéger l'environnement du serveur WEB contre les erreurs qui pourraient être produites par les pages ESM :

; Initialise l'environnement
(osm:env:init env)

Nous redéfinissons ensuite certaines fonctions standards d'OpenScheme, comme par exemple eval, qui doit effectuer ses évaluations dans l'environnement du script et non dans l'environnement d'OpenScheme afin de préserver son intégrité :

; Redéfinition des fonctions standards.
(osm:env:put! env 'load (lambda (file)
                            (load file env)))
(osm:env:put! env 'eval (lambda (exp)
                           (eval exp env)))

; Definit la fonction defined? pour les champs.
   ; de formulaires.
(osm:env:put! env
'defined?
(lambda (symbol)
(if (assq symbol couples) #t #f)))

Nous définissons ensuite la fonction set-cookie qui permettra aux scripts de définir un cookie qui sera renvoyé au navigateur client :

; Définit la fonction set-cookie qui permet
; de créer un cookie.
(osm:env:put!
env
'set-cookie
(lambda (name value path expire domain secure)
(set! new-cookie
(format #f
(string-append
"Set-Cookie: ~a; "
"path=~a; "
"expires=~a; "
"domain=~a; "
"secure=~a\r\n")
name
value
path
expire
domain
secure))))

La difficulté avec les cookies et qu'ils doivent être déclarés dans les entêtes du résultat, avant toutes autres sorties. Cette fonction permet de modifier la variables locale new-cookie lors de l'évaluation du code inclus. Comme le résultat n'est pas directement renvoyé au client mais accumulé dans un tampon, il sera possible de positionner correctement l'entête avant la production effective de la sortie.

Enfin, les variables utilitaires ainsi que les champs de formulaires sont définis dans l'environnement :

; Définit toutes les variables.
(for-each (lambda (var)
(osm:env:put! env
                             (car var)
                             (cdr var)))
vars)
; Définit tous les champs de formulaires.
(for-each (lambda (couple)
(osm:env:put! env
                             (car couple)
                             (cdr couple)))
couples)

L'exécution du script peut provoquer des erreurs ou invoquer la fonction exit. Il est nécessaire de modifier le traitement standard des erreurs afin qu'il ne perturbe pas le fonctionnement du serveur ainsi que la fonction exit afin de ne pas terminer le serveur :

; Exécute le script...
(let* (; Ancien filtre des erreurs
[error:hooks *error:hooks*]
; Exécute le script
[exec
(lambda ()
(call/cc
(lambda (exit)
; Définit exit comme cette continuation
; pour que l'appel à exit depuis le script
; ne termine pas le serveur WEB.
(osm:env:put! env 'exit exit)
; Redéfinit le filtre des erreurs
(set! *error:hooks*
(list
(lambda (fmt . args)
(display "<br><font color=red>")
(display "<b>Error: ")
(format
#t
"~a</b></font>"
(vformat #f fmt args))
(exit))))
; Evalue le sript
(with-input-from-file
(<query>:resource query)
(lambda ()
(net:cgi:parse-html env))))))]
[html? #t]
; Evaluation du script et récupération de
; la sortie standard dans une chaîne de
; caractères.
[output (with-output-to-string exec)])

Lorsque le script a été exécuté, on restaure le filtre des erreurs original :

; Restauration des anciens filtres d'erreur.
(set! *error:hooks* error:hooks)

Si un nouveau cookie a été défini, on affiche l'entête y correspondant :

; Si un cookie a été définie, le déclarer.
(if (and (or (string=? (<query>:protocol query)
"HTTP/1.0")
(string=? (<query>:protocol query)
"HTTP/1.1"))
new-cookie)
(format #t
"Set-Cookie: ~a\r\n"
new-cookie))

On calcule aussi la taille de la sortie afin de la retourner au client sous la forme d'un entête HTML :

; Déclarer la taille de la sortie
(format #t
"Content-Length: ~a\r\n\r\n"
(string-length output))

Le résultat est alors produit, après les entêtes :

; Retourner au navigateur la sortie du
; script.
(display output)

Enfin, on affiche des informations sur le serveur :

; Afficher sous la forme d'un commentaire
; HTML des informations sur OpenScheme.
(format #t
"\n\n<! ~a - ~a [~a]\n\n~a>\n"
*name* *version* *when* *copyright*))))

Il est maintenant temps de tester notre nouveau serveur !

Exemple

Ecrivons un petit formulaire HTML contenant du code Scheme dans le fichier /home/html/test.esm :

<html>
<body>
<osm (set! *osm:inter:error-on-unbounded*
#f)
osm>
<br>
<font color=red><b>
Aujourd'hui,
<osm (display (date->string (date))) osm>
</b></font>
<osm (format #t "<br>nom=~a\n" nom) osm>
<br>
Entrez votre nom et votre pr&eacute;nom:
<form method=post action=/test.esm>
<br>nom <input type=text name=nom >
<br>pr&eacute;nom<input type=text name=prenom>
<br><input type=submit>
</form>
</body>
</html>

Ce formulaire HTML contient du code Scheme entre les balises <osm et osm>. Ce code sera exécuté par le serveur. Dans le formulaire, nous affectons à la variable *osm:inter:error-on-unbounded* la valeur faux ; ainsi, Open-Scheme ne provoquera pas d'erreur lors de l'évaluation des variables non définies.

Ensuite, nous affichons la date du jour après l'avoir convertie en chaîne de caractères. Puis nous affichons la valeur de la variable nom, correspondant à la valeur du champ appelé nom dans le formulaire. Lors du premier affichage, ce champ n'est pas défini, et cette variable non plus. C'est pour cette raison que nous avons positionné *osm:inter:error-on-unbounded* à faux, de manière à ne pas provoquer d'erreur.

Lançons maintenant le serveur WEB dans un terminal :

T1:gdw@erian> ./ows.osm
95250.230000: make server socket
95250.240000: accept connection (1)

Depuis un autre terminal, invoquons lynx :

T2:gdw@erian> lynx http://localhost:8080/test.esm

Sur le terminal du serveur, nous obtenons les traces suivantes :

T1:gdw@erian> ./ows.osm
95250.230000: make server socket
95250.240000: accept connection (1)
95489.570000: read the request
95489.620000: going to read
95490.100000: end to read
95490.330000: line = "GET /test.esm HTTP/1.0"
95490.490000: method = "GET", uri = "/test.esm", protocol = "HTTP/1.0"
95491.240000: header = "Host: localhost:8080"
95491.360000: header = "User-Agent: Lynx/2.8.3rel.1 libwww-FM/2.14"
95491.360000: header = ""
mime = "text/html"
html requested
95492.280000: shutdown the socket

95492.320000: accept connection (2)

Et lynx affiche :


Figure 1 : Ecran de lynx.

lors de la première invocation, la variable nom, , n'est pas définie. En ayant pris soin de positionner la variable *osm:inter:error-on-unbounded* a faux, Open-Scheme ne provoque pas d'erreur lors de son évaluation, et retourne simplement #unbounded. Lors de la deuxième invocation, cette variable sera définie à la valeur saisie dans le formulaire, et sa valeur sera affichée sous la forme d'une chaîne de caractères.

Disponibilité

Le code source ainsi que la dernière version d'OpenScheme (pré-1.4.0) sont disponibles à l'adresse :

http://www.erian-concept.com/pub/ows.tgz.

Nous nous excusons auprès des lecteurs ayant tenté de télécharger les précédentes versions car il y avait une erreur dans l'archive.

L'auteur

Guilhem de Wailly, gérant de la société Erian Concept (www.erian-concept.com): support, formations, configurations, administration, développements Linux. Environnement Open-Scheme et vice-président de la R&D de Tornado Technology (www.aecviz.com).

Références

WEB

 PHP
http://www.php.net

 TCP/IP, Architecture, protocoles, applications
Douglas Comer
InterEdition

ï‚· W3C
http://www.w3c.org

ï‚· CGI
http://www.jmarshall.com/easy/cgi/

ï‚· CGI
http://hoohoo.ncsa.uiuc.edu/cgi/

ï‚· CGI
http://www.tsden.org/ryutaroh/fileupload-e.shtml

ï‚· CGI en Français
http://www.scripts-fr.com/

ï‚· CGI+Scheme
http://www.lh.com/~oleg/ftp/Scheme/web.html

ï‚· FastCGI
http://www.fastcgi.com/

ï‚· HTTP en Français
http://webbo.enst-bretagne.fr/ActiveWebFr/eg-uk-tut.book_29.fr.html

ï‚· HTTP 1.0
http://www.ietf.org/rfc/rfc1945.txt

ï‚· HTTP 1.1
http://www.ietf.org/rfc/rfc2616.txt

Scheme

 Structure et Interprétation des programmes informatiques
H. Abelson, GJ. Sussman
InterEdition

 The Scheme Programming Languages - Ansi Scheme
R. Kent Dybvig
Prentice Hall

 Les langages Lisps - Christian Queinnec
InterEdition

 Programmer avec Scheme - J. Chazarin
Thomson Publishing

 Revised4 Report on the Algorithmic Language Scheme
W. Clinger, J. Rees
ftp://ftp.nj.nec.com/pub/kelsey

Environnements Scheme Free

 Bigloo - Manuel Serrano
http://kaolin.unice.fr
Environnement de programmation Scheme.

 DrScheme - Rice University
http://www.cs.rice.edu/CS/PLT/
Environnement Scheme libre très avancé.

 PCScheme - Texas Instrument
ftp://cui.unige.ch/public/pcs/pcscheme.exe
Un très bon environnement de programmation Scheme pour DOS, avec éditeur intégré.

 Scm - A. Jaffer
http://www-swiss.ai.mit.edu/~jaffer
La référence des interprètes Scheme. Très petit, rapide, pour beaucoup de plates-formes, extensible.

 Stk - Erik Gallesio
http://kaolin.unice.fr
Interprète Scheme avec la bibliothèque TK.

D'autres liens sont visibles sur le site www.schemers.org.

Environnements Scheme commerciaux

 ChezScheme - Cadence, Inc
http://www.scheme.com/
Environnement Scheme très performant.

 EdScheme, 3Dscheme - Scheme, Inc
http://www.schemers.com/
Environnement de programmation Scheme pour Windows.

 Inlab Scheme - Inlab Software GmbH
http://www.munich.net/inlab/scheme/
Environnement commercial

 Open-Scheme - Erian Concept
http://www.open-scheme.com
Environnement professionnel de programmation Scheme comprenant un interprète, un compilateur et un débogueur symbolique.
Existe en version libre et commerciale, pour Linux, FreeBSD, Solaris, Windows et BeOS, sur systèmes Intel et Sun.