Notxor tiene un blog

Defenestrando la vida

Lisp y scheme embebidos

Notxor
2023-08-12

Hablar de Lisp y de Scheme es hablar de dos dialectos del mismo lenguaje. Un lenguaje que necesita media tarde para aprender su sintaxis y media vida para aprender realmente a usarlo; aunque, afortunadamente, rinde desde el minuto uno. En este artículo voy a hablar de dos dialectos diseñados para ser embebidos en programas, aplicaciones y sistemas más grandes. Si estás buscando un lenguaje para dotar a tu sistema de mecanismos para programarle extensiones, deberías valorar alguno de estos dialectos. Aplicaciones como AutoCAD (AutoLisp), Maxima y Emacs (elisp), Audacity (Nyquist), utilizan versiones embebidas de Lisp, o también GIMP utiliza Scheme en su sistema de plug-ins. Hablaré de un Lisp y de un Scheme, en concreto, sobre embeddable common-lisp1, ecl, y sobre chibi-scheme2.

Cuando hablo con algún programador sobre las virtudes de Emacs, pero también sobre Lisp, es habitual que aparezca la crítica de es un sistema viejuno, como algo negativo. Es cierto, lleva más de 40 años funcionando, evolucionando y puliendo errores ¿eso es malo? Desde mi punto de vista Lisp, en cualquiera de sus sabores, incluido Emacs ha conseguido una gran estabilidad.

Muchas de mis herramientas del día a día las tengo hechas en elisp, como el código que sustenta este blog estático. Emacs me sirve para casi todo: escribir informes con org-mode, corregir tests con herramientas propias, gestionar historias clínicas cifradas, llevar la contabilidad junto con Ledger-cli3, leer los blogs que me mantienen informado mediante RSS. Para algunas pocas herramientas independientes he utilizado varios lenguajes independientes, pero últimamente estoy moviendo la mayoría a common-lisp, concretamente sbcl.

Diferencias entre Common-Lisp y Scheme

Siendo dos dialectos de Lisp no se entienden entre ellos, de hecho las podríamos considerar también como familias de sistemas Lisp. Por un lado la familia common y por otro la familia scheme. En el documento ANSI INCITS 226-1994 (R2004) está descrito el lenguaje common-lisp, aunque también existen varios dialectos Lisp que no se ajustan a ese estándar, como el elisp de Emacs, por ejemplo.

Tradicionalmente se dice que CL es un Lisp-2 mientras que Scheme es un Lisp-1. Eso quiere decir que CL tiene dos listas de definiciones, una para funciones y otra para variables. Por tanto en Lisp se utilizan macros como defun, para definir las funciones y defvar, o defparameter, para definir variables. Además, en Lisp las expresiones no son case-sensitive, toda expresión se traduce internamente a mayúsculas. Así ocurre, que mientras en Scheme podemos hacer:

~ > chibi-scheme
> (define x 1)
> (define X 12)
> x
1
> X
12
>

En CL esto no ocurre:

~ > ecl
ECL (Embeddable Common-Lisp) 21.2.1 (git:UNKNOWN)
Copyright (C) 1984 Taiichi Yuasa and Masami Hagiya
Copyright (C) 1993 Giuseppe Attardi
Copyright (C) 2013 Juan J. Garcia-Ripoll
Copyright (C) 2018 Daniel Kochmanski
Copyright (C) 2021 Daniel Kochmanski and Marius Gerbershagen
ECL is free software, and you are welcome to redistribute it
under certain conditions; see file 'Copyright' for details.
Type :h for Help.  
Top level in: #<process TOP-LEVEL 0x65bf80>.
> (defvar x 1)

X
> (defvar X 12)

X
> x

1
> X

1
> 

Por otro lado CL es un estándar prolijo e incluye, entre otras muchas cosas y detalles, la descripción de CLOS (Common Lisp Object System) que le permite a CL soportar la programación orientada a objetos.

Por el contrario, Scheme parte de una descripción minimalista cuyo objetivo no es acumular funcionalidades sino evitar las debilidades que las hacen necesarias. Esto hace que escribir un compilador o intérprete de Scheme sea más sencillo que uno de CL, pero dificulta la estandarización. Sin embargo, no está dejada de la mano la estandarización y para evitar el descontrol se establecieron las SRFI4, que vienen a poner un poco de estándar entre todos los scheme.

Como punto negativo extra, en Scheme es menos intuitivo el uso de las macros y me obliga a que me fije mejor en lo que estoy haciendo, en comparación con CL donde las macros me facilitan a primera vista qué es lo que se está definiendo.

Más allá de las características generales de las familias a los que estas dos herramientas pertenecen, ambas permiten interaccionar con código C. De hecho, permiten exportar nuestro programa a dicho lenguaje y utilizar un compilador como gcc para generar un ejecutable. También ambos traen las herramientas habituales en sistemas Lisp: REPL, intérprete para scripts, compilador de byte-code.

embeddable common-lisp

En su web (https://ecl.common-lisp.dev/) se puede descargar el código fuente en un fichero tar-ball. Una vez descargado lo compilamos:

> ./configure --prefix=/path/local/opt
> make
> make install

El último comando, dependiendo de dónde quieras instalar la aplicación, debe contar con los permisos de ejecución de root si fuera necesario.

Para probar que todo funciona, he escrito el siguiente código:

(defun factorial (x)
  (if (= x 0)
      1
      (* x (factorial (- x 1)))))

(print (factorial 2000))

La ejecución desde la línea de comandos:

> time ecl --load factorial.lisp --eval "(quit)"
;;; Loading "/home/notxor/blog/borradores/factorial.lisp"


________________________________________________________
Executed in   65.03 millis    fish           external
   usr time   80.18 millis  454.00 micros   79.73 millis
   sys time   15.14 millis  194.00 micros   14.95 millis

En otra ocasión ya hice algunas pruebas de ejecución de diversos intérpretes de Lisp, por eso añado los tiempos de ejecución. Y con ánimo de comparar, también he hecho una versión tail-recursive. Si alguien tiene dudas de qué es eso, lo expliqué mejor en el curso de elisp para no programadores en el artículo de funciones recursivas, especialmente porque en ese artículo se utiliza la función auxiliar externa, mientras que en el siguiente código la función auxiliar es interna y puede despistar un poco a los no habituales de Lisp al utilizar la forma labels para definir una función.

(defun factorial (x)
  (labels ((itera (n total)
             (if (= n 0)
                 total
                 (itera (- n 1) (* total n)))))
    (itera x 1)))

(print (factorial 2000))

Llamada desde línea de comandos con ecl:

> time ecl --load factorial.lisp --eval "(quit)"
;;; Loading "/home/notxor/blog/borradores/factorial.lisp"


________________________________________________________
Executed in   70.60 millis    fish           external
   usr time   67.38 millis  482.00 micros   66.90 millis
   sys time   18.84 millis  255.00 micros   18.58 millis

Por comparar la eficiencia con otro CL, que utilizo habitualmente, lo he ejecutado con sbcl. Llamada desde línea de comandos con sbcl:

> time sbcl --script factorial.lisp



________________________________________________________
Executed in   27.22 millis    fish           external
   usr time    0.00 millis    0.00 micros    0.00 millis
   sys time   16.03 millis  728.00 micros   15.30 millis

La diferencia entre las dos ejecuciones es significativa, en torno a una tercera parte de tiempo que ecl. La diferencia se la achaco no solo a que sbcl sea, según se dice, el CL más rápido, también a que durante la primera ejecución compila el script a byte-code. Las siguientes llamadas reducen su tiempo de ejecución al ejecutar el binario. Luego volveré un poco sobre esta explicación.

chibi-scheme

Éste lo bajé de su repositorio y lo compilé. Viene con un archivo configure y yo piqué. Las instrucciones de compilación están en el README.md y son muy sencillas:

> make --prefix=path/local/opt
> make --prefix=path/local/opt install

No me pidió ninguna dependencia ni dio ningún error, por lo que supongo que mi sistema ya las cumplía todas. Para probarlo escribí el código equivalente al anterior para Scheme.

(define (factorial x)
  (if (= x 0)
      1
      (* x (factorial (- x 1)))))

(display (factorial 2000))

También cabe utilizar chibi-scheme como lenguaje de script, para eso hay que añadir un shebang al fichero .scm y, puesto que está diseñado para ser minimalista, hay que importar las librerías básicas. Sería algo así como:

#!/home/notxor/opt/bin/chibi-scheme

(import (scheme base) (chibi))

Dándole permiso de ejecución al script lo podemos llamar directamente. La instrucción import no es necesaria si lo llamamos desde la línea de comandos. Me pareció que al ejecutar desde el inicio con esos paquetes cargados, la siguiente forma de ejecutar el código era ligeramente más rápida que la versión script:

time chibi-scheme -q factorial.scm -p "(factorial 2000)"

La opción -q carga el módulo de código y la opción -p evalúa y muestra el resultado de una expresión. El código del módulo lo muestro a continuación dejando como comentarios el shebang y la importación de módulos sólo a modo de muestra. Como dije antes, utilizándolo de esa otra manera, la carga de los módulos, me pareció que penaliza el tiempo de ejecución total del script.

;; #!/usr/local/bin/chibi-scheme

;; (import (scheme base) (chibi))

(define (factorial x)
  (if (= x 0)
      1
      (* x (factorial (- x 1)))))

(display (factorial 200))

De la misma manera que hice una versión tail-recursive para CL, la hice para Scheme:

(define (factorial x)
  (define (itera n total)
    (if (= n 0)
        total
        (itera (- n 1) (* total n))))
  (itera x 1))

(display (factorial 2000))

Veamos los resultados de las pruebas.

Comparación de tiempos de ejecución

Utilizando ambas herramientas como shell scripts los tiempos medios de ejecución obtenidos son:

Lenguaje tiempo tail-recursive
chibi-scheme 74,46 ms 79,90 ms
" script 204,87 ms 210,34 ms
ecl 77,33 ms 72,70 ms
guile5 17,48 ms 18,45 ms
sbcl5 28,82 ms 27,80 ms

¿Por qué son tan rápidos guile y sbcl? En realidad, tanto el scheme como el clisp son tan rápidos porque durante la primera ejecución generan byte-code que acelera las posteriores ejecuciones. Si eliminas el fichero compilado, en cada ejecución, los tiempos no muestran una mejora tan radical en comparación a sus primos embebibles.

Por otro lado vemos que la versión recursiva pura, en general, es ligeramente más rápida que la versión tail-recursive. Por contrapartida, la versión recursiva necesita más memoria porque tiene que desenrollar la madeja de la recursión para volver a enrollarla después. La versión tail-recursive gasta más tiempo en llamadas entre funciones pero el gasto de memoria es mínimo. Sabiendo esto, podemos elegir una función u otra dependiendo de las necesidades de nuestro sistema. En resumen, hay que tener cuidado con las iteraciones puras, con especial atención a los datos que se iteran, porque es posible que ocupen más memoria de la que nos podemos permitir, sobre todo si escasea y nuestra iteración se hace sobre listas enormes.

Conclusiones

Tanto chibi-scheme como ecl me han parecido unas magníficas herramientas, especialmente la segunda, pues no hay muchos CL que puedan utilizarse de manera embebida en aplicaciones, mientras Scheme hay varios que pueden utilizarse de ese modo.

Notas al pie de página:

4

Scheme Requests for Implementation. En el caso de chibi-scheme, reconoce estos estándares: https://synthcode.com/scheme/chibi/#h2_StandardModules

5

Tiempo de ejecución por la generación de byte-code intermedio la primera ejecución.

Categoría: lisp scheme

Comentarios

Debido a algunos ataques mailintencionados a través de la herramienta de comentarios, he decidido no proporcionar dicha opción en el Blog. Si alguien quiere comentar algo, me puede encontrar en esta cuenta de Mastodon, también en esta otra cuenta de Mastodon y en Diaspora con el nick de Notxor.

Si usas habitualmente XMPP (si no, te recomiendo que lo hagas), puedes encontrar también un pequeño grupo en el siguiente enlace: notxor-tiene-un-blog@salas.suchat.org

Disculpen las molestias.