La biblioteca abierta – OpenLibrary.org

Estas vacaciones me la he pasado jugando con OpenLibrary.org, un sitio web cuyo objetivo es crear una página por cada libro existente. Al igual que en la mayoría de proyectos relacionados a la expansión del conocimiento, depende de los usuarios para llegar a los archivos más oscuros y solitarios en el planeta. La Open Library es un proyecto de nuestros amigos de Internet Archive y fue inicialmente liderado por Aaron Swartz —the internet’s own boy—. El 16 de julio de sus veintiún años, Aaron escribió en su blog:

Nuestro objetivo es la construcción de la biblioteca más grande del mundo, para luego ponerla en internet de forma libre/gratuita; y que todos la usen y editen. Los libros son el lugar al que vas cuando tienes algo que quieras compartir con el mundo —son el legado cultural de nuestro planeta. Y nunca ha habido un intento más grande para juntarlos a todos.

Aunque Internet Archive cuente con la mayor cantidad de libros digitalizados del mundo, su sitio web no es del todo atractivo para los nuevos usuarios. Si eres un lector, te puedes asustar al ver siete tipos de archivos. Si eres un autor, tal vez prefieras un lugar donde la portada se muestra claramente y desde donde la gente pueda no sólo leer sino también comprar tu libro. Open Library toma esto en cuenta y permite a los usuarios añadir cosas como el número ISBN —un identificador que permite saber dónde se vende cierta edición de un libro— lo que automáticamente crea una lista de enlaces en el perfil del libro para que tú puedas adquirirlo. También te permite añadir otros identificadores como el de Internet Archive, para que la gente pueda leer el libro en línea y, directamente desde la Open Library, descargar el libro en el formato que más le convenga. Uno puede además añadir toda la información que recopila una buena biblioteca: editorial, fecha de publicación, fecha del derecho de autor, colecciones, secuelas, tamaño, peso tablas de contenido, etc. Esta información es incluida en los catálogos que también se generan automáticamente: RDF, JSON —que es como los libros se saludan en Internet— e incluso existe un formato para crear citaciones de Wikipedia. El código fuente de OpenLibrary.org se encuentra disponible bajo una licencia de software libre.

Muchas obras que se encuentran en Open Library fueron colocadas ahí por bots —programas de software que realizan tareas automáticamente— recorriendo grandes bases de datos y extrayendo información básica sobre los libros (nombre, autor, año de publicación, número de páginas, entre otros). Muchas veces esa información está incompleta o es errada y es ahí donde los usuarios tenemos nuestro rol, nosotros podemos verificar los datos y añadir más bits a cada entrada. En mi caso, he añadido unas cuantas portadas, algunos números ISBN, tablas de contenido y, cuando ha sido posible, incluso he puesto a disposición el libro para su lectura, esto subiendo el archivo a Internet Archive y compartiendo en la Open Library su identificador.

Hubo casos en que creé el perfil de un libro absolutamente desde cero, puesto que mucha de la información que se recoge automáticamente se encuentra exclusivamente en inglés y esto puede causar que autores pequeños o independientes —especialmente los que escriben en idiomas distintos al inglés— se vean excluidos de las grandes bases de datos.

Hace tiempo traduje un libro al español y, aunque nunca tuve un ejemplar en versión digital, alguien más sí lo adquirió. Gracias a que el libro no estaba protegido por DRM y a que la licencia del libro lo permitía, esta persona pudo transformar el libro a formato ePub —un tipo de libro electrónico— y ponerlo a disposición de todos en Internet. Yo subí este archivo a Internet Archive, como lo indiqué en una publicación anterior, y el archivo fue transformado a otros seis formatos. Además se creó el lector respectivo. Cuando terminé de crear el perfil del libro —sin incluir la tabla de contenidos—, quedó así:

A los latinoamericanos nos queda mucho trabajo, pues muchos de nuestros libros no se encuentran en la biblioteca abierta y sería bueno dejar ese legado a las primeras generaciones que van a crecer conectadas, desde chicos, a Internet.

 

 

Representando a Creative Commons en la Asamblea Nacional

Les comparto la última publicación de Creative Commons Ecuador. No fue sino hasta minutos antes de empezar mi presentación que me doy cuenta que estaba hablando a nombres de esa organización internacional que he admirado desde hace tanto tiempo, para incidir en el futuro de cosas tan importantes como el acceso al conocimiento de un país. Estaba cansado y, producto de eso, un poco molesto, pero creo que perdí perspectiva de que cada pequeño paso dado me llevó a ese momento. Esa hubiera sido mi meta dos años atrás, fue una bonita experiencia darse cuenta. Sapiens sapiens. Les dejo el texto del artículo sin mayor preámbulo pero les pido que revisen el PDF que preparamos para la presentación, son apenas 7 páginas de letra muy gorda:

Dentro del debate del Proyecto de Código Orgánico de la Economía Social de los Conocimientos, Creatividad e Innovación (Código INGENIOS), hoy recibimos invitación de la Asamblea General para ser recibidos en Comisión General donde se recogieron dos preocupaciones que Creative Commons Ecuador elaboró y argumentó:

  • Incluir expresamente un artículo que garantice el acceso abierto a publicaciones financiadas con fondos públicos, y
  • La revisión de los artículos 121 al 124, los cuales prohíben “eludir las medidas tecnológicas efectivas, como sistemas de cifrado u otros, que sean utilizadas por los titulares de derechos de autor o derechos conexos”.

Andrés Delgado hizo uso de los 10 minutos asignados para desarrollar estos dos aportes. El documento completo lo pueden revisar en este enlace.

Andrés Delgado de CC Ecuador interviene en la Comisión General
Andrés Delgado de CC Ecuador interviene en la Comisión General. Foto cortesía de @claryrobayo

Junto a otros actores de la sociedad, el encargado de la relatoría recogió los aportes que permitirán iniciar el primer debate dentro de aproximadamente un mes.

Fuente: Creative Commons Ecuador

Apertura científica

«La ciencia es la creencia en la ignorancia de los expertos»- Richard Feynman

La apertura científica está caracterizada por una apertura en los procesos, la disponibilidad de los datos y metodologías, por el hecho de que cualquier persona pueda verificar lo que está escribiendo el investigador bajo las condiciones apropiadas, y por la posibilidad de utilizar los resultados de la investigación (esto se conoce como acceso abierto). Si lo sistematizamos un poco, esto queda algo así:

  1. Transparencia en la recolección de datos y en las metodologías de observación y experimentación;
  2. Disponibilidad pública de los datos, en un formato adecuado para su reutilización;
  3. Transparencia y accesibilidad de la comunicación científica;
  4. Uso de herramientas en línea para facilitar la colaboración científica.

Al igual que sucede con el software, no basta liberar el código. Muy pocas personas podrán realmente utilizar ese conocimiento, sino se acompaña de un formato amigable al usuario, de ser fácilmente indexado por los motores de búsqueda más comunes, que uno pueda copiar el texto sin tener que pelear con el PDF, entre otras cosas. El problema es que bajo el paradigma actual—»Trabaja, termina, publica [en un diario reconocido]»— no contribuye a hacer amigable al conocimiento; es algo totalmente secundario y hasta podría resultar hasta contraproducente.

La apertura científica implica:

  • «Perder» tiempo arreglando el formato
  • «Perder» reputación al publicar en un diario de libre acceso que no te otorga más puntaje dentro de las evaluaciones clásicas, o que incluso podría empeorar tu reputación por publicar en diarios «de menor calidad».
  • Esta pérdida de reputación a su vez tiene efectos en el acceso que un investigador pueda tener a laboratorios y herramientas que se encuentran dentro de instituciones que buscan precisamente personal prestigioso. Sin buenos laboratorios, el científico no puede ahondar más en su material; finalmente,

Estos factores generan un impacto en los ingresos del investigador y también de las universidades que los financian. ¿Qué haría que los investigadores incluyan estos «costos» dentro de sus proceso de investigación y publicación? O en otras palabras ¿cómo evitamos la externalidad de la exclusión de una gran cantidad de la población al conocimiento científico?

La puesta en práctica de un nuevo paradigma—»Trabaja, termina, publica, libera»—debe ser institucionalizada. La inclusión de datos y metadatos en la web debe ser un requerimiento por parte de los rectores de ciencia e investigación.[1]

Es mala idea aplicar los mismos parámetros para quien escribe un cuento y quien investiga el cáncer. Es necesario incluir políticas que aseguren transparencia en el desarrollo de las investigaciones científicas, así como una nueva metodología de publicación, al menos para aquellas investigaciones que reciben fondos públicos, sino para todas aquellas que se encuentran dentro del sistema de investigación.

Adicional a esto, hay que enfrentar el problema de que el conocimiento es secuencial, y que muchas de las antiguas publicaciones cerradas son la base para nuevos artículos, parece ser necesario entonces que en estos repositorios abiertos que menciona Creative Commons, se sepa distinguir entre estas dos categorías: verificable [por cualquiera] y no verificable. Esto con el objetivo de advertir, pero también de demostrar lo perjudicial que pueden ser los sistemas cerrados de publicación y su fomento mediante una alta calificación a los mismos.

Los investigadores pueden y deben exigir reformas a los sistemas de evaluación en universidades y otras instituciones para salir del Lock-in que representa el modelo actual de gestión del conocimiento científico y el público en general debe ser concientizado sobre esta problemática. Esto es clave para conseguir el apoyo a reformas políticas que actualmente podrían parecer «sui generis» o «noveleras».

La formación de una revista científica robusta que funcione a manera de repositorio abierto para las publicaciones del Sur (y aquellos que desde el Norte quieran unirse a la iniciativa) debe ser puesta en marcha, los estándares y calidad deben ser iguales o mejores que aquellas de las revistas científicas clásicas. La revisión de pares debe y permanecerá hasta que otros métodos sean igual de confiables o mejores.

Notas:

[1] Esto no puede hacerlo sólo un país. Si un gran porcentaje de la producción científica se encuentra ubicada en el hemisferio sur, sobretodo en Asia, es factible que una cooperación Sur-Sur determina un cambio en la forma en que hacemos investigación y divulgación científica.

El término original bajo el cual se puede encontrar muchísima información en inglés es «Open Science», ciencia abierta. He preferido no usar ese término porque denota una subdivisión de la ciencia (abierta y cerrada); eso no existe, sino que los protocolos y comportamientos científicos se han alejado del buen uso que le debemos dar al método científico. Lo que necesitamos no es una «ciencia abierta», es más apertura científica.

El núcleo conceptual del artículo gracias a Dan Gezelter y su artículo «What, exactly, is open science», http://www.openscience.org/blog/?p=269

La versión original de este artículo ha sido editada y archivada.