Qué es educ.ar
Cómo se usa educ.ar
Para quiénes se hace educ.ar
Quiénes hacemos educ.ar
Quiénes nos acompañan
Home | Qué es educ.ar | Educación y TIC | Alejandro Piscitelli
 

Educación y TIC

Sindicación en línea. La segunda revolución de Internet

Por Alejandro Piscitelli

Algunas invenciones llegan antes o después de tiempo y pasan inadvertidas, sin pena ni gloria. Otras micro-innovaciones llegan justo, se convierten en levadura y cambian al mundo. De las primeras se ocupan los historiadores de lo fallido y los fracasas. De lo segundo conviene participar y sacarle el jugo. Desde que se inventó Internet hace mas de tres décadas, nada hubo mas movilizador que su faz gráfica de la cual se cumplieron 10 años en abril del 2003. Abriendo un nuevo capítulo en esto de las micro-innovaciones radicales, probablemente el lenguaje XML y sus usos en la sindicación de contenidos (y muy especialmente sus usos pedagógicos), sea el segundo pliegue o la compuerta evolutiva que estremecerá hasta sus cimientos a la red. Veamos como y porque. Y contribuyamos decisivamente en esa dirección. Por eso aunque esta nota parecería estar hablando de cosas técnicas, en realidad lo está haciendo acerca de las posibilidades de la ampliación de la comunicación. Y cuando parecería que estamos empantanados en cuestiones abstractas, de lo que estamos hablando es de lo mas concreto que se pueda imaginar. A saber como usar la tecnología para facilitar el aprendizaje y para convertir a la mayor cantidad posible de lectores en autores de información y de conocimiento.

Esos canales que se secaron en el tiempo

Nos enteramos de la cosa allá lejos y hace mucho pero mucho tiempo en términos de la cronología Interneteana -donde un mes digital era un año real. Se trataba de la sindicación de contenidos. Microsoft hablaba de canales, era la época del push y durante un tiempo precioso pero acotado parecía que proyectos interesantes (aunque tecnológicamente un poco a destiempo) como Pointcast arrasarían con la atención en la red.

Aunque Microsoft posteriormente lo dejó de lado, el formato Channel Definition Format fue incorporado en 1997 al Explorer 4.0 . En ese momento se esperaba que las síntesis temáticas de los sitios webs fueran desplegadas por el propio navegador a través de una barra de canales. Curiosamente Microsoft se olvido de esta tecnología –pensando a lo mejor incluirla mas adelante en el propio sistema operativo- y listo el pollo
Así tanto la tecnología como sus posible usos se metieron en el freezer, de los que no saldrían hasta hace pocos meses atrás, en nuestra era, al alcance de nuestra mano.

Lo raro del asunto es que este abandono de Microsoft en plena guerra de los browsers que ganaría por goleada le abrió una brecha (poco o nada explorada es cierto) a Netscape, navegador que en su versión 6 aportó una definición del RSS, o Síntesis de Sitio enriquecido Rich Site Summary que permite al editor de un sitio web publicar ese tipo de contenido en un sitio Netscape. Los usuarios de Netscape por su parte pueden elegir uno de nuestros canales como uno de los varios que pululan en la paginas de la sección My Netscape del hoy enmohecido navegador.

Un canal no es nada mas ni nada menos que una breve síntesis de una publicación en línea. Consta del nombre del canal, un logo y de un conjunto de titulares que reenvían a artículos en el sitio.

Cuando Netscape lanzó el servicio en el año 2002, los adoptantes tempranos tuvieron que lidiar con mil y un problemas pero finalmente la cosa funciono -aunque como señala Viviana Dehaes en el comentario se trata todavía de cuestioens que exigen demasiada competencia técnica.

Un archivo RSS es una descripción estructural de un sitio web o de un conjunto de sitios webs. Puesto que la información está encapsulada en un formato estructurado, al ser captada por un servicio remoto puede ser manipulada, mostrada de acuerdo a variados templates y ser objeto de búsquedas inteligentes. Pero lo mas importante de todo para el dueño o autor de un archivo RSS es que permite crear el contenido una sola vez y al mismo tiempo distribuirlo y volverlo accesible desde/hacia diferentes sitios webs.

Mas allá de lo que efectivamente hicieron con estos sistemas, ambas propuestas -tanto la de Netscape como la Microsoft- endosaron el RDF, o Resource Description Framework, cuyo principal objetivo es proveer un formato global para recursos en línea (hasta ahora las principales implementaciones de estos estandares han sido el Core Dublin para publicaciones y los Protocolos IMS para materiales instruccionales -cosas bastante sofisticadas les puedo asegurar).

Como empezó todo

Simplificando una larga historia en Agosto del 2000 un grupo de investigadores adoptó el formato RDF, generando la hoy mas que aceptada especificación RSS 1.0. que permite a los desarrolladores y editores publicar módulos RSS en sus archivos, pudiendo de ahora en mas hacer threading, referencias, categorizaciones, y todavía mas al conjunto de datos base RSS.

El principal objetivo en la creación de archivos RSS es facilitar la sindicación (es decir la distribución masiva) de contenidos de noticias.

Igual a como sucede con el mundo real aquí de lo que se trata es de que algo publicado por alguien sea captado (o capturado) por otros e incluido en su propia publicación.

Los primeros sindicadores de contenido en línea fueron portales de la magnitud de Yahoo y Excite. La propuesta estaba mas que clara. Que los visitantes de los sitios web pudieran bajar información proveniente de orígenes muy diversos desde un lugar único.

Yahoo ha recorrido un largo camino en esta dirección -habiendo coqueteado desde hace añares con MyYahoo. Desde hace tiempo el sitio muestra no solo un listado de títulos sino paquetes completos de historias provistas por acopiadores de información como son Associated Press, Motley Fool y Forbes. Aunque la mayoría de la gente no le prestó mayor atención se trata de uno de los sitios de sindicación mas poderosos de la red.

Hasta hace poco la sindicación era cara y demasiado manual para nuestro gusto y necesidades. Hace también bastante tiempo que los sindicadores de contenido querían contar con mecanismos automáticos de recolección de información pero las herramientas no ayudaban.

Programas que revisan la web son tan naturales como ésta misma, y durante mucho tiempo un programa como WebCrawler fue usado extensivamente en esta dirección. Pero estos buscadores son asistemáticos y no sirven para estructurar la información. Solo muy exageradamente les cabe el título de sindicadores de contenidos, son mas que nada motores de búsqueda. Si los mencionamos es porque la tecnología subyacente a ambas modalidades de búsqueda es muy parecida.

Uno de los sindicadores mas grandes de la web es Moreover.Com que almacena 5500 diarios y fuentes de contenidos del mundo entero y organiza los resultados en 280 categorías. El trabajo de Moreover es estúpido pero tremendamente útil. Recupera los títulos de cada página, revisa el html para encontrar los títulos y los links, y después los guarda en las correspondientes categorías. Una vez terminado su trabajo el sitio genera una serie de archivos RSS para cada categoría.

Desde septiembre del 2003 Moreover se ha metido con el magma que es el universo de los weblogs, recopilando información a partir de 25.000 weblogs preseleccionados manualmente, buscando identificar la mejor información corporativa disponible en sus entrañas. Suponiendo que haya cerca de 3 millones de weblogs activos en USA y que al menos cerca de 8 millones de norteamericanos hayan visitado este nuevo formato desde su hipepromocion a partir de la invasión de Irak, esas fuentes de información se han vuelto exquisitas.

Moreover.com le ha asignado a sus weblogs un ranking basado en la confiabilidad, integridad y calibre de los blogs. Por otra parte cada weblog despliega un conjunto de metadatos que incluyen cantidad de links entrantes y salientes, así como el status del weblog en la comunidad mas amplia.

Algo parecido a lo anterior hace iSyndicate.Com (ahora Yellow Brix), que particiona átomos de información de todo tipo, los categoriza y los arma según la necesidad de los usuarios en grandes categorías como negocios, finanzas, interés general y regional.

La gran novedad para la sindicación últimamente ha sido el pasaje de un paneo de las páginas html (que no estan diseñadas para organizar contenido sino sólo para mostrarlo) a otro de muestra de páginas XML y mucho mas especificamente las ya mencionadas RSS conformando los sitios que hoy se denominan agregadores

Aunque My Netscape usaba los RSS, el directorio no permitía a los usuarios ver los auténticos archivos RSS. Y lo mismo pasó con otro repositorio como My Userland que ahora ha sido sustituido por http://radio.userland.com/whatIsANewsAggregator. Por suerte los archivos RSS pueden encontrarse en otro sitio como XMLTree.Com, que indexa una gran cantidad de archivos XML y RSS.

¿Todo esto es muy bonito pero para que cornos sirve? ¿Qué usos prácticos tiene todo esto? ¿Como nos afecta en estas pampas barbaras y como le podríamos sacar el jugo en su medida y armoniosamente, especialmente para los usos educativos que son el motor der esta páginas?

Usos concretos y útiles de la sindicación de contenidos

Ya pasamos por las cuestiones técnicas y también por los temas de arquitectura, pero aun no queda demasiado claro para que puede servir la sindicalizacion de contenidos, y como se inscribe ésta en los avatares dela transformaicón de los paradigmas de comunicación. Así que tomemos renovado aire y metámonos de lleno en el tema.

Los usos mas obvios y previsibles de la sindicación de contenidos estan en la producción de listas de novedades o de de links nuevos sobre cualquier tema. Ya hace tiempo que especialistas como Ian Graham y Benet Devereux nos han dejado entrever los usos posibles, factibles y deseables de este tipo de tecnologías distribuidas. Así ellas sirven para irradiar contenidos tan diversos como los que mencionaremos a continuación:

·  * Boletines de noticias o síntesis de noticias usando RSS. Así empezaron My Netscape y hoy tenemos buenos ejemplos en Moreover.com y en Brix, así como en Radio UserLand -como ya dijimos mas arriba.
·  * Replicación de sitios web o distribución clonada de contenidos usando herramientas del tipo rist, donde rist es un programa que mantiene copias diferentes de archivos sobre múltiples hosts (el paroxismo de este tipo de uso seria Konspire.
·  * La distribución de contenido con formato de base de datos tal como recibir una cantidad de fechas de eventos aparecidos en numerosos sitios de la web y acumularlos en un sitio local.
·  * Servicios de archivos y recursos compartidos al estilo de Gnutella. En este caso se trata de un servicio end to end copia de un mismo archivo (música, video pero también podría ser texto como en el celebre proyecto de Ted Nelson Xanadu) que están localizados en diferentes servidores y en donde la información sindicada se usa para facilitar la recuperación de la info.
·  * Catálogos como Dmoz.org, es decir un directorio creado por los humanos de recursos accesibles en la web. El directorio esta disponible como un archivo de fuente abierta (en RDF) y esta integrado a muchos otros sistemas de catalogación en la web (como Google por ejemplo).
·  * El proyecto HEML (Historical Event Markup and Linking) Project. Se trata de un proyecto que busca crear una colección mundial de recursos XML vinculados con materiales históricos, donde cada grupo trata de crear los suyos propios y después busca distribuirlos en los espacios de los demás.
·  * Agregar datos científicos de primera mano tal como lo propusiera David Detlefsen.

El modelo de funcionamiento de todos los ejemplos anteriores es uno y el mismo. Una organización publica material original en algún formato, y otra organización lo baja y en el camino procesa la información para integrarla a sus bases de datos o a alguna herramienta propia.

¿Lo mejor es siempre enemigo de lo bueno? Un ejemplo práctivo


Todo lo anterior es muy bonito, ¿pero funciona efectivamente? ¿Cuáles son los costos de armar la infraestructura para que este tipo de contenidos funcione adecuadamente? ¿Y si la herramientas existen (como es el caso de la firma digital) porqué hay tanta resistencia cultural y cognitiva, lo que finalmente termina boicoteando el proyecto?

Aunque parecería que las ventajas de estos esquemas son infinitas, también hay muchas dudas acerca de su implementación. Sin embargo hay varios elementos a favor y estos deben ser cuidadosamente sopesados, especialmente cuando estamos pensando en implementaciones efectivas y sobretodo a nivel gubernamental educativo.

Las tecnologías de sindicación son una astuta síntesis o híbrido entre las tecnologías pull y push, además con el beneficio de la arquitectura PtoP. En efecto. imaginemos esta posibilidad. Que los Ministerios de Educación de todo el país se establezcan como rings (ya sea en la home del Portal o a través de un sistema de weblogs). Al mismo tiempo este ring mantiene una autononía absoluta y se busca que los visitantes sean jurisdiccionales en la medida de lo posible.

Esto quiere decir que si los portales provinciales muestran noticias nacionales estas quedarían alojadas en el portal de la provincia y el navegante del sitio no debería salir del mismo para actualizaciones, consultas especificas o lo que fuera.

Por otro lado podemos imaginar un sistema bidireccional y asimétrico en donde por ejemplo el portal nacional agregue las noticias acerca de capacitaciones regionales, noticias locales de trascendencia nacional, etc. En ese caso los visitantes del Portal nacional no deberían estar saltando de un portal provincial a otro para poder sistematizar esa info.

En ambos casos se trata de una enorme ganancia que combina la tecnología push (de empujar contenidos a los portales) pero también la pull porque agrega información dispersa y la presenta de modo consolidado en múltiples sitios.

Por otra parte el servicio de feeds de este tipo permita imaginar nuevos formatos institucionales inexistentes hoy como ser:

·  - Intercátedras a nivel nacional o internacional que compartan desde recursos auxiliares hasta el propio dictado de módulos compartidos
·  - Circulación automatizada de producción de nuevos resultados de investigaciones o estudios que no circulan a través de listas, sino en forma directa una vez generados los productos y publicados en espacios ad hoc compartidos
·  - Generación de newsletters, boletines y eventualmente diarios de todo tipo (desde intereses generales a hiperespecializados) agregando en forma automática posts originales o contenidos generados en los lugares mas insólitos o distantes ecológica e informacionalmente del núcleo duro, pero con gran capacidad de irradiación o de derrame de nuevas preguntas o perpectivas insólitas.
·  - Generación de meta-weblogs en donde compartir experiencias de distinto tipo que aceleren el proceso de acumulación, mejoren la decantación y multipliquen los contactos y la colaboración mutua.

Pero basta ya de ideas y pasemos a las implementaciones. Esperemos que la próxima nota sobre estos temas muestre ejemplos concretos, bien concretos y muy cercanos a los intereses de este weblog. En eso andamos

Para los interesados en el tema van a continuacion algunos links privilegiados

Baggaley, Jon "Blogging as a Course Management Tool." The Technology Source, July/August 2003. .
Godwin-Jones, B. (2003, May). Blogs and wikis: Environments for on-line collaboration. Language Learning & Technology, 7(2), 12-16.
Harrsch, M. (2003, July/August). RSS: The next killer app for education. The Technology Source.
 
educ.ar
Ministerio de Educación, Ciencia y Tecnología