Sobre las cookies

En HTTP cookies, or how not to design protocols un repaso histórico de la evolución de las especificaciones relativas a las cookies, ese mecanismo que utilizan los navegadores para que sea posible desarrollar aplicaciones web al añadir al protocolo HTTP la posibilidad de gestionar el estado, y por lo tanto relacionar entre sí varias peticiones consecutivas de páginas web.

Se centra en los problemas que las diferentes versiones de la especificación han podido causar.

¿Qué empresas contribuyen más al software libre?

Internet nos ofrece un mundo de datos por explorar. Teniendo en cuenta que son aproximaciones (porque los datos no son completos, o tienen sus propias dinámicas, …) podemos aprender algunas cosas. En este caso en Evaluating Open Source Participation by Email Traffic nos hablan de una recopilación de listas de correo de proyectos de software libre y un análisis sencillo, basado en el origen de los mensajes (buscando los dominios de los mails corporativos de algunas empresas) que nos da algunas ideas de quién y cuánto ha contribuido (a través de la participación de sus empleados en las listas de correo).

Además de los datos sobre algunas empresas conocidas, podemos ver que gmail es el servicio favorito de los desarrolladores de software libre (gana por goleada a hotmail y Yahoo!) y también podemos hacer nuestras propias indagaciones: por ejemplo participación de gente del dominio unizar.es.

Esta entrada claramente era dudosa entre esta bitácora y la otra pero como el otro día puse allí la entrada Sensores como nosotros y aquí se habla un poco de software libre, he preferido ponerla aquí.

¿Deberían los proveedores de acceso desconectar a los usuarios infectados?

Este es un tema que reaparece de vez en cuando (la última vez que lo tratamos aquí fue en ¿Tienes malware? ¡Te desconectamos!, pero anteriormente había más como atestigua el primer enlace). En esta ocasión lo vemos en Should ISPs Cut Off Bot-infected Users?, que apunta a Should ISPs cut off bot-infected users? donde se vuelve al viejo tema.

Al final, parec que la historia se repite en todos sus detalles: hay quien está dispuesto a avisar, pero no a cortar: Comcast Pushes Bot Alert Program Nationwide.

¿Y qué sucedería si eso se aplicara en España? Si hacemos caso a los titulares de hoy mismo habría que desconectar a un montón de internautas: España es el tercer país del mundo con más ordenadores zombis.

Programación colaborativa en JavaScript

Tengo la intuición de que se podrían conseguir cosas con la programación colaborativa: en el extremo, ¿podríamos tener una aplicación web en un wiki y que ‘cualquiera’ pudiera editarla y seguir ejecutándose? Supongo que con los mecanismos de control adecuado (poder volver atrás, no poder borrar datos o ‘robarlos’ …) se podría intentar algo.

En ese sentido y más allá de la programación por parejas que ‘santificó’ la programación extrema y las metodologías ágiles, descubría el otro día en Plataforma para programar javascript de forma colaborativa la existencia de JS Bin – Collaborative JavaScript Debugging que es lo primero que conozco (desde mi ignorancia, claro) sobre desarrollo colaborativo.

Suena interesante.

¿En qué idioma habla tu web?

Un artículo curioso en Language Detection: A Witch’s Brew? donde nos dan pistas de cómo comportarnos (nuestra aplicación, claro) cuando alguien se conecta y tenemos un sistema en varios idiomas:

* Use Accept-Language – it just works
* Use IP detection as a fallback for language, or a separate test to determine jurisdiction
* Cookie your visitors’ language preferences, so you are consistent
* Provide a simple way to switch language, everywhere
* Treat language and compliance issues as two entirely separate problems

A mi me parece especialmente relevante la cuarta, porque siempre es mejor un buen original en inglés que una mala traducción y algunos sitios se empeñan en mostrarte tu idioma (aunque no lo hablen muy bien o no ofrezcan todas las características) y/o en preguntarte cada vez que entras por el idioma (caducan las cookies, cambian el mecanismo …).

Los parámetros y el HTTPS: GET, POST y más

En HTTPS Data Exposure – GET vs POST un resumen rápido de la exposición de los datos que se transmiten mediante el protocolo cifrado https considerando GET, POST, si la conexión va cifrada o no y los diversos participantes en la transmisión y recepción.

Nombres de ficheros y tráfico de datos

Curioso artículo en Thinking outside the box – Filenames and Web Optimization: esencialmente dice que las url’s también forman parte del tráfico web y que las que se utilizan ahora proporcionan mucha información pero también consumen recursos de manera innecesaria.

Es interesante y también es indudable que esos ahorros se pueden producir pero a mi en las cuentas me falta lo que eso representa frente al tráfico ‘relevante’ (el contenido de la página, vaya). Entiendo que siempre que sea posible y razonable deberíamos ahorrar pero complicarse mucho la vida para ahorrarse un 0.1% del tráfico seguramente no vaya a ninguna parte y convenga más concentrarse en otros ahorros. La regla (para mi, claro) sería: ahorrar primero donde más se pueda ganar, creo.

Bitácoras interesantes de programación (I)

Me pilla con el paso cambiado (por eso pongo el I, porque espero poner las mías próximamente) la entrada de leonidas en BarraPunto, ¿Qué bitácoras de programación lees?.

En los comentarios hay un buen montón de recomendaciones que vale la pena explorar (al menos conozco algunas de esas que yo también recomendaría).

Recogiendo información en la red

La presentación de Christian Martorella, A fresh new look into Information Gathering (pdf) donde da pistas e ideas sobre toda la información que se puede conseguir de alguien en la red me da pié a presentar otro trabajo que iba un poco más allá y que me resultó bastante interesante. Más allá de la inferencia en bases de datos, Jessica Staddon, Philippe Golle y Bryce Zimny hablaban de Web-Based Inference Detection (pdf): si nos llega un documento ofuscado, donde algunos datos ‘sensibles’ han sido ocultados o suprimidos, es posible echar mano del amigo Google (o cualquier otro y alguno de sus complementos) para rellenar esos huecos con información libremente disponible en la red.

Aunque seamos anónimos y no haya documentos con partes ofuscadas, lo cierto es que, como contaba el otro día en El futuro ya está (casi) aquí ya hay servicios que son capaces de reunir, a partir del nombre de alguien, un ‘perfil’ internetero bastante completo.

La privacidad y los navegadores

En Cleaning Up After Cookies (pdf) un resúmen de Katherine McKinley sobre la privacidad y los navegadores: parece que no todos cumplen lo que prometen y, lo que es peor, ninguno es muy hábil con la privacidad controlada por los ‘elementos añadidos’ al navegador, como puede ser el Flash, Google Gears y otros.