Frecuencias de letras y sus consecuencias

Cuando hacemos un programita para nuestro uso, casi cualquier cosa da igual. Pero si ese programa ha de dar servicio a mucha gente, algunas decisiones pueden ser problemáticas. De eso habla Letter Frequency in Account Names a cuenta de organizar un árbol de directorios y de cómo se repartirían los datos según se organicen sus nombres (según los nombres de los usuarios).

It seems to me that the benefits of splitting accounts by the first characters is not nearly as great as you might expect. Having directories for each combination of the first two letters is practical I’ve seen directory names such as J/O/JOHN or JO/JOHN (or use J/O/HN or JO/HN if you want to save directory space). But it becomes inconvenient to have J/O/H/N and the form JOH/N will have as many as 17,576 subdirectories for the first three letters which may be bad for performance.

Aunque es cierto que es bastante difícil que uno termine teniendo un problema de ese tamaño en su vida real, lo cierto es que nunca se sabe y, además, vale la pena pensar estas cosas un poco para no llevarnos sustos ni disgustos después.
O al menos, ser conscientes de las posibilidades.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s