Steve Souders, otrora responsable del área de Rendimiento de Yahoo! y que ahora trabaja para Google, es el responsable del proyecto HTTP Archive, un proyecto muy interesante en el que se recopilan datos estadísticos sobre 17.000 páginas web entre las más destacadas del mundo.
Souders ha creado ese proyecto para que los desarrolladores de webs puedan conocer mejor el rendimiento de su página, y también obtengan datos sobre qué desempeño tienen las webs de la competencia.
En concreto, Souders ha comenzado a mostrar los datos recogidos a finales de marzo. En el caso de Flash, el experto afirma que ha descendido su uso, y según la información recogida del 15 de noviembre de 2010 hasta el 29 de marzo, ha sufrido una bajada del 2 por ciento, pasando del 49 al 47 por ciento.
En lo que respecta al tamaño medio de las imágenes de las webs que integran el archivo, se aprecia un aumento desde los 415KB hasta los 450KB, y lo mismo sucede con los scripts, que pasan de 113KB de media hasta los 123KB.
Si atendemos a los formatos de imágenes, vemos cómo a la cabeza sigue JPEG, que se mantiene inalterable con un 43 por ciento. En segundo lugar sigue el formato GIF, a pesar de pasar del 41 al 38 por ciento, mientras que el tercero más empleado es PNG, que sube del 16 al 18 por ciento.
El uso de la librería jQuery de herramientas JavaScript aumentó su uso en un 39 por ciento en páginas desde noviembre a 43 por ciento de páginas en marzo. La biblioteca de JavaScript de Google Analytics aumentó en el uso del 61 por ciento de las páginas web a 62 por ciento, mientras Quantcast descendió de un 15 por ciento a 14 por ciento. Facebook registró un aumento del 12 por ciento a 17 por ciento y Twitter a partir del 2 por ciento a 3 por ciento.
Para seleccionar la muestra de las 17.000 páginas analizadas para el archivo se ha optado por utilizar las listas de Alexa y Quantcast, así como del índice Fortune 500.
HTTP Archive es, sobre todo, una herramienta esencial para analizar cómo se construyen las páginas web más relevantes a lo largo del tiempo y cómo se implementan las diferentes tecnologías del mercado, a qué nivel y con qué cantidad e intensidad: su importancia radica, especialmente, en cómo, antes de empezar a desarrollar una plataforma de alto rendimiento para una web, ver cómo otros posibles competidores del mercado usan sus propias plataformas de forma técnica y cçomo el entramado tecnológico que las soporta contribuye a su éxito y de qué manera.
El código detrás de HTTP Archive, por cierto, es Open Source y está disponible en Google.