04 septiembre 2009

Google Domestic Trends: series temporales y sesgo muestral

GoogleDomesticTrendsMe ha resultado muy interesante echar un ojo a Google Domestic Trends, un subconjunto de Google Finance basado en la determinación de búsquedas representativas para la monitorización de tendencias de consumo general y en varios sectores, búsqueda de empleo, inversión y otros parámetros de la actividad económica en general, y que parece funcionar con una gran exactitud. La explicación de cómo funciona aparece contada por Hal Varian en el Google Research Blog y en esta entrada del blog de Google Finance.

El trabajo con series temporales permite la visualización de temas estructurales vinculados a la dinámica propia de muchas industrias. En el gráfico que ilustra, por ejemplo, que refleja las búsquedas de términos vinculados con los ordenadores y la tecnología (windows, download, mac, hp, microsoft, ipod) y los usa como proxy para la actividad del sector es posible identificar claramente los dos picos anuales derivados de los dos momentos de mayor consumo, la “vuelta al cole” y las navidades, así como el progresivo descenso en la demanda derivado del impacto de la crisis o la ausencia total de un “efecto Windows Vista” comenzando en Febrero de 2007 que sí se había visto con la salida al mercado de ediciones anteriores del sistema operativo y sobre cuya posible magnitud se especula ahora en el caso de Windows 7. También son interesantes, dramáticos y reveladores, por ejemplo, los datos sobre búsquedas relacionadas con el desempleo, la persistente caída del turismo a pesar de que un porcentaje enorme de las reservas se producen hoy en día a través de la red, la caída del sector inmobiliario o la de la industria del lujo, y muchas más.

Me llama la atención hasta qué punto puede considerarse escaso el efecto del sesgo muestral: hace algunos años, el valor explicativo de una serie temporal basada en las búsquedas de Google o en cualquier otra variable relacionada con los usuarios de Internet se habría considerado escaso. Los usuarios de Internet no eran necesariamente representativos del comportamiento de la sociedad en su conjunto, y la eliminación de ese sesgo muestral exigía trabajar con la estimación de variables demográficas de la muestra que no resultaba sencillo obtener. Ahora, la generalización del uso de Internet en muchos mercados permite ajustes verdaderamente sorprendentes entre lo que el uso de un buscador indica y el resultado de, por ejemplo, datos de consumo o del censo, demostrando hasta qué punto nos estamos convirtiendo cada día más en una sociedad que vive y desarrolla una parte cada vez mayor de su actividad en la red.

(Enlace a la entrada original - Licencia)

0 comentarios:

Publicar un comentario

ATENCIÓN: Google ha metido en Blogger un sistema antispam automático que clasifica como spam casi lo que le da la gana y que no se puede desactivar.

Si después de hacer tu comentario este no aparece, no se trata del espíritu de Dans que anda censurando también aquí, es que se ha quedado en la cola de aceptación. Sacaré tu mensaje de ahí tan pronto como pueda, si bien el supersistema este tampoco me avisa de estas cosas, por lo que tengo que estar entrando cada cierto tiempo a ver si hay alguno esperando. Un inventazo, vaya.