useR

I Concurso de Análisis de Datos con R



Patrocinado por Nestoria
useR

Nestoria es una plataforma web de búsqueda especializada en precios de vivienda utilizada por más de 2,5 millones de usuarios mensuales de Internet. Su base de datos consta de una amplia oferta de venta y alquiler de viviendas de ocho países y se actualiza diariamente. Los resultados de la búsqueda se presentan por ciudades, tipo de vivienda, etc., como en este ejemplo.
Objetivo: aportar valor a la base de datos de Nestoria con RNestoria y Lokku Labs desean patrocinar este I Concurso de Análisis de Datos con R como una actividad complementaria a las III Jornadas de Usuarios de R, a celebrar en Madrid el 17 y 18 de noviembre de 2011. Nestoria y Lokku Labs buscan mejorar la comprensión y la información que se puede obtener de sus bases de datos y pretenden contactar con brillantes estadísticos que aporten un valor añadido a los datos disponibles sobre precios de viviendas. Los organizadores, por su parte, desean mostrar las aplicaciones del R en el ámbito empresarial y demostrar el beneficio que pueden obtener las empresas analizando sus bases de datos con R.
1.500€ en premios... y más

El ganador obtendrá un cheque por importe de 1.000 euros y el segundo otro por 500 euros, además del certificado correspondiente en ambos casos. El concurso se podrá declarar desierto si el jurado considera una escasa calidad o interés en los trabajos presentados.

Asimismo, uno o más de los participantes podrán ser invitados a una entrevista de trabajo en Londres, Reino Unido, para una colaboración inicial de tres meses en la sede central de Nestoria. Todos los participantes recibirán un certificado de su participación en el concurso con el título de su trabajo.

Del 18 de julio al 15 de octubreSe abre el plazo el 18 de julio y finaliza el 15 de octubre de 2011. Todo el material, código, metodología, etc. se enviará a través del portal de las III Jornadas de Usuarios de R.
Abierto a todos los usuarios de R
  • El concurso está abierto a cualquier persona, grupo o institución que utilice R en sus análisis estadísticos.
  • Los trabajos pueden ser individuales o colectivos.
  • No hay límite de trabajos a presentar.
  • Sólo se admitirán trabajos en el que la mayor parte creativa o de diseño del mismo se haya realizado con R.
  • Si el trabajo ya se ha publicado, se deberá solicitar el apropiado permiso escrito al editor de la revista o edición para participar en este concurso, para publicar la imagen en la página web o en otra actividad no comercial relacionada con este concurso, citándose siempre al trabajo original. Este permiso se deberá remitir junto con el trabajo.
  • Los trabajos presentados deberán ser reproducibles, adjuntando el código de R utilizado así como cualquier material necesario para su creación y reproducción. Se incluirá una breve reseña metodológica y una explicación del interés del trabajo tanto para la comunidad científica como para el público en general.
Participación e información adicionalPara participar en la competición y enviar soluciones u otro de preguntas, se puede contactar con los organizadores a través de la dirección de correo electrónico concurso@usar.org.es. Se recomienda a los participantes a inscribirse a efectos estadísticos en el siguiente formulario.
Descarga de los datosLos datos pueden descargarse de este enlace. El fichero README.txt proporciona información adicional sobre los detalles de bajo nivel de los datos.
Descripción de los datos

Los precios de vivienda se han convertido en un elemento fundamental en la evolución de la economía y han tenido mucho que ver en las recientes crisis financieras. Nestoria analiza los precios de viviendas de Australia, Brasil, Francia, Alemania, India, Italia, España y Reino Unido. Los patrocinadores esperan que desde el ámbito de la estadística se propongan soluciones que ayuden al público en general a comprender el fenómeno y la tendencia de los precios de viviendas a través del espacio y del tiempo.

Actualmente, Nestoria calcula para cada localidad la media geométrica; elimina los precios que se desvían más de dos veces la desviación mediana respecto a la media geométrica; y reestima esta última sin las observaciones extremas. Los resultados se presentan gráficamente en internet, como en este ejemplo.

Estos cálculos se efectúan con Perl. Los patrocinadores creen que los análisis y representaciones gráficas destinados a visitantes ocasionales de su página web se pueden mejorar considerablemente con la aportación desde el rigor y la creatividad de la estadística.

Por ello, los patrocinadores desean presentar los datos de los precios de viviendas a los visitantes ocasionales de su página web de una forma original, innovadora y fácilmente comprensible para un usuario no especialista en estadística, aportándole información y conocimiento sobre la evolución espacio-temporal de los precios de viviendas.

Con el fin de facilitar la creatividad y el rigor a los concursantes, el Comité Organizador y Nestoria facilitan:

  • los precios de oferta de venta y alquiler de viviendas en ocho países durante un periodo de nueve meses (el dato más reciente es de hace tres meses)
  • código en R para descargar de Nestoria API microdatos de precios de vivienda
  • bases de datos de viviendas

Si se estima oportuno, se pueden complementar estos datos con información adicional de terceros, facilitada por organismos gubernamentales u organizaciones no gubernamentales, como por ejemplo, renta disponible, transacciones comerciales, etc.

Difusión públicaMediante la participación en este concurso, se acepta y cede a los organizadores y patrocinadores permiso para usar, copiar, modificar, distribuir y difundir públicamente los trabajos presentados como por ejemplo, medios de comunicación, sin recibir contraprestación económica. Además, se acepta participar en actividades promocionales y divulgativas relacionadas con este concurso.
Jurado
  • Rubén Martínez Sánchez (Nestoria), presidente
  • Miguel Ángel Rodríguez Muíños (Servizo Galego de Saúde)
  • Virgilio Gómez Rubio (Universidad de Castilla-La Mancha)
  • Juan José Gibaja Martíns (Universidad de Deusto)
  • Emilio Torres Manzanera (Universidad de Oviedo), secretario
Selección de finalistas Los trabajos presentados serán juzgados en base a los siguientes criterios:
  1. rigor científico
  2. creatividad e innovación
  3. simplicidad y comprensibilidad para visitantes ocasionales
  4. adaptación del código R a grandes bases de datos y páginas web activas con millones de visitantes mensuales
  5. adecuación del trabajo a las presentes bases

Los autores cuyos trabajos se ajusten a los criterios mencionados serán convocados a presentar y defender públicamente su trabajo durante la celebración de las III Jornadas de Usuarios de R, 17 y 18 de Noviembre en Madrid. Esta asistencia y presentación es obligatoria para poder obtener el premio.

Consentimiento
  • La participación en este concurso implica la aceptación de las presentas reglas.
  • Su incumplimiento conlleva la expulsión del presente concurso.
  • La decisión del Jurado será inapelable.
  • Los participantes expresamente renuncian a recurrir a otras instancias en contra de la decisión del jurado y de los patrocinadores.
  • Dado que hay dos versiones de estas bases (en inglés y en español), si hubiera dudas en cuanto a interpretación, predomina la versión inglesa.
Propiedad intelectualInscribirse en el concurso y/o enviar un trabajo conlleva que el trabajo es original y que será publicado bajo licencia GNU General Public Licence en las páginas de Nestoria, Lokku Labs y las III Jornadas de Usuarios de R.


© Copyright 2011. All rights reserved. Nestoria is the trademark of Lokku Ltd, a company registered in England. Lokku Labs is a web site featuring a few projects about online property search.