Cómo realizar el seguimiento correlaciones de datos en R
Estadísticos encanta cuando se puede vincular una variable de datos a otro. R puede ayudar a encontrar esta relación. La luz del sol, por ejemplo, va en detrimento de las faldas: Cuanto más tiempo el sol brilla, las faldas más cortas convertirse. Por lo tanto, el número de horas de sol se correlaciona con la longitud de la falda.
Obviamente, no hay realmente una relación causal directa aquí - usted no encontrará faldas cortas durante el verano en las regiones polares. Pero, en muchos casos, la búsqueda de relaciones causales comienza con el examen de correlaciones.
Para ilustrar esto, echar un vistazo a la famosa base de datos del iris en R. Uno de los más grandes estadistas de todos los tiempos, Sir Ronald Fisher, utiliza este conjunto de datos para ilustrar cómo las medidas múltiple puede ser utilizado para discriminar entre diferentes especies. Este conjunto de datos contiene cinco variables, como se puede ver mediante el uso de los nombres () función:
> Nombres (iris)
[1] "Sepal.Length" "Sepal.Width" "Petal.Length"
[4] "Petal.Width", "Especies"
Contiene mediciones de las características florales para tres especies de iris y de 50 flores para cada especie. Dos variables describen los sépalos (Sepal.Length y Sepal.Width), otras dos variables describen los pétalos (Petal.Length y Petal.Width), y la última variable (Especies) es un factor que indica de qué especies viene la flor.
Aunque las apariencias engañan, desea calcular visualmente sus datos antes de excavar más profundamente en ella. Para trazar una cuadrícula de diagramas de dispersión para todas las combinaciones de dos variables en el conjunto de datos, puede simplemente usar la función plot () en su marco de datos, así:
> Plot (iris [-5])
Debido a que los diagramas de dispersión son útiles solamente para las variables continuas, se puede caer todas las variables que no son continuas. Demasiadas variables en la matriz de trama hace que las parcelas difíciles de ver. En el código anterior, se le cae la Especie variables, porque eso es un factor.
Puede ver el resultado de esta simple línea de código. Los nombres de las variables aparecen en las plazas en la diagonal, lo que indica que las variables se representan a lo largo del eje x y el eje y. Por ejemplo, la segunda parcela en la tercera fila tiene Sepal.Width en el eje x y Petal.Length en el eje y.
Artículos relacionados
- Cómo realizar el seguimiento Las acciones con listas Quicken Ver
- Cómo realizar el seguimiento Investment News Online
- Cómo realizar el seguimiento Twitter hashtags
- Cómo realizar el seguimiento activo líquido y salidas en Quicken 2012
- Cómo realizar el seguimiento Artículos y vendedores en eBay
- Cómo realizar el seguimiento transacciones en efectivo en Quicken 2013
- Cómo utilizar Google Analytics para realizar el seguimiento de su negocio Etsy
- Cómo realizar el seguimiento Cotizaciones en tu iPhone
- Cómo realizar el seguimiento y analizar los gastos del proyecto