¿Qué es el programa estadístico R y cómo se utiliza?

que es r y como se utiliza en estadistica

R es una alternativa a los paquetes estadísticos tradicionales como SPSS, SAS y Stata, ya que es un lenguaje y un entorno informático extensible y de código abierto para las plataformas Windows, Macintosh, UNIX y Linux.

El programa estadístico R es gratuito permite al usuario distribuir, estudiar, cambiar y mejorar libremente el software bajo la Licencia Pública General GNU de la Fundación de Software Libre. Se trata de una implementación libre del lenguaje de programación S, que fue creado y distribuido originalmente por los Laboratorios Bell. Sin embargo, la mayor parte del código escrito en S se ejecutará con éxito en el entorno de R.

Índice
  1. ¿Para qué sirve el software estadístico R?
  2. ¿Por qué usar el paquete estadístico R?
  3. ¿Puedo utilizar R sin tener que aprender el lenguaje de programación R?
  4. ¿Dónde puedo descargar gratis R?
  5. Tutorial básico sobre R
    1. Puesta en marcha
    2. Introducción de comandos
    3. El espacio de trabajo
    4. Interfaces gráficas de usuario
    5. Operadores en R
    6. Tipos de datos
    7. Crear nuevas variables
    8. Funciones
    9. Importación de datos
    10. Estadísticas descriptivas
    11. Trazado en R
    12. Paquetes
    13. Obteniendo ayuda
  6. ¿Dónde puedo encontrar más información sobre R?

¿Para qué sirve el software estadístico R?

R realiza una amplia variedad de técnicas estadísticas y gráficas, desde las más básicas hasta las más avanzadas, con un coste mínimo o nulo para el usuario. Estas ventajas sobre otro software estadístico fomentan el creciente uso de R en la investigación de vanguardia en ciencias sociales.

¿Por qué usar el paquete estadístico R?

Si actualmente utiliza otro paquete estadístico, ¿por qué aprender R? Aquí van unas cuantas razones:

  • ¡Es gratis! Si usted es un profesor o un estudiante, los beneficios son obvios.
  • Se ejecuta en una variedad de plataformas, incluyendo Windows, Unix y MacOS.
  • Proporciona una plataforma inigualable para programar nuevos métodos estadísticos de forma fácil y sencilla.
  • Contiene rutinas estadísticas avanzadas que no están disponibles en otros paquetes.
  • Dispone de capacidades gráficas de última generación.

¿Puedo utilizar R sin tener que aprender el lenguaje de programación R?

Sí (al menos para lo básico), hay una serie de "front ends" que se han construido para facilitar a los usuarios la interacción con el entorno de cálculo estadístico R. Por ejemplo, una interfaz gráfica de usuario (o "GUI") permite al analista realizar tareas de análisis de datos seleccionando elementos de menús y listas, en lugar de introducir comandos.

Una de estas GUI es el R Commander, escrito por John Fox. El R Commander proporciona un sistema fácil de usar, basado en menús, para cargar datos en R, manipular valores de datos, realizar análisis estadísticos, crear visualizaciones gráficas y llevar a cabo pruebas de diagnóstico en modelos estadísticos.

La ventaja que proporciona el R Commander u otra GUI es que el usuario no necesita aprender un lenguaje para llevar a cabo su análisis. En su lugar, cada paso se realiza haciendo una o más selecciones de un menú de opciones disponibles. La desventaja de interactuar con el entorno R a través de una GUI es que el curso del análisis se limita a las acciones que se han programado en la GUI. Por lo tanto, se podría argumentar que el uso de una GUI elimina gran parte de la flexibilidad que es inherente al entorno R.

Para superar la limitación anterior, el R Commander y la mayoría de las otras GUIs permiten al usuario emplear ambos métodos de interacción con el entorno dentro de una misma sesión de R. Por ejemplo, uno podría invocar el R Commander, y utilizar su GUI para leer el contenido de un archivo externo y crear un marco de datos de R. 

¿Dónde puedo descargar gratis R?

Los archivos de instalación para Windows, Mac y Linux pueden encontrarse en el sitio web de la Comprehensive R Archive Network, http://cran.r-project.org/. El sitio también contiene documentación para descargar e instalar el software en diferentes sistemas operativos. La descarga y el uso de R son gratuitos. Estos son los enlaces directos a las descargas:

Tutorial básico sobre R

Como decíamos, R está disponible para Linux, MacOS y Windows. En todas las plataformas, el software funciona de un modo similar. Estos son algunos de los parámetros básicos:

Puesta en marcha

Después de descargar e instalar R, simplemente busque e inicie R desde su carpeta de Aplicaciones.

Introducción de comandos

R es un programa impulsado por línea de comandos. El usuario ingresa comandos en el indicador ( > por defecto) y cada comando se ejecuta uno a la vez.

rconsola

El espacio de trabajo

El espacio de trabajo es su entorno de trabajo actual de R e incluye cualquier objeto definido por el usuario (vectores, matrices, marcos de datos, listas, funciones). Al final de una sesión de R, el usuario puede guardar una imagen del espacio de trabajo actual que se recarga automáticamente la próxima vez que se inicia R.

Interfaces gráficas de usuario

Aparte de la consola R integrada, RStudio es el editor de código R más popular y se conecta con R para plataformas Windows, MacOS y Linux.

Operadores en R

Los operadores binarios y lógicos de R resultarán muy familiares para los programadores. Tenga en cuenta que los operadores binarios funcionan tanto en vectores y matrices como en escalares.

Los operadores aritméticos incluyen:

OperadorDescripción
+adición
-sustracción
*multiplicación
/división
^ o **exponenciación

Los operadores lógicos incluyen:

OperadorDescripción
>mas grande que
> =Mayor qué o igual a
==exactamente igual a
! =no igual a

Tipos de datos

R tiene una amplia variedad de tipos de datos, incluidos escalares, vectores (numéricos, de caracteres, lógicos), matrices, marcos de datos y listas.

Crear nuevas variables

Utilice el operador de asignación <- para crear nuevas variables.

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

Funciones

Casi todo en R se realiza mediante funciones. Una función es un fragmento de código escrito para realizar una tarea específica; puede aceptar argumentos o parámetros (o no) y puede devolver uno o más valores (¡o no!). En R, una función se define con la construcción:

function ( arglist ) {body}

El código entre las llaves es el cuerpo de la función. Tenga en cuenta que al usar funciones integradas, lo único de lo que debe preocuparse es cómo comunicar de manera efectiva los argumentos de entrada correctos (arglist) y administrar los valores de retorno (si corresponde).

Importación de datos

Importar datos a R es bastante simple. R ofrece opciones para importar muchos tipos de archivos, desde CSV hasta bases de datos.

Por ejemplo, así es como importar un CSV a R.

# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems

mydata <- read.table("c:/mydata.csv", header=TRUE,
sep=",", row.names="id")

Estadísticas descriptivas

R proporciona una amplia gama de funciones para obtener estadísticas resumidas. Una forma de obtener estadísticas descriptivas es usar la función sapply () con una estadística de resumen especificada.

A continuación se muestra cómo obtener la media con la función sapply () :

# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)

Las posibles funciones utilizadas en sapply incluyen media, sd, var, min, max, mediana, rango y cuantil .

Trazado en R

En R, los gráficos se crean normalmente de forma interactiva. Aquí hay un ejemplo:

# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")

La función plot () abre una ventana gráfica y traza el peso frente a las millas por galón. La siguiente línea de código agrega una línea de regresión a este gráfico. La última línea agrega un título.

r_plot

Paquetes

Los paquetes son colecciones de funciones, datos y código compilado de R en un formato bien definido. El directorio donde se almacenan los paquetes se llama biblioteca. R viene con un conjunto estándar de paquetes. Otros están disponibles para descargar e instalar. Una vez instalados, deben cargarse en la sesión para ser utilizados.

.libPaths() # get library location
library()   # see all packages installed
search()    # see packages currently loaded

Obteniendo ayuda

Una vez que R está instalado, hay un completo sistema de ayuda integrado. En el símbolo del sistema del programa, puede utilizar cualquiera de los siguientes:

help.start()   # general help
help(foo)      # help about function foo
?foo           # same thing
apropos("foo") # list all functions containing string foo
example(foo)   # show an example of function foo

¿Dónde puedo encontrar más información sobre R?

Los libros, tanto en formato físico como digital, siguen siendo una gran opción para aprenderlo todo sobre R. Aquí van unas cuantas opciones interesantes que podrás comprar en Amazon:

Si sabes inglés y prefieres un entorno interactivo en línea para aprender R, este tutorial gratuito de R de DataCamp es una buena manera de empezar. 

Subir