Lenguaje de Programación R

Herramienta utilizada

R proporciona un amplio abanico de herramientas estadísticas (modelos lineales y no lineales, tests estadísticos, análisis de series temporales, algoritmos declasificación y agrupamiento, etc.) y gráficas.

Lenguaje de Programación R


OBJETIVO

La disponibilidad de una mayor cantidad de datos requiere el desarrollo de técnicas analíticas que integren adecuadamente las capacidades de almacenamiento, de memoria de trabajo y de velocidad de ejecución. El entorno de programación R ofrece soluciones óptimas para abordar estas tareas. El obejtivo de este curso es presentar los fundamentos de programación estadística en R, los conceptos de paralelización, y desarrollar en un entorno de big data técnicas clásicas de estadística descriptiva, gráficos y modelos lineales. El objetivo final es que el alumno use las técnicas de paralelización más adecuadas a sus necesidades.

¿A QUIEN VA DIRIGIDO?

El curso está dirigido a tres tipos de personas: los interesados en aprender a utilizar R, aquellos que, aunque conocen los rudimentos de R, quieren profundizar en su conocimiento de la estadística y quienes aun teniendo una formación estadística sólida, quieran familiarizarse con este novedoso enfoque (basado en remuestreos y simulación) a los conceptos básicos de la estadística.

PLAN DE ESTUDIO 

Módulo 1

Introducción a R.

  • Qué son R y S.
  • Obtención e instalación de R y paquetes adicionales.
  • Uso de Rgui en Windows.
  • Uso de R con ESS y XEmacs.
  • Ejemplo de uso: análisis de los datos de Golub usando tests de la t y multiple testing.

Módulo 2

Manejo de datos en R

  • Tipos de objetos en R (matrices, vectores, listas, data frames, etc).
  • Lectura y exportación de datos.
  • Subsetting y acceso a elementos.
  • Generación de sequencias regulares y aleatorias.
  • Ordenación.
  • La familia apply: apply, lapply, sapply, y tapply.

Módulo 3

Gráficas en R

  • Uso de plot
  • Combinación de gráficos y adición de elementos.
  • Salvando e imprimiendo gráficos.
  • Introducción a lattice y grid.

Módulo 4

Introducción a la programación en R.

  • Operaciones vectorizadas.
  • Bucles y control de ejecución.
  • Definición de funciones.
  • Scoping rules.
  • Debugging y profiling.
  • Introducción a las S3 classes.

Módulo 5

Brevísima introducción a modelos estadísticos en R

  • Modelos lineales: regresión y ANOVA.
  • Tests de la t y equivalentes no paramétricos, tests de correlación (Pearson, Spearman).
  • Análisis de componentes principales (PCA).
  • Algunos métodos de clasificación:
    1. análisis discriminante (lda).
    2. support vector machines (svm).
    3. k-nearest neighbor (knn).
  • Clustering:
    1. clustering jerárquico.
    2. k-medias.