Contenido

1. Introducción

[1]

Este curso está diseñado para desarrollarse en Rstudio, por ello es importante que cuente con R (https://www.r-project.org/) y RStudio (https://www.rstudio.com/) instalados para esta sesión. RStudio es la manera más eficiente de interaccionar con R. Revisaremos los conceptos básicos relacionados con el funcionamiento de este programa de cómputo estadístico, así mismo, las partes que componen la interfaz gráfica y el espacio de trabajo de R. Y, sin más preámbulo, iniciaremos la revisión de los modos (estructuras) en que R puede almacenar y manejar datos en su espacio de trabajo, así como las propiedades (pros y contras) de cada estructura. Será una sesión intensa y cargada de ejercicios cortos, planeada así para fomentar la interacción con R. Cerraremos revisando de qué manera podemos acomodar, agrupar o filtrar datos específicos o de interés, consultando diferentes bases de datos.

1.1 ¿Cómo funciona R?

1.1.1. Consola (línea de comandos)

Esta parte de la interfaz gráfica es como una gran calculadora que nos permite interactuar con el programa a través de operaciones y comandos que en el lenguaje de R se conocen como funciones.

Las variables funcionan como en aritmética básica, en donde se usan caracteres alfabéticos para representar valores numéricos.

1.1.2. Espacio de trabajo

En esta parte de la interfaz gráfica es en donde están almacenadas y podemos visualizar todas las variables disponibles y sus características principales.

1.1.3. Objetos y funciones

Es posible asignar a un objeto en el espacio de trabajo el contenido de una variable, mediante el empleo de <-, un operador flecha. Cuando realizamos una asignación, R no imprime el contenido, solamente reasigna este valor. Cuando colocamos el nombre de un objeto en la línea de comando y lo ejecutamos, R imprime su contenido.

Las funciones son piezas de código prefabricadas que nos ayudan a llevar a cabo de forma sencilla un proceso complejo. Para "llamarlas" debemos especificar su nombre, así como los objetos sobre los que queremos que operen. Podemos modificar la forma en que opera una función mediante la especificación de sus parámetros o argumentos.

Para una comprensión más clara, se muestra la siguiente presentación:


Ahora, revise los videos que se muestran a continuación:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 1 RStudio porpartes small [Video]. YouTube.

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 2 ConceptosBásicos small [Video]. YouTube.

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 3 Tipos Datos [Video]. YouTube.

1.1.4. Ayuda

R tiene una extensa biblioteca de ayuda para sus funciones. Aquí revisaremos las múltiples formas de acceder a la ayuda.

Para ello, acceda a las siguientes presentaciones:


1.2 Tipos de datos y formatos de bases de datos

1.2.1. Vectores

El vector es la estructura de datos más sencilla de R. Trata de una sola línea horizontal de valores (números o caracteres). Se construye asignando a un objeto dichos valores con la función c(). Se pueden referenciar los elementos dentro de un vector usando corchetes [], y dentro de éstos el número del elemento a referenciar.

Revise la siguiente presentación correspondiente al tema de Vectores:


Ahora, se propone que visualice el siguiente video:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 4 Vectores full [Video]. YouTube.

1.2.2. Factores

El factor es un vector que contiene un elemento agrupador sobre los datos. Automáticamente identifica los elementos distintos y agrega "niveles".

Acceda a la siguiente presentación:


Para reforzar el tema antes visto, se presenta el siguiente video:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 5 Factores small [Video]. YouTube.

1.2.3. Matrices

La matriz es una estructura bidimensional que puede contener valores numéricos o caracteres, pero no ambos. Se puede referenciar usando corchetes [] y especificando la fila y columna de un elemento, por ejemplo: [i,j].

Revise la siguiente presentación acerca del tema de matrices:


A continuación, visualice el siguiente video:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 6 Matrices ed [Video]. YouTube.

1.2.4 Marcos de datos

El marco de datos es la estructura de datos que más usaremos. Es bidimensional y puede contener valores numéricos y caracteres, a modo de una hoja de Excel. Para referenciar podemos usar corchetes [i,j] con el número o nombre de la columna (variable). También podemos usar el operador compacto ($) para referenciar el nombre de la columna desde el objeto, por ejemplo, datos$variablex.

Para reforzar este tema, revise la siguiente presentación:


A continuación, se sugiere que visualice el siguiente video:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 7 MarcoDeDatos small [Video]. YouTube.

1.2.5. Listas

La lista es una estructura de datos que puede contener cualquier otra estructura. Podemos referenciar los elementos que contiene como parte de una lista usando corchetes [i] o el elemento en su forma nativa con corchete doble [[i]].

Acceda a la siguiente presentación:


Ahora, visualice el siguiente video:

Fuente: Estadística y Manejo de Datos con R UV. (2021, 16 agosto). Clase 1 7 MarcoDeDatos small [Video]. YouTube.

Actividad 1. Conceptos básicos

Descripción:

Éste es un ejercicio simple que tiene como objetivo crear un directorio (folder) de trabajo para concentrar ahí los materiales del curso, así como hacer de dicho espacio en el disco duro su directorio de trabajo en R. El resultado final, un script (*.R), será el medio a través del que reportará todas sus actividades. Dicho archivo de texto contendrá los comandos en código y los comentarios que asocie a cada caso. Los script son la materia prima para hacer funcionar R, por lo que la correcta ejecución y comprensión de este primer ejercicio es vital para sus futuras interacciones con el programa, con otros usuarios y las entregas de actividades.

Revise la siguiente diapositiva del Ejercicio: : Abrir

Indicaciones:

  1. Crear un directorio de trabajo (folder) para el curso.
  2. Hacer de dicho folder el directorio de trabajo en R.
  3. Entregar un script (*.R) funcional que dé cuenta de lo anterior.
  4. Recuerde agregar, como comentarios en su script, sus dudas o los mensajes de advertencia y/o error que R le haya reportado, así como los comandos que los originaron.

Criterios de desempeño:

  1. Dominio de la asignación del directorio de trabajo desde R.
  2. Apertura y guardado de un archivo con extensión *.R que contenga tanto comentarios como comandos ejecutables.

Lineamientos de entrega:

  1. Divida su script en secciones, usando hashtag # al inicio de las líneas que comente. Para conocer ejemplos de scripts revise la Clase 3.0 Scripts, funciones y control de flujo.pdf. Por ejemplo, si va a iniciar la sección en que asigna su directorio de trabajo, puede indicarlo con la línea: # Ajustar directorio de trabajo setwd(“/Usuario/CursoEMDR”) y en las líneas subsecuentes agregar los comandos que correspondan a la solución del ejercicio en turno.
  2. Titule el archivo (*.R) de la siguiente forma: Actividad1._ApellidoPaternoPrimerNombre.R  Ejemplo: Actividad1._CoyotlPedro.R
  3. Envíe su archivo (*.R), a través del apartado Actividades de la plataforma Eminus, a más tardar en la fecha establecida en el Calendario de entregas.

Actividad 2. Tipos de datos en R.

Descripción:

Esta serie de ejercicios tiene como objetivo familiarizarlo con las distintas estructuras (modos) en que R almacena datos, yendo desde el más simple (vector) hasta el más complejo (lista). Reconocerá tanto las diferencias estructurales como los contextos en que una u otra le serán de utilidad, así como las dificultades que aparecen cuando intenta hacer operaciones para los que determinada estructura no está habilitada. También revisaremos cómo convertir distintos conjuntos de datos de una a otra estructura, cuando esto aplique o sea necesario.

Indicaciones:

Explorar, identificar y manipular las distintas estructuras de datos que maneja R.

Ejercicios:

1.2.1 Vectores. Abrir

1.2.2 Factores. Abrir

1.2.3 Matrices. Abrir

1.2.4 Marcos de datos. Abrir

1.2.5 Listas. Abrir

Criterios de desempeño:

  1. Habilidad para identificar el modo (estructura) de los objetos (datos) manejados con R, así como para transformar de un tipo de estructura a otro.
  2. Reconocer y resolver errores en la codificación de la estructura de datos en turno.

Lineamientos de entrega:

  1. Divida su script en secciones, usando hashtag # al inicio de las líneas que comente. Para conocer ejemplos de scripts revise la Clase 3.0 Scripts, funciones y control de flujo.pdf. Por ejemplo, si va a iniciar la sección de vectores, puede indicarlo con la línea # Vectores vector(x) y en las líneas subsecuentes agregue los comandos que correspondan a la solución del ejercicio en turno.
  2. Titule su archivo (*.R) de la siguiente forma: Actividad2_ApellidoPaternoPrimerNombre.R.  Ejemplo: Actividad2_CoyotlPedro.R
  3. Envíe su archivo (*.R), a través del apartado de Actividades de la plataforma Eminus, a más tardar en la fecha establecida en el Calendario de entregas.

Foro 1. Introducción.

Descripción:

  1. Este foro estará abierto para acompañarse en el proceso de elaborar los ejercicios que competen a este tema, para compartir dudas o estrategias de cómo resolverlos, así como para participar exponiendo su experiencia y los mensajes que se señalaron al usar el software.
  2. El foro estará abierto sólo hasta la fecha límite indicada.
  3. Recuerde atender a las Reglas para participar en foros de discusión.

Criterios de desempeño:

  1. Compartir y discutir soluciones de las actividades.
  2. Valorar la pertinencia de modificar nuestra estrategia al usar el software.
  3. Sugerir ideas que den pauta a una práctica más funcional del software.

Lineamientos de entrega:

  1. Publique su participación en el Foro del Tema I. Introducción.
  2. Su participación en el foro será en la fecha establecida en el Calendario de entregas. Los foros no concederán prórroga.

Fuentes de Información

González, A. & González, S. (2000). Introducción a R. R Development Core Team. http://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.zip

Paradis, E. (2002). R para principiantes. Traducción por Ahumada, J. A. http://cran.r-project.org/doc/contrib/rdebuts_es.pdf

RStudio. (s. f.). RStudio | Open source & professional software for data science teams. Recuperado 14 de julio de 2021, de https://www.rstudio.com/

The R Foundation. (s. f.). R: The R Project for Statistical Computing. R-Project.Org. Recuperado 14 de julio de 2021, de https://www.r-project.org/

1 Hadley Wickham and others at RStudio (2016). R logo.svg. [Imagen]. Wikimedia Commons. https://commons.wikimedia.org/wiki/File:R_logo.svg