Este curso está diseñado para desarrollarse en Rstudio, por ello es importante que cuente con R (https://www.r-project.org/) y RStudio (https://www.rstudio.com/) instalados para esta sesión. RStudio es la manera más eficiente de interaccionar con R. Revisaremos los conceptos básicos relacionados con el funcionamiento de este programa de cómputo estadístico, así mismo, las partes que componen la interfaz gráfica y el espacio de trabajo de R. Y, sin más preámbulo, iniciaremos la revisión de los modos (estructuras) en que R puede almacenar y manejar datos en su espacio de trabajo, así como las propiedades (pros y contras) de cada estructura. Será una sesión intensa y cargada de ejercicios cortos, planeada así para fomentar la interacción con R. Cerraremos revisando de qué manera podemos acomodar, agrupar o filtrar datos específicos o de interés, consultando diferentes bases de datos.
1.1 ¿Cómo funciona R?
1.1.1. Consola (línea de comandos)
Esta parte de la interfaz gráfica es como una gran calculadora que nos permite interactuar con el programa a través de operaciones y comandos que en el lenguaje de R se conocen como funciones.
Las variables funcionan como en aritmética básica, en donde se usan caracteres alfabéticos para representar valores numéricos.
1.1.2. Espacio de trabajo
En esta parte de la interfaz gráfica es en donde están almacenadas y podemos visualizar todas las variables disponibles y sus características principales.
1.1.3. Objetos y funciones
Es posible asignar a un objeto en el espacio de trabajo el contenido de una variable, mediante el empleo de <-, un operador flecha. Cuando realizamos una asignación, R no imprime el contenido, solamente reasigna este valor. Cuando colocamos el nombre de un objeto en la línea de comando y lo ejecutamos, R imprime su contenido.
Las funciones son piezas de código prefabricadas que nos ayudan a llevar a cabo de forma sencilla un proceso complejo. Para "llamarlas" debemos especificar su nombre, así como los objetos sobre los que queremos que operen. Podemos modificar la forma en que opera una función mediante la especificación de sus parámetros o argumentos.
Para una comprensión más clara, se muestra la siguiente presentación:
Ahora, revise los videos que se muestran a continuación:
1.1.4. Ayuda
R tiene una extensa biblioteca de ayuda para sus funciones. Aquí revisaremos las múltiples formas de acceder a la ayuda.
Para ello, acceda a las siguientes presentaciones:
1.2 Tipos de datos y formatos de bases de datos
1.2.1. Vectores
El vector es la estructura de datos más sencilla de R. Trata de una sola línea horizontal de valores (números o caracteres). Se construye asignando a un objeto dichos valores con la función c(). Se pueden referenciar los elementos dentro de un vector usando corchetes [], y dentro de éstos el número del elemento a referenciar.
Revise la siguiente presentación correspondiente al tema de Vectores:
Ahora, se propone que visualice el siguiente video:
1.2.2. Factores
El factor es un vector que contiene un elemento agrupador sobre los datos. Automáticamente identifica los elementos distintos y agrega "niveles".
Acceda a la siguiente presentación:
Para reforzar el tema antes visto, se presenta el siguiente video:
1.2.3. Matrices
La matriz es una estructura bidimensional que puede contener valores numéricos o caracteres, pero no ambos. Se puede referenciar usando corchetes [] y especificando la fila y columna de un elemento, por ejemplo: [i,j].
Revise la siguiente presentación acerca del tema de matrices:
A continuación, visualice el siguiente video:
1.2.4 Marcos de datos
El marco de datos es la estructura de datos que más usaremos. Es bidimensional y puede contener valores numéricos y caracteres, a modo de una hoja de Excel. Para referenciar podemos usar corchetes [i,j] con el número o nombre de la columna (variable). También podemos usar el operador compacto ($) para referenciar el nombre de la columna desde el objeto, por ejemplo, datos$variablex.
Para reforzar este tema, revise la siguiente presentación:
A continuación, se sugiere que visualice el siguiente video:
1.2.5. Listas
La lista es una estructura de datos que puede contener cualquier otra estructura. Podemos referenciar los elementos que contiene como parte de una lista usando corchetes [i] o el elemento en su forma nativa con corchete doble [[i]].
Acceda a la siguiente presentación:
Ahora, visualice el siguiente video:
Para evaluar sus aprendizajes acerca del Tema I. Introducción, diríjase a la sección de Actividades e ingrese a las Actividades 1 y 2 y al Foro del Tema I, atendiendo las indicaciones para su realización.
Descripción:
Éste es un ejercicio simple que tiene como objetivo crear un directorio (folder) de trabajo para concentrar ahí los materiales del curso, así como hacer de dicho espacio en el disco duro su directorio de trabajo en R. El resultado final, un script (*.R), será el medio a través del que reportará todas sus actividades. Dicho archivo de texto contendrá los comandos en código y los comentarios que asocie a cada caso. Los script son la materia prima para hacer funcionar R, por lo que la correcta ejecución y comprensión de este primer ejercicio es vital para sus futuras interacciones con el programa, con otros usuarios y las entregas de actividades.
Revise la siguiente diapositiva del Ejercicio: : Abrir
Indicaciones:
Criterios de desempeño:
Lineamientos de entrega:
Descripción:
Esta serie de ejercicios tiene como objetivo familiarizarlo con las distintas estructuras (modos) en que R almacena datos, yendo desde el más simple (vector) hasta el más complejo (lista). Reconocerá tanto las diferencias estructurales como los contextos en que una u otra le serán de utilidad, así como las dificultades que aparecen cuando intenta hacer operaciones para los que determinada estructura no está habilitada. También revisaremos cómo convertir distintos conjuntos de datos de una a otra estructura, cuando esto aplique o sea necesario.
Indicaciones:
Explorar, identificar y manipular las distintas estructuras de datos que maneja R.
Ejercicios:
1.2.1 Vectores. Abrir
1.2.2 Factores. Abrir
1.2.3 Matrices. Abrir
1.2.4 Marcos de datos. Abrir
1.2.5 Listas. Abrir
Criterios de desempeño:
Lineamientos de entrega:
Descripción:
Criterios de desempeño:
Lineamientos de entrega:
González, A. & González, S. (2000). Introducción a R. R Development Core Team. http://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.zip
Paradis, E. (2002). R para principiantes. Traducción por Ahumada, J. A. http://cran.r-project.org/doc/contrib/rdebuts_es.pdf
RStudio. (s. f.). RStudio | Open source & professional software for data science teams. Recuperado 14 de julio de 2021, de https://www.rstudio.com/
The R Foundation. (s. f.). R: The R Project for Statistical Computing. R-Project.Org. Recuperado 14 de julio de 2021, de https://www.r-project.org/