4.3. Herramientas y mecanismos de análisis
4.3.5. Utilizar descriptores estadísticos típicos
4.3.5.1. Introducción
En este subapartado, trabajaremos con el archivo: Formules.
A la hora de trabajar con el análisis de datos, hay una serie de fórmulas y descriptores estadísticos básicos que se utilizan prácticamente cada vez que se buscan historias entre un conjunto de información almacenada en una hoja de cálculo.
La estructura de las fórmulas de Excel es bastante básica:
a) Siempre se empieza con un signo =, que Excel interpreta como que a continuación habrá una fórmula.
b) En segundo lugar, escribiremos el nombre de la fórmula. A menos que estemos haciendo un cálculo personalizado, las fórmulas ya están registradas en el programa y, por lo tanto, enseguida que empecemos a escribirla el programa nos hará sugerencias.
c) Después del nombre de la fórmula, se abre paréntesis para:
- Indicar el rango de datos sobre el cual se quiere aplicar el cálculo. Es el caso de las fórmulas más sencillas, en las cuales se podrá indicar un rango concreto o unas columnas enteras concretas. Por ejemplo, de la casilla A2 a la A34, y lo escribiríamos (A2:A34), y de la columna D a la F, escrito así (D:F).
- Cumplir la estructura requerida por Excel, en el caso de las fórmulas con una sintaxis más compleja, para que la fórmula se resuelva con éxito.
Las fórmulas se pueden arrastrar y aplicar de manera sencilla en todas las filas de una columna. Al igual que hemos visto en apartados anteriores, nos tendremos que posicionar en el extremo derecho inferior de la celda, y hacer doble clic o arrastrar hasta la última casilla a la que queramos arrastrar la celda, y los valores de las casillas seleccionadas irán cambiando automáticamente. Si hubiera alguna casilla fija que quisiéramos mantener, podríamos hacerlo con el símbolo $.
Ejemplo
Por ejemplo, si queremos fijar la casilla A24, si escribimos $A24 fijaremos la columna, pero no la fila; si escribimos A$24 fijaremos la fila, pero no la columna; y si escribimos $A$24, la fijaremos del todo.
Para poder seguir con más detalle las fórmulas presentadas a continuación, las encontraréis puestas en práctica en el documento Excel adjunto de este apartado. Este archivo hace referencia al número de matriculados en el curso de 4.º de ESO en todos los institutos públicos de Cataluña para el año 2012 y 2013. Encontraréis dos hojas, una para las fórmulas básicas y una segunda para las avanzadas.
4.3.5.2. Fórmulas básicas
1) Sumar
Permite sumar un rango de datos numéricos. Para aplicarla, hay que escribir =SUM(), o =SUMA(), dependiendo del idioma del programa, y seleccionar dentro del paréntesis el rango de datos que se quieren sumar.
2) Contar
Permite contar el número de valores numéricos que hay en un rango de datos con la fórmula =CONTAR(), o =COUNT(), según el idioma.
En cambio, si lo que nos interesa es contar valores numéricos y alfanuméricos, utilizaremos la fórmula =CONTAR.A(), o =COUNTA.
3) Media
Calcula la media de un rango determinado de datos. La fórmula es =AVERAGE(), o =PROMEDIO(), según el idioma preestablecido del programa.
4) Mediana
Es un cálculo que ordena de mayor a menor todo el rango de datos seleccionado, y retorna aquel dato que hay exactamente en el punto medio de todo el rango. Para aplicarla, se utiliza =MEDIAN, o =MEDIANA.
5) Moda
La moda es una métrica que representa el valor más repetido entre un rango determinado de datos. La fórmula para calcularla es =MODO(), si el documento Excel es en inglés, o =MODA() y =MODA.UNO(), según la versión en castellano.
6) Valor máximo
Para encontrar el valor más alto de un rango de datos determinado, la fórmula es =MAX, tanto en la versión en castellano como en inglés.
7) Valor mínimo
Para encontrar el valor más alto de un rango de datos determinado, la fórmula es =MIN, tanto en la versión en castellano como en inglés.
8) Porcentaje sobre el total
Los porcentajes son importantes porque aportan información valiosa sobre el contexto que rodea a un dato concreto. Si queremos calcular el porcentaje de un valor respecto al total de la variable, utilizaremos la regla de tres.
Ejemplo
Por ejemplo, volviendo al caso de los institutos públicos, si queremos saber qué porcentaje representan el número de estudiantes de 4.º de ESO del municipio de Alcanar, 74, respecto al total matriculados en Cataluña en el 2012, un total de 17.635, el cálculo que tendremos que hacer será: total alumnos de Alcanar / total alumnos de Cataluña * 100.
Hay que tener en cuenta que si ya hemos multiplicado por cien, no habrá que especificar que los valores son porcentaje en el formato de número. Es importante recordarlo, porque si cambiamos el formato de número a porcentaje, automáticamente los valores se multiplicarán por cien otra vez.
4.3.5.3. Fórmulas avanzadas
1) Contar los valores en blanco
Si queremos contar el número de celdas en blanco que hay en un rango determinado, la fórmula será =CONTAR.BLANCO(), para la versión en castellano, y =COUNTBLANK(), para la versión en inglés.
2) Contar condicional
La siguiente fórmula sirve para contar solo aquellos valores del rango que cumplen una condición: =CONTAR.SI(), o =COUNTIF().
Ejemplo
Por ejemplo, si queremos contar todos aquellos valores de una columna que son mayores de 15, la fórmula correcta sería: =CONTAR.SI(B:B;“>15”).
3) Sumar condicional
Funciona del mismo modo que la operación anterior, pero en este caso, suma. Por lo tanto, solo suman aquellos valores del rango que cumplan una condición: =SUMAR.SI(), o =SUMIF().
Ejemplo
Por ejemplo, si queremos sumar todos aquellos valores de una columna que son mayores de 15, la fórmula correcta sería: =SUMAR.SI(B:B;“>15”).
4) Ver si un registro cumple dos o más condiciones
Esta operación permite ver si una fila cumple condiciones en columnas diferentes. La fórmula para aplicar es =Y(), en español, y =AND(), en inglés.
Ejemplo
Por ejemplo, volviendo al caso de los institutos, imaginémonos que queremos saber cuáles tuvieron más de 50 matriculados en 4.º de ESO en el 2012 de la totalidad de institutos, más de una cincuentena en el 2013 y que, además, el crecimiento de un año al otro fue positivo. Para ver la aplicación de la fórmula, podéis abrir el archivo adjunto y hacer clic en la segunda hoja, denominada «fórmulas avanzadas». En la columna G hay la siguiente fórmula: =Y(E2>50 “;F2>50;F2>0).
De este modo, si en la fila 2, la que corresponde al único instituto de Alcanar, los alumnos de 4.º de ESO del año 2014 son más de 50 (columna E), en el 2012 también son más de una cincuentena (columna F), y el crecimiento (columna G) de un año respecto al otro ha sido positivo, el resultado definitivo será «VERDADERO». En cambio, el resultado será «FALSO» tanto si no cumple ninguna, o solo cumple alguna.
Con la cruz negra que aparece en el extremo inferior derecho de la celda, arrastraremos la fórmula al resto de la columna.
5) Ver si un registro cumple alguna condición
Esta fórmula tiene un funcionamiento prácticamente igual al anterior, con la única diferencia de que en esta versión indicará «VERDADERO» cuando cumpla alguna de las condiciones especificadas, y solo indicará «FALSO» si no cumple ninguna.
Para aplicarla, tendremos que utilizar =O(), en la versión española, y =OR() en la inglesa. En el ejemplo anterior, quedaría formulada de la siguiente manera en la columna H: =Y(E2>50 “;F2>50;F2>0).
6) Condicional
La función =SI() o IF() permite ver si una celda cumple una condición concreta en una columna y, en el caso de que sí o de que no, poder personalizar la respuesta.
Ejemplo
Volvamos al ejemplo de los alumnos de ESO. Por ejemplo, si el único instituto de Alcanar tuvo más de 30 alumnos de bachillerato en el 2012, querremos que la celda indique que está «dentro de la ratio» y, si no los ha tenido, que aparezca «fuera de la ratio».
La fórmula correcta será: =SI(D2>30; «dentro de la ratio»; «fuera de la ratio»).
7) Trasladar valores por una columna en común
Esta fórmula sirve para encontrar valores iguales que hay en hojas de Excel separadas. Para entenderlo mejor, será necesario abrir el Excel adjunto del número de inscritos en los institutos de Cataluña y ver la operación completa en la columna E de la hoja de «fórmulas avanzadas». Imaginémonos que queremos unir la hoja de «matriculados 2012» con la de «matriculados 2013». Para copiar las cifras de una manera sencilla, rápida y sin caer en errores, utilizaremos la fórmula =BUSCARV(), o =VLOOKUP().
8) Variación porcentual
La variación porcentual es un cálculo que nos permitirá saber cuál ha sido la variación a lo largo del tiempo de una variable determinada.
Se calcula de la manera siguiente:
(Valor final – valor inicial) / valor inicial * 100
Ejemplo
Por ejemplo, si el número de alumnos matriculados en 4.º de ESO en los institutos públicos de Cataluña en el 2012 era de 17.635, y en el 2014 era de 17.436, la variación porcentual habrá sido de -1,2 %. Para ver con más detalle el cálculo, podéis ir directamente a la columna F de la segunda hoja, denominada «fórmulas avanzadas».