4. Análisis de datos

4.3. Herramientas y mecanismos de análisis

4.3.5. Utilizar descriptores estadísticos típicos

4.3.5.1. Introducción

En este subapartado, trabajaremos con el archivo:  Formules.

A la hora de trabajar con el análisis de datos, hay una serie de fórmulas y descriptores estadísticos básicos que se utilizan prácticamente cada vez que se buscan historias entre un conjunto de información almacenada en una hoja de cálculo.

La estructura de las fórmulas de Excel es bastante básica:

a) Siempre se empieza con un signo =, que Excel interpreta como que a continuación habrá una fórmula.

b) En segundo lugar, escribiremos el nombre de la fórmula. A menos que estemos haciendo un cálculo personalizado, las fórmulas ya están registradas en el programa y, por lo tanto, enseguida que empecemos a escribirla el programa nos hará sugerencias.

c) Después del nombre de la fórmula, se abre paréntesis para:

  • Indicar el rango de datos sobre el cual se quiere aplicar el cálculo. Es el caso de las fórmulas más sencillas, en las cuales se podrá indicar un rango concreto o unas columnas enteras concretas. Por ejemplo, de la casilla A2 a la A34, y lo escribiríamos (A2:A34), y de la columna D a la F, escrito así (D:F).
  • Cumplir la estructura requerida por Excel, en el caso de las fórmulas con una sintaxis más compleja, para que la fórmula se resuelva con éxito.

Las fórmulas se pueden arrastrar y aplicar de manera sencilla en todas las filas de una columna. Al igual que hemos visto en apartados anteriores, nos tendremos que posicionar en el extremo derecho inferior de la celda, y hacer doble clic o arrastrar hasta la última casilla a la que queramos arrastrar la celda, y los valores de las casillas seleccionadas irán cambiando automáticamente. Si hubiera alguna casilla fija que quisiéramos mantener, podríamos hacerlo con el símbolo $.

Para poder seguir con más detalle las fórmulas presentadas a continuación, las encontraréis puestas en práctica en el documento Excel adjunto de este apartado. Este archivo hace referencia al número de matriculados en el curso de 4.º de ESO en todos los institutos públicos de Cataluña para el año 2012 y 2013. Encontraréis dos hojas, una para las fórmulas básicas y una segunda para las avanzadas.

4.3.5.2. Fórmulas básicas

1) Sumar

Permite sumar un rango de datos numéricos. Para aplicarla, hay que escribir =SUM(), o =SUMA(), dependiendo del idioma del programa, y seleccionar dentro del paréntesis el rango de datos que se quieren sumar.

2) Contar

Permite contar el número de valores numéricos que hay en un rango de datos con la fórmula =CONTAR(), o =COUNT(), según el idioma.

En cambio, si lo que nos interesa es contar valores numéricos y alfanuméricos, utilizaremos la fórmula =CONTAR.A(), o =COUNTA.

3) Media

Calcula la media de un rango determinado de datos. La fórmula es =AVERAGE(), o =PROMEDIO(), según el idioma preestablecido del programa.

4) Mediana

Es un cálculo que ordena de mayor a menor todo el rango de datos seleccionado, y retorna aquel dato que hay exactamente en el punto medio de todo el rango. Para aplicarla, se utiliza =MEDIAN, o =MEDIANA.

5) Moda

La moda es una métrica que representa el valor más repetido entre un rango determinado de datos. La fórmula para calcularla es =MODO(), si el documento Excel es en inglés, o =MODA() y =MODA.UNO(), según la versión en castellano.

6) Valor máximo

Para encontrar el valor más alto de un rango de datos determinado, la fórmula es =MAX, tanto en la versión en castellano como en inglés.

7) Valor mínimo

Para encontrar el valor más alto de un rango de datos determinado, la fórmula es =MIN, tanto en la versión en castellano como en inglés.

8) Porcentaje sobre el total

Los porcentajes son importantes porque aportan información valiosa sobre el contexto que rodea a un dato concreto. Si queremos calcular el porcentaje de un valor respecto al total de la variable, utilizaremos la regla de tres.

4.3.5.3. Fórmulas avanzadas

1) Contar los valores en blanco

Si queremos contar el número de celdas en blanco que hay en un rango determinado, la fórmula será =CONTAR.BLANCO(), para la versión en castellano, y =COUNTBLANK(), para la versión en inglés.

2) Contar condicional

La siguiente fórmula sirve para contar solo aquellos valores del rango que cumplen una condición: =CONTAR.SI(), o =COUNTIF().

3) Sumar condicional

Funciona del mismo modo que la operación anterior, pero en este caso, suma. Por lo tanto, solo suman aquellos valores del rango que cumplan una condición: =SUMAR.SI(), o =SUMIF().

4) Ver si un registro cumple dos o más condiciones

Esta operación permite ver si una fila cumple condiciones en columnas diferentes. La fórmula para aplicar es =Y(), en español, y =AND(), en inglés.

Con la cruz negra que aparece en el extremo inferior derecho de la celda, arrastraremos la fórmula al resto de la columna.

5) Ver si un registro cumple alguna condición

Esta fórmula tiene un funcionamiento prácticamente igual al anterior, con la única diferencia de que en esta versión indicará «VERDADERO» cuando cumpla alguna de las condiciones especificadas, y solo indicará «FALSO» si no cumple ninguna.

Para aplicarla, tendremos que utilizar =O(), en la versión española, y =OR() en la inglesa. En el ejemplo anterior, quedaría formulada de la siguiente manera en la columna H: =Y(E2>50 “;F2>50;F2>0).

6) Condicional

La función =SI() o IF() permite ver si una celda cumple una condición concreta en una columna y, en el caso de que sí o de que no, poder personalizar la respuesta.

La fórmula correcta será: =SI(D2>30; «dentro de la ratio»; «fuera de la ratio»).

7) Trasladar valores por una columna en común

Esta fórmula sirve para encontrar valores iguales que hay en hojas de Excel separadas. Para entenderlo mejor, será necesario abrir el Excel adjunto del número de inscritos en los institutos de Cataluña y ver la operación completa en la columna E de la hoja de «fórmulas avanzadas». Imaginémonos que queremos unir la hoja de «matriculados 2012» con la de «matriculados 2013». Para copiar las cifras de una manera sencilla, rápida y sin caer en errores, utilizaremos la fórmula =BUSCARV(), o =VLOOKUP().

8) Variación porcentual

La variación porcentual es un cálculo que nos permitirá saber cuál ha sido la variación a lo largo del tiempo de una variable determinada.

Se calcula de la manera siguiente:

(Valor final – valor inicial) / valor inicial * 100