4.1. Herramientas para el análisis de datos
4.1.1. Gestores de hojas de cálculo
4.1.1.1. Introducción
Hay diferentes herramientas para tratar el análisis de datos. En líneas generales, los datos que deberemos tratar están almacenados en hojas de cálculo que pueden analizarse mediante programas de gestión de hojas de cálculo como por ejemplo Microsoft Excel, Google Spreadsheets u Open Calc, la versión de software libre.
En los siguientes apartados, se explicará por tutoriales y por capturas de pantalla cómo gestionar un análisis de datos con la herramienta Microsoft Excel, ya que es la más común y potente.
4.1.1.2. Microsoft Excel
Es un programa de gestión de hojas de cálculo que forma parte del paquete Office. Microsoft lanzó la primera versión de esta herramienta en 1985, y desde entonces se ha popularizado como la herramienta por excelencia de gestión de base de datos. Su interfaz es intuitiva y conocida por miles de usuarios en todo el mundo.
También será el programa que utilizaremos como eje central para ver cómo limpiar y analizar un conjunto de datos. Todos y cada uno de los pasos que se detallan a continuación se seguirán mediante el programa Microsoft Excel. De momento, sin embargo, hay que hacer una presentación oficial de la interfaz:
4.1.1.3. Google Spreadsheets
Creado en el 2006 por Google, es el homólogo de Microsoft Excel. A pesar de que la interfaz es menos conocida y añade variaciones respecto al programa de Microsoft, tiene la ventaja de ser un programa gratuito al que todo el mundo puede acceder por medio de una cuenta de Google. Además, la aplicación en línea también permite que diferentes usuarios puedan trabajar con la misma hoja de cálculo a la vez.
La contrapartida es que acepta un número de filas considerablemente inferior a Microsoft Excel, de manera que para grandes hojas de cálculo no hay otra alternativa que utilizar Excel.
4.1.1.4. LibreOffice Calc
Se trata de un programa de gestión de hojas de cálculo de libre utilización. Como todo el paquete de software libre, LibreOffice está disponible para todas las plataformas: Mac, Microsoft y Linux, entre las más conocidas. A pesar de que ha mejorado mucho respecto a las versiones anteriores, a la hora de utilizar determinadas fórmulas hay ciertas limitaciones, puesto que no ofrece el mismo abanico que Microsoft Excel o Google Spreadsheets.
Estos son los programas de gestión de hojas de cálculo más utilizadas hoy día. Ahora bien, cuando estamos ante un conjunto de datos mucho más grande almacenado en una base de datos, tendremos que optar por herramientas más completas que permitan gestionar un mayor volumen.