{"id":342,"date":"2018-01-10T10:32:16","date_gmt":"2018-01-10T08:32:16","guid":{"rendered":"http:\/\/periodisme-dades.uoc.edu\/?page_id=342"},"modified":"2018-01-10T10:32:16","modified_gmt":"2018-01-10T08:32:16","slug":"4-2-2-limpiar-una-hoja-de-calculo","status":"publish","type":"page","link":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/4-2-2-limpiar-una-hoja-de-calculo\/","title":{"rendered":"4.2.2. Limpiar una hoja de c\u00e1lculo"},"content":{"rendered":"<p>Limpiar unos datos quiere decir ponerlos de forma adecuada para que se puedan analizar mediante programas de gesti\u00f3n de hojas de c\u00e1lculo, como por ejemplo Microsoft Excel o Google Spreadsheets, o de gesti\u00f3n de base de datos como SQL o Microsoft Access.<\/p>\n<p>Proceder directamente al an\u00e1lisis sin haber hecho una limpieza de los datos puede conducir al periodista a extraer conclusiones del todo err\u00f3neas. A la hora de efectuar esta limpieza, hay algunas comprobaciones que pr\u00e1cticamente se pueden aplicar en la totalidad de los casos.<\/p>\n<ul>\n<li>Eliminar todos los elementos complementarios: filas, columnas e im\u00e1genes incrustadas extra. Cuando se utilizan datos de la Administraci\u00f3n p\u00fablica, a menudo se incrusta la imagen de la entidad correspondiente y se ponen cabeceras extra en las filas superiores. Para poder hacer un an\u00e1lisis por medio de cualquier programa, ser\u00e1 necesario que en la primera fila haya la cabecera de cada columna, es decir, el nombre del campo.<\/li>\n<li>Comprobar que los registros de una misma columna no est\u00e1n escritos de maneras diferentes. Esto nos podr\u00eda llevar a hacer recuentos err\u00f3neos. Esta comprobaci\u00f3n se puede hacer con una tabla din\u00e1mica, que veremos m\u00e1s adelante c\u00f3mo se hace, o utilizando programas espec\u00edficos de limpieza de datos como por ejemplo <a href=\"javascript:void(0);\" class=\"tooltip\" data-toggle=\"popover\" data-placement=\"bottom\" data-content=\"Manual de utilizaci\u00f3n de <a href='https:\/\/www.irekia.euskadi.eus\/assets\/attachments\/2421\/Tutorial4_IntroduccionGoogleRefine.pdf?1342079458' target=_blank'>Open Refine<\/a>.\" data-placement=\"top\" data-html=\"true\">Google Refine<\/a>.<\/li>\n<li>Comprobar que no haya espacios extra dentro de las celdas que forman la tabla. Para eliminar los espacios complementarios en un gestor de hojas de c\u00e1lculo, tanto si es Microsoft Excel o Google Spreadsheets, ser\u00e1 necesario hacerlo con la f\u00f3rmula =ESPACIOS, o =TRIM, si el programa est\u00e1 en ingl\u00e9s.<\/li>\n<li>Que no haya diferencias de min\u00fasculas y de may\u00fasculas. Precisamente por esta raz\u00f3n, es una buena idea cambiar a may\u00fasculas todos aquellos campos que pretendan ser buscables por la f\u00f3rmula de Excel =MAYUSC, o =UPPER, si el programa est\u00e1 en ingl\u00e9s.<\/li>\n<li>Comprobar que todos los n\u00fameros est\u00e9n en el mismo formato. Para hacerlo, habr\u00e1 que seleccionar la columna y, en la pesta\u00f1a \u00abformato\u00bb, hacer clic en la opci\u00f3n de \u00abceldas\u00bb. Se abrir\u00e1 un men\u00fa emergente y, en la primera pesta\u00f1a, la de \u00abn\u00famero\u00bb, elegiremos el formato id\u00f3neo para todas las columnas que contienen cifras.<\/li>\n<\/ul>\n<p>Antes de hacer cualquier modificaci\u00f3n de la estructura, hay que a\u00f1adir un n\u00famero \u00fanico para cada registro. De este modo, tendremos un valor \u00fanico para cada fila y no nos confundiremos en el supuesto de que <em>a posteriori<\/em> se haga alg\u00fan duplicado sin querer.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Limpiar unos datos quiere decir ponerlos de forma adecuada para que se puedan analizar mediante programas de gesti\u00f3n de hojas de c\u00e1lculo, como por ejemplo Microsoft Excel o Google Spreadsheets, o de gesti\u00f3n de base de datos como SQL o Microsoft Access. Proceder directamente al an\u00e1lisis sin haber hecho una limpieza de los datos puede [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/342"}],"collection":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/comments?post=342"}],"version-history":[{"count":1,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/342\/revisions"}],"predecessor-version":[{"id":343,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/342\/revisions\/343"}],"wp:attachment":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/media?parent=342"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}