{"id":347,"date":"2018-01-10T11:00:43","date_gmt":"2018-01-10T09:00:43","guid":{"rendered":"http:\/\/periodisme-dades.uoc.edu\/?page_id=347"},"modified":"2018-02-27T11:49:02","modified_gmt":"2018-02-27T09:49:02","slug":"4-3-1-importar-dades","status":"publish","type":"page","link":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/4-3-1-importar-dades\/","title":{"rendered":"4.3.1. Importar datos"},"content":{"rendered":"<p>A la hora de trabajar con datos exportados de otras bases de datos m\u00e1s grandes, podemos encontrarnos tres tipos de formatos: XLS o XLSX, seg\u00fan la versi\u00f3n, TSV, y CSV.<\/p>\n<p>El <a href=\"javascript:void(0);\" class=\"tooltip\" data-toggle=\"popover\" data-placement=\"bottom\" data-content=\"Para las siglas en ingl\u00e9s <em>Comma Separated Values<\/em>.\" data-placement=\"top\" data-html=\"true\">CSV<\/a> es un archivo que se ordena en filas y en columnas, en el cual la primera fila corresponde al encabezamiento de cada columna, y cada fila a un registro. Cada campo (columna) est\u00e1 separado por comas. M\u00e1s all\u00e1 del archivo de Excel, es el tipo de formato m\u00e1s f\u00e1cil de encontrar.<\/p>\n<p>El <a href=\"javascript:void(0);\" class=\"tooltip\" data-toggle=\"popover\" data-placement=\"bottom\" data-content=\"Por las siglas en ingl\u00e9s <em>Tab Separated Values<\/em>.\" data-placement=\"top\" data-html=\"true\">TSV<\/a> es un archivo estructurado de la misma manera que un CSV, pero el separador en este caso es el tabulador, y no la coma.<\/p>\n<p>En el caso de los archivos XLS o XLSX, los archivos de Microsoft Excel solo hay que abrirlos con cualquiera de los programas de gesti\u00f3n de hojas de c\u00e1lculo que hemos visto anteriormente, y empezar a trabajar. En cambio, en el caso del CSV o el TSV, tendremos que seguir unos pasos espec\u00edficos, similares para los dos formatos, para poder trabajar con el archivo.<\/p>\n<p>Con Microsoft Excel abierto, habr\u00e1 que ir a la pesta\u00f1a \u00abDatos\u00bb y, dentro de esta, a \u00abObtener datos externos\u00bb y a \u00abImportar archivo de texto\u00bb. Entonces, se abrir\u00e1 un men\u00fa por el cual podremos seleccionar el archivo deseado y empezar el proceso para llevar a cabo la importaci\u00f3n.<\/p>\n<figure id=\"attachment_163\" aria-describedby=\"caption-attachment-163\" style=\"width: 800px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-163\" src=\"\/wp-content\/uploads\/2017\/12\/m1450_m4_13.jpg\" alt=\"\" width=\"800\" height=\"400\" srcset=\"\/wp-content\/uploads\/2017\/12\/m1450_m4_13.jpg 800w, \/wp-content\/uploads\/2017\/12\/m1450_m4_13-300x150.jpg 300w, \/wp-content\/uploads\/2017\/12\/m1450_m4_13-768x384.jpg 768w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><figcaption id=\"caption-attachment-163\" class=\"wp-caption-text\">Importar datos (primer paso)<\/figcaption><\/figure>\n<p>Lo primero que nos pide el asistente de importaci\u00f3n de archivo de texto es saber de qu\u00e9 manera est\u00e1n delimitadas las filas: si por un valor separador, una coma o un tabulador, por ejemplo, o por un tama\u00f1o determinado. Marcaremos la primera opci\u00f3n: \u00abCaracteres como comas y tabulaciones separan los campos\u00bb.<\/p>\n<p>Antes de pasar a la pantalla siguiente, tendremos que marcar la fila a partir de la cual se quiere iniciar la importaci\u00f3n. Generalmente, en esta parte nos interesa mantener el valor por defecto: que empiece la importaci\u00f3n desde la fila 1.<\/p>\n<p>Por \u00faltimo, habr\u00e1 que marcar el tipo de codificaci\u00f3n con el que est\u00e1 guardado el archivo con el que queremos trabajar en el desplegable que hay en la parte inferior derecha del men\u00fa emergente. Normalmente, utilizaremos las codificaciones universales: UTF-8 o UTF-16. Aun as\u00ed, a veces nos podemos encontrar con el hecho de que, seg\u00fan c\u00f3mo haya sido guardado el archivo, haya algunos caracteres especiales en el caso del catal\u00e1n, que no acaba de leer correctamente. Es lo que ocurre con la \u00ab\u00e7\u00bb o los acentos abiertos. Por lo tanto, antes de continuar con este tipo de codificaci\u00f3n, ser\u00e1 necesario dar un vistazo al previsualizador para asegurarse de que lee correctamente el archivo. Si las codificaciones UTF no descodifican correctamente, se podr\u00e1 probar con la Windows 1250, Windows 1251, Windows 1252 o la Macintosh. Es importante, sin embargo, que antes de pasar a la siguiente pantalla, los caracteres se previsualicen correctamente.<\/p>\n<figure id=\"attachment_710\" aria-describedby=\"caption-attachment-710\" style=\"width: 800px\" class=\"wp-caption alignnone\"><img loading=\"lazy\" class=\"alignnone size-full wp-image-164\" src=\"\/wp-content\/uploads\/2017\/12\/m1450_m4_14.jpg\" alt=\"\" width=\"700\" height=\"526\" srcset=\"\/wp-content\/uploads\/2017\/12\/m1450_m4_14.jpg 700w, \/wp-content\/uploads\/2017\/12\/m1450_m4_14-300x225.jpg 300w\" sizes=\"(max-width: 700px) 100vw, 700px\" \/><figcaption id=\"caption-attachment-710\" class=\"wp-caption-text\">Importar datos (segundo paso)<\/figcaption><\/figure>\n<p>Una vez hechos estos pasos, pasaremos a la siguiente pantalla. En este caso, el objetivo es sencillo: seleccionar el valor que separa las columnas. En el caso del CSV, es una coma, y en el caso del TSV, un tabulador.<\/p>\n<p>Cuando demos este paso, podremos continuar adelante. El resto de las pantallas no requieren ninguna intervenci\u00f3n. Por lo tanto, haremos clic en el bot\u00f3n \u00abSiguiente\u00bb hasta que los datos ya est\u00e9n definitivamente importados y visualicemos en la pantalla del ordenador una hoja de c\u00e1lculo como otra cualquiera, separada en las columnas correspondientes.<\/p>\n<p>Evidentemente, hay miles de otros formatos, algunos muy comunes tambi\u00e9n en la pr\u00e1ctica del periodismo de datos y las visualizaciones interactivas, pero son una tipolog\u00eda de archivos que veremos en otros casos aplicados.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>A la hora de trabajar con datos exportados de otras bases de datos m\u00e1s grandes, podemos encontrarnos tres tipos de formatos: XLS o XLSX, seg\u00fan la versi\u00f3n, TSV, y CSV. El es un archivo que se ordena en filas y en columnas, en el cual la primera fila corresponde al encabezamiento de cada columna, y [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/347"}],"collection":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/comments?post=347"}],"version-history":[{"count":3,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/347\/revisions"}],"predecessor-version":[{"id":889,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/347\/revisions\/889"}],"wp:attachment":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/media?parent=347"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}