{"id":332,"date":"2018-01-10T10:22:21","date_gmt":"2018-01-10T08:22:21","guid":{"rendered":"http:\/\/periodisme-dades.uoc.edu\/?page_id=332"},"modified":"2018-01-28T10:07:16","modified_gmt":"2018-01-28T08:07:16","slug":"3-5-2-eines","status":"publish","type":"page","link":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/3-5-2-eines\/","title":{"rendered":"3.5.2. Herramientas"},"content":{"rendered":"<p>Hay una serie de herramientas y de aplicaciones inform\u00e1ticas gratuitas que permiten de manera sencilla poder descargar informaci\u00f3n de una p\u00e1gina web y almacenarla en hojas de c\u00e1lculo de forma autom\u00e1tica. A continuaci\u00f3n, hacemos una lista de algunas de las m\u00e1s utilizadas por su practicidad y sencillez:<\/p>\n<p><strong>1) <\/strong><a href=\"https:\/\/www.import.io\/\" target=\"_blank\" rel=\"noopener\"><strong>Import.io<\/strong><\/a><\/p>\n<p>Es una herramienta en l\u00ednea que, sin necesidad de descargar en el dispositivo, permite de manera f\u00e1cil y sencilla la descarga de datos. Solo requiere la creaci\u00f3n de una cuenta de manera gratuita y conexi\u00f3n a internet para poder utilizarla. El formato gratuito acepta hasta cien descargas automatizadas al mes. Si se quieren efectuar m\u00e1s, habr\u00e1 que esperar al mes siguiente, o suscribirse a la versi\u00f3n <em>premium<\/em>.<\/p>\n<p><strong>2) Hoja de c\u00e1lculo de Google<\/strong><\/p>\n<p>La herramienta de gesti\u00f3n de hojas de c\u00e1lculo de Google contiene f\u00f3rmulas preparadas para descargar contenido almacenado en las p\u00e1ginas web, sea cual sea el formato de origen: XML, HTML, CSV o TSV. Se trata de una serie de f\u00f3rmulas que se tienen que escribir en la primera casilla en la que se quiere que se importen los datos. Para su correcto funcionamiento, hay que seguir la sintaxis de la f\u00f3rmula:<\/p>\n<ul>\n<li>IMPORTXML (url, xpath_query)<\/li>\n<li>IMPORTHTML (url, query, index)<\/li>\n<li>IMPORTDATA (url)<\/li>\n<\/ul>\n<p><strong>3) Web Scraper<\/strong><\/p>\n<p>Se trata de un complemento del navegador Google Chrome, que permite automatizar la descarga de informaci\u00f3n de las p\u00e1ginas web. Para poder utilizarlo, primero hay que instalar el complemento en el navegador. A continuaci\u00f3n, aparecer\u00e1 un icono en la parte superior derecha de la pantalla. Cada vez que lo tengamos que utilizar, haremos clic en el icono con la p\u00e1gina web abierta. A partir de aqu\u00ed, solo habr\u00e1 que seguir los pasos que indica el complemento.<\/p>\n<p><strong>4) <\/strong><a href=\"https:\/\/www.parsehub.com\" target=\"_blank\" rel=\"noopener\"><strong>ParseHub<\/strong><\/a><\/p>\n<p>Es una aplicaci\u00f3n inform\u00e1tica que se puede descargar tanto en PC como en dispositivos Macintosh, y que permite de manera sencilla la descarga autom\u00e1tica de datos. Se trata de una herramienta gratuita que, una vez aprendido su funcionamiento, permite de manera eficaz conseguir su prop\u00f3sito. Actualmente es una de las herramientas m\u00e1s potentes, puesto que sea cual sea la estructura de la p\u00e1gina, acostumbra a extraer con \u00e9xito los datos.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hay una serie de herramientas y de aplicaciones inform\u00e1ticas gratuitas que permiten de manera sencilla poder descargar informaci\u00f3n de una p\u00e1gina web y almacenarla en hojas de c\u00e1lculo de forma autom\u00e1tica. A continuaci\u00f3n, hacemos una lista de algunas de las m\u00e1s utilizadas por su practicidad y sencillez: 1) Import.io Es una herramienta en l\u00ednea que, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/332"}],"collection":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/comments?post=332"}],"version-history":[{"count":5,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/332\/revisions"}],"predecessor-version":[{"id":657,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/332\/revisions\/657"}],"wp:attachment":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/media?parent=332"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}