{"id":330,"date":"2018-01-10T10:18:42","date_gmt":"2018-01-10T08:18:42","guid":{"rendered":"http:\/\/periodisme-dades.uoc.edu\/?page_id=330"},"modified":"2018-01-28T10:06:44","modified_gmt":"2018-01-28T08:06:44","slug":"3-5-1-la-mineria","status":"publish","type":"page","link":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/3-5-1-la-mineria\/","title":{"rendered":"3.5.1. La miner\u00eda"},"content":{"rendered":"<p>Hasta ahora, hemos hecho un repaso de las bases de datos disponibles y de los mecanismos de acceso a la informaci\u00f3n p\u00fablica que hay actualmente. Aun as\u00ed, las posibilidades de trabajar con datos se extienden m\u00e1s all\u00e1 de las v\u00edas mencionadas.<\/p>\n<p>Hay multitud de conjuntos de datos que, pese a no estar estructurados como tales, nos pueden ser \u00fatiles a la hora de llevar a cabo un proyecto period\u00edstico. Es lo que se conoce como <em>scrapping<\/em> o miner\u00eda de datos.<\/p>\n<p>Se trata de una t\u00e9cnica para descargar, de forma automatizada, informaci\u00f3n almacenada en p\u00e1ginas web para estructurarla en una hoja de c\u00e1lculo o base de datos. Un ejemplo ser\u00eda el caso de los datos de los parlamentarios del Congreso de Diputados. La estructura de la p\u00e1gina web permite la descarga autom\u00e1tica de los datos en formato de hoja de c\u00e1lculo, sin depender de que la instituci\u00f3n p\u00fablica la ponga al servicio de la ciudadan\u00eda.<\/p>\n<p>Para llevar a cabo estas descargas, normalmente se utilizan lenguajes de programaci\u00f3n como R o Python. Teniendo en cuenta que la gran mayor\u00eda de los periodistas no tienen suficientes conocimientos para usar estas herramientas, hay otras alternativas como por ejemplo aplicaciones inform\u00e1ticas que, de una manera m\u00e1s sencilla, a pesar de que con ciertas limitaciones, permiten que el periodista pueda autogestionar las descargas.<\/p>\n<p>Es el caso de herramientas como Import.io, o las hojas de c\u00e1lculo de Google.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hasta ahora, hemos hecho un repaso de las bases de datos disponibles y de los mecanismos de acceso a la informaci\u00f3n p\u00fablica que hay actualmente. Aun as\u00ed, las posibilidades de trabajar con datos se extienden m\u00e1s all\u00e1 de las v\u00edas mencionadas. Hay multitud de conjuntos de datos que, pese a no estar estructurados como tales, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":[],"_links":{"self":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/330"}],"collection":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/comments?post=330"}],"version-history":[{"count":5,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/330\/revisions"}],"predecessor-version":[{"id":655,"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/pages\/330\/revisions\/655"}],"wp:attachment":[{"href":"http:\/\/periodisme-dades.recursos.uoc.edu\/es\/wp-json\/wp\/v2\/media?parent=330"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}