La Agencia Tributaria planea utilizar la minería de datos para detectar posibles casos de fraude fiscal, aprovechando la nueva fuente de información que recibirá próximamente con la implementación de la facturación electrónica. A partir de mediados de 2025, las pequeñas y medianas empresas, así como grandes empresas, deberán emitir todas sus facturas en formato digital y enviarlas directamente a Hacienda. La minería de datos, en términos simples, consiste en algoritmos que extraen patrones o conclusiones a partir de grandes volúmenes de datos desorganizados.
Ante la enorme cantidad de información que se espera obtener de las facturas electrónicas, Hacienda ha lanzado un concurso público para contratar una empresa que desarrolle software y aplicaciones capaces de optimizar el uso de estos datos. Según el documento que justifica el concurso, la incorporación de nuevas fuentes de información, como la facturación electrónica, los datos para gestionar devoluciones a mutualistas y los intercambios internacionales, abre nuevas posibilidades para la prevención del fraude. Además, se integrarán tecnologías innovadoras como Big Data, procesamiento del lenguaje natural y minería de datos.
El objetivo es aprovechar al máximo los datos de la facturación digital para prevenir el fraude fiscal y mejorar otros procesos, como la gestión de devoluciones de IRPF a mutualistas. El contrato, valorado en unos 13,5 millones de euros sin IVA y con una duración de dos años, es prorrogable y se espera adjudicar antes de fin de año, para que entre en funcionamiento a partir del 15 de enero.
Hacienda explica que las técnicas de minería de datos permitirán desarrollar modelos predictivos sobre los contribuyentes. Como ejemplo, señala que al dato del salario bruto de un ciudadano se le podrían añadir otros factores como la edad y profesión, lo que ayudaría a clasificarlo dentro de un grupo determinado. De esta manera, si se detectan incoherencias entre los datos del contribuyente y los de su grupo, podría considerarse sospechoso de fraude y ser investigado.
El objetivo de la Agencia Tributaria es crear una base de datos que integre toda la información proveniente de diferentes fuentes en un modelo conceptual, capaz de proporcionar respuestas rápidas y precisas. Actualmente, la Administración fiscal se alimenta principalmente de bases de datos con información estructurada de sistemas transaccionales, pero también está incorporando fuentes semiestructuradas y no estructuradas, como actas de inspección, anuncios en boletines oficiales y noticias de medios electrónicos. En este contexto, la facturación electrónica, que se implementará por completo en 2026, será una de las principales fuentes de datos, debido al volumen de información que generará.
(El Economista, 17-10-2024)
Gestoria Maresme










