Fraude a aseguradoras

Fraude a aseguradoras

Uno de los sectores más afectados por el fraude es el de las compañías aseguradoras y, sin duda, el producto estrella que se ha convertido en objetivo del cibercrimen son los seguros de automóviles y que más del 63% de los casos de fraude se centran en ellos.

Cada año se invierten grandes cantidades de dinero para detectar el fraude sufrido. Un fraude que genera pérdidas millonarias, aunque hay que reconocer que los últimos estudios han demostrado que dichas inversiones son rentables y por cada euro de inversión que se realiza se recuperan más de 48€.

Un fraude tipo en los seguros de automóviles se produce cuando el asegurado engaña a la compañía dando parte de un siniestro con la encubierta intención de obtener un beneficio económico de ello. Un parte con daños materiales o lesiones físicas que, en realidad, no han tenido lugar, o bien, habiéndose producido dicho accidente se agravan y exageran las consecuencias.

La búsqueda de fraude en siniestros automovilísticos es un trabajo altamente especializado que consume una gran cantidad de recursos y tiempo. Gracias a la ciencia de datos este trabajo se automatiza en gran medida, poniendo el foco en los posibles casos de fraude y atomizando el problema para una solución óptima.

LA MAGIA DEL DATA SCIENCE

¿Cómo se hace la magia? A partir de un histórico de datos de incidentes reales, fraudulentos y no fraudulentos, se analizan sus características en busca de patrones. Los patrones son pautas utilizadas por los defraudadores que pueden dar indicios para pensar que un caso es fraudulento, esto se realiza creando lo que se llama “modelo”. Para que el modelo sea lo más preciso posible, los datos deben ser proporcionados por la compañía aseguradora y deben ser tan extensos y concisos como sea posible.

Supongamos que una compañía aseguradora de automóviles nos ha proporcionado un conjunto de datos, dataset, formado por las diferentes características que rodean a un incidente automovilístico. Este tipo de datos suelen ser el tipo de póliza, los meses que lleva como cliente, sexo y edad del asegurado, tipo de incidente, número de vehículos implicados en el accidente, tipo de colisión (si la hubo), severidad del incidente, número de testigos, etc… Datos que nos irán dando pistas y que nos permitirán estudiarlas en su conjunto y nos ayudaran a resolver si un caso es fraudulento.

Si intentamos agrupar casos con datos similares podemos descubrir aquellos que tengan características que no amolden a ningún grupo, a ningún “cluster”. Estos casos son denominados como “outliers”, posibles casos de fraude.

En nuestro caso hemos descubierto una característica que diferencia los casos que no son “outliers” y los que sí lo son. La característica “gravedad del incidente” representa el costo asumido por la compañía aseguradora en un incidente y suele ser clave para detectar posibles casos fraudulentos.

DATA SCIENCE PARA PROTEGER AL SECTOR ASEGURADOR DEL FRAUDE

Como comentábamos, nuestros expertos de Data Science extraen información útil de una gran cantidad de datos facilitados por las compañías aseguradoras que permiten detectar patrones de actuación que identifican acciones fraudulentas.

Nuestra dilatada experiencia en el sector del fraude nos permite realizar un trabajo de predicción y detección con una alta fiabilidad ¿Hablamos? ¡Pregúntanos!

Recuento de los valores de la característica ‘gravedad del incidente’ para todos los incidentes fraudulentos

Recuento de los valores de la característica ‘gravedad del incidente’ para todos los incidentes no fraudulentos

Como se puede ver, a simple vista, la gravedad del incidente es distinta en los casos considerados “outliers”, posibles casos de fraude, y los que se consideran incidentes reales. Mientras en los posibles casos de fraude el grupo de gravedad que destaca es el número 3, “coste alto”, son los casos de gravedad 2, “coste medio” los que más sobresalen.

Con esta primera aproximación incluso se podrían sacar unos datos que pueden ser interesantes, como la probabilidad de que el incidente sea fraudulento como se muestra en esta tabla

GrupoProbabilidad de fraude (%)
17
211
360
413

Naturalmente como un “grano no hace granero”, una característica no determina si un caso es fraudulento o tiene grandes indicios de serlo, un conjunto de características nos pueden ayudar a acotar el problema.

La ciencia de datos nos brinda una oportunidad de poder combatir el fraude en sectores tan sensibles como las compañías aseguradoras, pero no es el único campo de aplicación, en BOTECH aplicamos esta tecnología en la detección del fraude en otros sectores como el banquero, o la búsqueda de posibles “insiders” en una compañía.