La CAF utilise le datamining - "technique de profilage" - pour repérer les dossiers à risques. Ce serait bien de connaître les "caractéristiques" privilégiées. La nationalité ? le fait d'avoir un titre de séjour court ? le fait d'être vieil-le étranger-e, de ne plus travailler et de présenter un risque statistique plus élevé de s'absenter longtemps du territoire ? le fait d'habiter Stains plutôt que Neuilly ? Le fait d'être pauvre ?

La nouvelle arme des CAF contre la fraude
Paru dans Protection Sociale Informations, N° 797 du 31/08/2011

Depuis 2004, la branche famille teste le datamining, une technique de profilage des dossiers à risques, qui doit être généralisée à toutes les CAF au 1er octobre.

La mise en oeuvre du data-mining vise à améliorer le caractère prédictif des contrôles », explique la Caisse nationale des allocations familiales (Cnaf). Autrement dit, il s’agit de contrôler moins, mieux et au bon moment. « Cette technique de fouille de données permet, après avoir dégagé et pondéré les caractéristiques principales des dossiers reconnus comme risqués ou frauduleux, de profiler nos dossiers et de cibler les contrôles sur ceux qui correspondent le plus au modèle », expliquait Hervé Drouet, le directeur de la Cnaf, auditionné par la Mission d’évaluation et de contrôle des lois de financement de la Sécu (Mecss) de l’Assemblée nationale, le 21 octobre 2010 (PSI n° 758). Le meilleur ciblage des contrôles doit aboutir à réduire les charges de gestion liées à des contrôles inutiles. Et l’anticipation du moment des contrôles doit permettre une baisse des montants d’indus. « Les contrôles étant plus efficaces, le taux d’indus et de rappels devrait être plus élevé, mais les montants d’indus devraient, eux, diminuer du fait de l’anticipation des contrôles », indique la Cnaf.

La plus-value du data-mining est de permettre d’analyser des milliers d’informations, qui du fait de leur volume ne sont pas analysables intellectuellement, ou qui, prises séparément, n’ont pas de sens. Expérimentée d’abord dans cinq CAF, la technique a été ensuite testée dans 17 organismes (Annonay, Carcassonne, Bourges, Blois, Agen, Bordeaux, Mâcon, Lille, Limoges, Créteil, la Réunion, Nice, Marseille, Toulouse, Nantes, Montauban, Perpignan) sur des modèles plus perfectionnés, portant sur des risques génériques comme la charge d’enfant, l’isolement ou encore le revenu de solidarité active. « L’efficience du datamining est confirmée : le rendement global évolue de manière significative », assure pudiquement la direction. À la CAF de Bordeaux, le data-mining a fait passer les taux de régularisation de 30 % à 40 %, précisait Daniel Buchet, responsable de la lutte contre la fraude, devant la Mecss.