Choix méthodologiques

Certains problèmes doivent être résolus pour tenir compte de la forme particulière des données à sérialiser.

 

1. La période couverte par chaque enquête

Comme chaque campagne nationale concerne les deux années antérieures, les résultats de deux enquêtes consécutives comportent un recouvrement d’une année – par exemple 2011 figure dans la période observée par l’enquête 2012 mais aussi par l’enquête 2013. En ne retenant que la dernière année de chaque campagne, on évite tout recouvrement mais plusieurs éléments plaident en faveur de la prise en compte des deux années :

  • un phénomène d’oubli : quand l’année la plus récente (n-1) de la période observée dans une campagne devient l’année la plus ancienne (n-2) de la période sous examen dans la campagne suivante, on observe une forte déperdition des réponses lors de la seconde passation.
  • un télescopage vers l’avant : des incidents localisés en (n-1) lors de l’enquête en n tendent à être reclassés par les enquêtés en (n-1) lors de l’enquête en (n+1) alors qu’ils devraient se retrouver en (n-2).

            Ainsi, conserver chaque fois les deux années observées dans chaque enquête permet de stabiliser les taux, de les ‘moyenner’ en quelque sorte en amortissant les effets combinés de l’oubli et du télescopage. Cette manière de procéder revient à opérer sur des sortes de moyennes mobiles.

            La période observée dans les enquêtes régionales et locales est de trois ans. A fins de comparaison avec les données nationales, on n’a pris en compte que les deux dernières de ces trois années.

 

2. La multivictimation

Un deuxième problème concerne le nombre de fois où un même individu peut avoir été victime de la même sorte d’incident au cours des deux ans couverts par l’enquête.

L’intensité d’une victimation dépend de deux paramètres :

  • le périmètre de la population touchée  mesuré par la prévalence;
  • la répétitivité de cette victimation  mesurée par l’incidence.

On calcule donc un nombre moyen de victimations. La plupart des enquêtés annoncent une ou quelques victimations au cours de la période observée, mais un petit nombre avance des chiffres beaucoup plus élevés, 80 ou 120… On peut admettre sans difficulté qu’un enquêté est capable de compter avec précision un petit nombre d’incidents, il est beaucoup plus douteux qu’un chiffre élevé puisse correspondre à un décompte précis. Il est vraisemblable qu’il s’agit plutôt d’une façon imagée de dire ‘beaucoup’. Pour éviter que le petit nombre d’enquêtés avançant des chiffres d’incidents très élevés pèse démesurément[1] sur la valeur moyenne, on pratique généralement une troncature (capping). Une autre raison incline aussi à procéder ainsi : le recours à une valeur centrale comme la moyenne n’a de sens que si la distribution est à peu près normale, ce qui ne serait pas le cas si on maintenait une queue de comète de valeurs très élevées.

Dans les sérialisations nationales, la valeur de la troncature est imposée d’emblée pour des raisons d’homogénéité de la série, puisque les EPCV avaient choisi de pratiquer une troncature a priori telle que [3+=4] qu’il faut donc adopter pour toutes les autres enquêtes.

Calculer un nombre moyen de victimations sans pratiquer de troncature conduirait à des résultats supérieurs à ceux observés quand une troncature est utilisée. Cependant, la différence est en règle habituelle plus faible pour les enquêtes nationales opérant sur une plus courte période que pour les enquêtes régionales ou locales. Pour les agressions cependant, on observe toujours une différence notable entre le nombre moyen de victimations calculé sans troncature et celui qui l’est après ce préalable (Robert & al., 2008).

 

3. Les violences à répétition

Un troisième problème naît du fait que les enquêtes n’interrogent en détail, pour chaque victimation, que sur l’incident le plus récent. Cette façon de faire ne crée pas de difficulté particulière pour les différentes victimations patrimoniales : chacune constitue un ensemble suffisamment homogène pour qu’on n’ait pas à s’interroger sur le degré de ressemblance entre l’incident le plus récent et les autres. Il en va différemment pour les agressions qui recouvrent une grande variété de situations. Or, ce problème de l’intensité constitue un des aspects les plus importants de cette victimation.

Lors d’une ébauche antérieure de mise en série( Lagrange & al., 2004) , nous avions conclu que le postulat selon lequel ‘les incidents précédents sont de même gravité’ exagérait la fréquence des agressions les plus sérieuses[2]. Nous avions donc appliqué un coefficient correcteur à toutes les enquêtes en supposant, faute d’autre information, que l’excès observé dans cette enquête se retrouvait tel quel toutes les autres années. 

Cependant, il est difficile de décider de la valeur d’un coefficient correcteur applicable à toutes les enquêtes : celui tiré de l’enquête sur 1997-1998 reste isolé dans un nombre d’enquêtes nationales qui a sérieusement grandi ; et les observations issues de monographies urbaines[3] ne fournissent pas un coefficient stable applicable d’emblée à des données nationales. En fin de compte, nous ne redresserons pas les données par sorte d’agression ; nous calculerons la multivictimation en supposant que les violences antérieures sont de même nature que la plus récente, la seule décrite en détail.

Dans les enquêtes CVS, on n’interroge plus globalement sur les agressions en général, mais séparément sur les violences physiques, les menaces, les injures et les vols violents et, pour chacune de ces catégories, on interroge ensuite en détail sur le plus récent incident seulement. On explique plus bas la solution permettant d’en comparer les résultats à ceux des autres enquêtes.

 

4. Pondérations

Doit-on tenir compte des pondérations calculées par l’INSEE pour améliorer la représentativité de ses enquêtes ou travailler sur les résultats bruts ?

La difficulté vient du fait que la méthode de pondération  a varié au cours du temps, notamment avec la prise en compte des non-répondants lors du passage des EPCV aux CVS. On se retrouve donc avec une série de coefficients de pondération correspondant à différentes méthodes de calcul.

Pour déterminer le meilleur choix, on a testé l’effet des différentes pondérations ou de l’absence de pondération sur une victimation de ménage (les cambriolages) et une victimation individuelle (l’ensemble des agressions).

Quelle que soit la pondération utilisée, les résultats ne varient que de manière imperceptible, de l’ordre de la décimale. Les résultats bruts s’écartent un peu plus des résultats pondérés mais ces variations restent très faibles, en moyenne de 1,15 (sans pondération) à 1,76 (avec pondération). Au total, les sérialisations conservent la même allure quel que soit le choix opéré.

            On a donc résolu de travailler sur les échantillons pondérés proposés par l’INSEE pour chaque enquête.

 

5. La comparaison avec d’autres mesures de la délinquance

Une autre source, les statistiques de police, enregistre[4] les procès-verbaux adressés par la police et la gendarmerie nationales au parquet pour des crimes et délits. En sont exclus les contraventions[5], le contentieux de circulation[6], les homicides et blessures par imprudence[7], des affaires traitées par d’autres institutions, comme le fisc, la douane, l’inspection du travail ou la Commission des opérations de bourse. Depuis les années 1970, les données enregistrées étaient réparties en 107 index[8]. Cette statistique était traditionnellement compilée au ministère de l’Intérieur par la Direction centrale de la police judiciaire (DCPJ). Depuis 2014, elle est produite, toujours au même ministère par un Service statistique ministériel de la sécurité intérieure (SSM-SI)[9] qui met en ligne des notes d’actualité, de conjoncture, de thème et de méthode sous le titre Interstats. Antérieurement à la création du SSM-SI, la Police nationale et la Gendarmerie nationale avaient chacune entrepris de modifier profondément leur système de collecte de l’information statistique. Un rapport de l’Inspection générale de l’Administration[10], épaulée par celle de l’INSEE, a tenté de dresser un bilan de la manière dont cette réforme avait été réalisée, chacune de leur côté, par les Directions générales de la Police et de la Gendarmerie[11].

     Cette statistique policière mesure en premier lieu l’action des organisations et de leurs agents. Ce n’est qu’à titre de variable indirecte qu’elle peut servir aussi à compter la délinquance commise : l’utiliser comme variable complémentaire des enquêtes de victimation constitue donc une opération complexe. Les enquêtes de victimation et les données policières obéissent à des logiques différentes, les rendre comparables suppose de délicats exercices méthodologiques parce que :

  • les enquêtes sont de nature probabiliste[12] et donnent des résultats à l’intérieur d’intervalles de confiance alors que les statistiques administratives avancent des dénombrements en valeur absolue ;
  • les enquêtes comptent d’abord des personnes ou des ménages tandis que les statistiques policières enregistrent d’abord des procès-verbaux adressés au Parquet ;
  • les questions des enquêtes sont formulées dans un vocabulaire susceptible d’être compris à peu près de la même manière par tous les enquêtés tandis que les statistiques utilisent des catégories juridiques plus ou moins mâtinées de considérations de la pratique policière et réparties en index selon des unités de compte qui varient d’un cas à l’autre.[13]

Concrètement, leur mise en comparaison suppose de procéder à des transformations de données d’un côté et de l’autre. Si on rapporte le taux d’incidence à la population de référence (ménages ou individus)[14], on obtient des estimés en valeur absolue. On parvient alors à une mesure comparable à celle des statistiques policières.

Pour analyser la différence entre les deux sources, on recourt à l’incidence apparente où l’on ne tient compte que des victimations pour lesquelles les enquêtés déclarent avoir déposé plainte. Si l’on admet que, pour la criminalité à victime directe, la police est principalement approvisionnée par les plaintes, ses comptages doivent en principe s’inscrire dans l’ordre de grandeur de ces estimés d’incidence apparente.

            Restait à sélectionner, parmi les données policières disponibles, celles comparables aux questions de victimation posées dans les enquêtes. Chaque page de l’OSCJ indique les index policiers retenus pour la comparaison. Mais, on se heurte désormais à une nouvelle difficulté : le SSM-SI a abandonné à partir de 2022 l’ancien système des 107 index ; il a sélectionné dans les données policières un nombre restreint d’indicateurs : homicides, coups et blessures volontaires, violences sexuelles, vols avec violences, cambriolages de logements, vols de véhicules motorisés, vols dans des véhicules, vols d’accessoires sur véhicules automobiles, vols sans violence, destructions et dégradations volontaires, escroqueries, infractions à la législation sur les stupéfiants. Cette sélection représente 46 des 107 anciens index. Dès lors, comment poursuivre la sérialisation des données policières que nous utilisons ? Dans son bilan statistique pour 2021[15], le SSM-SI indique à quels anciens index correspond chaque nouvelle catégorie. On peut ainsi tester la possibilité d’utiliser telle ou telle nouvelle catégorie policière pour poursuivre la confrontation entre données de victimation et données policières. En outre, le SSM-SI publie désormais ses données à l’échelle de la France entière ; pour retrouver la France européenne, il faut travailler à partir des données départementales ou régionales (lorsqu’elles sont publiées).

            Par ailleurs, dans quelques cas où les enquêtes de victimation étaient muettes, on a mobilisé à leur place des statistiques publiques extra-pénales. La statistique sanitaire des causes de décès en est l’exemple le plus connu. Elle exploite les certificats médicaux préalables à la délivrance d’un permis d’inhumer et détaille les causes de décès, procurant ainsi une information alternative sur l’homicide volontaire depuis 1930, une criminalité quantitativement restreinte, mais très sensible. La comparaison avec la statistique de police est rendue aisée par le recours dans les deux cas à une même unité de compte, la personne décédée.

Il nous arrive aussi de recourir à des statistiques publiques extra-pénales pour préciser la signification des données provenant des enquêtes de victimation. C’est notamment le cas pour les débits frauduleux grâce à l’Observatoire de la sécurité des moyens de paiement (OSMP) de la Banque de France.

 

Références

Gagneron W., Ledorh M., Jobic Y., Proix É., 2014, L’enregistrement des plaintes par les forces de sécurité intérieure sur le ressort de la préfecture de police, Paris, Inspection générale de l’administration.

Le Bouillonnec J.-Y., Quentin D., 2013 Rapport d’information sur la mesure statistique des délinquances et de leurs conséquences, Paris, Assemblée Nationale, Commission des lois.

Rouzeau M., Sintive J-C., Loiseau Ch., Savin A. Kabla-Langlois I., Loron C., 2013, Rapport sur l’enregistrement des plaintes par les forces de sécurité intérieure, Paris, Inspection générale de l’administration.

SSM-SI, 2022, Insécurité et délinquance en 2021 : bilan statistique (Interstat, bilan)

 

 

Notes:

[1] Les tests effectués sur quelques enquêtes indiquent que le pourcentage de victimes indiquant un nombre d’incidents supérieur à celui retenu comme seuil de la troncature, ne dépasse 5% que dans 10 cas sur 63 (en laissant de côté les agressions sexuelles ou par un proche dont les effectifs sont trop faibles). À l’exception des vols de voiture à Gonesse (5,7%) et de ceux de deux roues à Saint-Denis (5,9%), il s’agit toujours des agressions ordinaires [5% à Saint-Denis, 7,3 en Île-de-France 1998-1999-2000, 7,7 à Aubervilliers, 7,9 dans l’EPCV 1997-1998, 8,4 à Gonesse, 10,9 à Aulnay et un pic à 13,2% dans l’EPCV 2003-2004, suivi d’un autre encore plus important de 19,6 dans l’EPCV 2004-2005].

[2] Celles ayant entraîné une incapacité de travail d’au moins huit jours et, à un moindre degré, les autres agressions physiques.

[3] Ces enquêtes locales (Saint-Denis, Aulnay-sous-Bois, Lyon, Aubervilliers et Gonesse) permettent de disposer d’informations non seulement sur l’agression la plus récente mais aussi sur un maximum de deux autres antérieures.

[4] Sous une forme sommaire et non publiée de 1950 et 1972, ensuite publiées par la Direction centrale de la police judiciaire (DCPJ) du ministère de l’Intérieur, maintenant par le Service statistique ministériel sur la sécurité intérieure (SSM-SI) du ministère de l’Intérieur.

[5] Les infractions les moins graves.

[6] Soit presque la moitié de ce que jugent les tribunaux correctionnels.

[7] La plus grande partie des atteintes à la personne physique.

[8] En fait, 103 effectifs.

[9] Créé à la suite du rapport parlementaire Le Bouillonnec (2013) et de celui de l’Inspection générale de l’administration, Rouzeau & al. (2013). Comme tous les services statistiques ministériels, celui-ci est dirigé par des statisticiens détachés de l’INSEE.

[10] Rouzeau et al., 2013

[11] Par ailleurs, le rapport Rouzeau a tenté, pour la première fois, d’estimer pour les années antérieures, l’impact global de pratiques vicieuses de saisie des données statistiques (Rouzeau, 2013, T1, 5sq) favorisées par la faiblesse des contrôles de qualité de l’enregistrement. Un travail analogue a été réalisé ensuite pour le ressort de la Préfecture de Police de Paris par un autre rapport de l’Inspection générale de l’Administration (Gagneron & al., 2014).

[12] Le tirage de l’échantillon est probabiliste ; les non–réponses (30% en moyenne sur les CVS) le déforment ce qui conduit l’INSEE à le redresser pour lui rendre son aspect initial. Par suite, on postule que l’enquête a conservé son aspect probabiliste initial, ce qui permet notamment de calculer des intervalles de confiance.

[13] Tantôt la victime (coups et blessures), tantôt l’auteur (stupéfiants), tantôt l’infraction (cambriolages).

[14] Certaines victimations (cambriolages, atteintes aux véhicules) étudiées atteignent tous les cohabitants d’une même unité de vie tandis que d’autres (vols personnels, agressions) ne concernent que celui qui en est victime.

[15] SSM-SI, 2022.