Registratiegraad van in ziekenhuizen opgenomen verkeersslachtoffers

Eindrapport
Author(s)
Polak, Dr. P.H
Year

De aanleiding voor dit onderzoek naar de registratiegraad van verkeersslachtoffers die in een ziekenhuis zijn opgenomen (de doelpopulatie), is dat bekend is dat de politie niet alle verkeersongevallen registreert en dat het zowel politiek als beleidsmatig gewenst is het werkelijke aantal zo goed mogelijk te kennen.
Een van de manieren om tot een verantwoorde ophoging te komen, is koppeling van de VerkeersOngevallenRegistratie (VOR), op grond van opgaven van de politie, aan de Landelijke Medische Registratie (LMR), gebaseerd op in principe alle uit ziekenhuizen ontslagen patiënten. Hierop is het onderhavige onderzoek gericht geweest.
Een dergelijke koppeling is eerder uitgevoerd. In de veronderstelling dat er bij het registratieproces codeerfouten gemaakt kunnen worden en dat daardoor ten onrechte matches van records die dezelfde persoon betreffen niet plaatsvinden, is in dit project besloten bepaalde verschillen toe te laten bij de koppeling. Verder is, anders dan de vorige keer, het gehele VOR-bestand in het onderzoek betrokken en een grotere subset uit de LMR.

Een subset van de bestanden is beoordeeld op verschillen in coderingen van de zogenaamde koppelvariabelen, waarbij aan gevonden codeerfouten een verschillend gewicht is toegekend: hoe ongebruikelijker de fout, des te groter het gewicht. De aan fouten toegekende gewichten zijn meegenomen in een afstandsfunctie, waarmee de afstand tussen records uit enerzijds de VOR en anderzijds de LMR is bepaald.

Door nu koppeling nog toe te staan tot een bepaalde afstand, wordt de koppeling ongevoelig gemaakt voor veel voorkomende fouten. Ieder record wordt gekoppeld met zijn naaste buur uit het andere bestand, maar de afstand tussen die naaste buur en de op één na dichtstbijzijnde (de selectiviteit) wordt ook behouden. Zo wordt informatie verkregen over de uniekheid van de koppeling.
De gekoppelde records zijn ingedeeld naar mate van zekerheid dat de koppeling terecht heeft plaatsgehad. Daarbij is gebruik gemaakt van de afstand waarop gekoppeld is en de selectiviteit van deze match. Deze zekerheid liep van 100% voor met afstand 0 en grote selectiviteit gekoppelde records tot slechts enkele procenten als een grote afstand bestond. Om vervolgens ophoogfactoren te kunnen bepalen, is een nieuwe methode ontwikkeld, de ‘footprint-methode'. Daarbij is informatie over de vervoerswijze van de slachtoffers gebruikt, die bij de koppeling geen rol heeft gespeeld. Deze geeft onafhankelijke informatie over de juistheid van de koppeling.
De vervoerswijze wordt bij LMR en VOR volgens sterk verschillende codeerinstructies en -conventies geregistreerd. Dit leidt bij de met afstand 0gekoppelde records tot een duidelijk patroon van combinaties van de twee codeerwijzen: de ‘footprint'. Deze footprint is nu gebruikt om de aandelen correct gekoppelde records te bepalen in de met grotere afstand gekoppelde groepen records.

De informatie die deze analyse heeft gegeven is gebruikt om de omvang van de doelpopulatie vast te stellen in de beide bestanden. Ook is een schatting gemaakt van het deel dat in beide registraties ontbreekt. Hiermee kon de ophoogfactor voor alle in een ziekenhuis opgenomen verkeersslachtoffers bepaald.
Vervolgens zijn ophoogfactoren berekend voor twee indelingen van de slachtoffers waarvan de registratiegraad sterk afhankelijk is, namelijk de wijze van verkeersdeelname van het slachtoffer en de provincie waar het ongeval heeft plaatsgehad.

De resultaten zijn dat, gebaseerd op de bestanden over 1992 en 1993, het aantal ziekenhuisgewonden dat de politie opgeeft (gemiddeld 12065 per jaar), met een factor 1,64 moet worden vermenigvuldigd om het werkelijke aantal (gemiddeld 19745 per jaar) zo goed mogelijk te benaderen. Dit is circa 2% meer dan het gebruikelijke aantal verkeersslachtoffers volgens de LMR.
De ophoogfactoren naar wijze van verkeersdeelname lopen uiteen van 1,3 voor auto-inzittenden tot 2,5 voor fietsers. Voor provincies variëren de ophoogfactoren van 1,3 voor Zeeland tot 2,1 voor Friesland. Deze factoren zijn geldig voor de onderzochte jaren, maar aannemelijk is dat ze niet sterk fluctueren, zodat de verkregen factoren een aantal jaren gebruikt kunnen worden. Wel dient de koppeling op gezette tijden herhaald te worden om veranderingen in de registratiegraad vast te stellen.

De uit het onderzoek verkregen kennis over codeerfouten bij de registraties is samengevat in een foutencatalogus. Aanbevelingen zijn gedaan ter verbetering van de kwaliteit van beide bestanden.

Het onderzoek heeft tevens geleid tot de conclusie dat de ontwikkelde koppelingsmethode onder bepaalde voorwaarden ook gebruikt kan worden om andere bestanden te koppelen. Dit geldt met name voor bestanden waarbij veel informatie per record beschikbaar is, maar niet alle informatie foutloos of volledig wordt geregistreerd

The Registration Rate of Hospitalised Road Accident Victims

The reason for carrying out this research project into the registration rate by the police of those victims admitted to hospital (the target population) is that it is well known, that they do not record every accident. Both the politicians and the policy makers wish to know the actual number, as far as this is possible.
One of the ways of responsibly extrapolating the recorded numbers is to link the police data - as processed by the Traffic Accident Data Administration (TADA) of the Ministry of Transport - with the National Patient Register (NPR) of the Ministry of Health. The latter registers, in principle, áll discharged hospital patients. This project was based on this principle.
A similar linkage had already been carried out. This time certain differences between the two databases were tolerated, because it was assumed that coding mistakes occur during the processing whereby certain linkages were not made, in spite of the fact that they both concerned the identical person. Furthermore, this time the complete TADA file was used together with a larger sub-set of the NPR.

The validity of the two databases was judged using a sample set of the files and searching for coding differences of the so-called link variables. Discovered coding mistakes were then given a certain weighting: the more unusual the mistake, the bigger the weighting. The weightings of mistakes made were then used to calculate a so-called distance function. Here the distance between TADA and NPR records was calculated.

By permitting a certain maximum distance, the linkage was made unsusceptible to common mistakes. Every record was linked to its immediate neighbour from the other database. However, the distance between this immediate neighbour and the next closest (the selectivity) was also registered. Information was thus obtained over the uniqueness of the linkage. The linked records were assorted according to the extent of the certainty that the linkage was correct. The distance of the linkage and the selectivity of the linkage were used for this. This certainty varied from 100%, for linkage with a zero distance and a high selectivity, to a small percentage if the distance was great.
In order to be able to calculate the extrapolation factors, a new method was developed; the ‘footprint method'. For this the patient's modal split was used, even though it had played no part in the actual linkage. This provided independent information about the validity of the linkage.
TADA and NPR use very different definitions and coding instructions to determine the modal split. This resulted, for those records linked, having a zero distance, in a clear pattern of combinations of the two ways of coding; the ‘footprint'. This footprint was used this time to calculate the shares of the correctly linked records in those groups with a larger distance.

The information thus gathered was used to determine the size of the target population in both databases. An estimate was also made of that part missing in both databases. Using this, it was possible to calculate the extrapolation factor for all road traffic accident victims admitted to hospital.
Then the extrapolation factors were calculated for two types of patient for whom the registration rate is extremely dependant: viz. the victim's modal split and the province in which the accident occurred.

The results, based on the databases for 1992 and 1993, are as follows: the number of hospitalised accident victims which the police recorded (an average of 12,065 per year) has to be multiplied by a factor of 1.64 in order to approximate the actual number (an average of 19,745 per year). This is approx. 2% more than the usual NPR number.
The extrapolation factors for the modal split range from 1.3 for car occupants to 2.5 for cyclists. The extrapolation factors for the province vary from 1.3 for Zeeland to 2.1 for Friesland. These factors apply for the years researched, but it may be assumed that these do not differ much from year to year. The factors found may therefore be used for a number of years. It is however necessary to repeat the linkage with a certain frequency, to be able to calculate changes.

The knowledge obtained about the coding mistakes found in this project has been collected together in a catalogue. Recommendations have been made for improving the quality of both databases.

The project has also lead to the conclusion that, under certain circumstances, the linkage method developed can also be used for linking other databases. This applies especially to databases where a lot of variable per record are available, but not all variables are recorded completely and faultlessly.

Report number
R-97-15
Pages
154
Publisher
SWOV, Leidschendam

SWOV publication

This is a publication by SWOV, or that SWOV has contributed to.