Clustering and profiling traffic roads by means of accident data.

Auteur(s)
Geurts, K. Brijs, T. & Wets, G.
Jaar
Samenvatting

In the first part of this research, model-based clustering is used to cluster 19 central roads of Hasselt into distinct groups based on their similar accident frequencies for 3 consecutive time periods of each 3 years: 1992-1994, 1995-1997, 1998-2000. The observed accident frequencies are assumed to originate from a mixture of density distributions for which the parameters of the distribution, the size and the number of clusters are unknown. It is the objective of latent class clustering to ‘unmix’ the distributions and to find the optimal parameters of the distributions and the number and size of the clusters, given the underlying data. More specifically, we use a multivariate Poisson mixture model with one common covariance term to model the data. A general algebraic modelling system is used to maximise the loglikelihood function. The accident data are obtained from the Belgian “Analysis Form for Traffic Accidents” and contain a rich source of information on the different circumstances in which the accidents have occurred: course of the accident, traffic conditions, environmental conditions, road conditions, human conditions and geographical conditions. In the second part of this paper, the data mining technique of association rules is used to profile each cluster of traffic roads in terms of the available traffic accident data. The strength of this approach lies within the identification of accident circumstances that frequently occur together for each group of traffic roads. This can, in turn, make a strong contribution towards a better understanding of the accident circumstances in these clusters. (Author/publisher) Dutch abstract: In het eerste deel van dit onderzoek wordt ‘model based clustering’ toegepast om 19 centrale wegen in Hasselt in te delen in verschillende groepen op basis van hun gelijkaardige ongevalfrequenties in 3 opeenvolgende periodes van elk 3 jaar: 1992-1994, 1995-1997, 1998-2000. Er wordt verondersteld dat het geobserveerd aantal ongevallen afkomstig is van een aantal dichtheidsverdelingen waarbij de parameters van de verdelingen en het aantal verdelingen of clusters en de grootte van deze clusters onbekend zijn. Het doel van ‘latent class clustering’ is, gegeven de onderliggende data, deze afzonderlijke dichtheidsverdelingen en het aantal en de grootte van de clusters te identificeren. Meer bepaald maken we gebruik van een multivariaat Poisson mixture model met een gemeenschappelijke covariantieterm om de data te modelleren. Een algemeen algebraïsche modelleringsysteem wordt gebruikt om de loglikelihood functie te maximalizeren. De ongevallendata voor dit onderzoek zijn afkomstig van het Belgisch analyseformulier voor verkeersongevallen met lichamelijke letstel. Deze data bevatten een grote hoeveelheid aan informatie omtrent de omstandighden waarin deze ongevallen hebben plaats gevonden: verloop van het ongeval, verkeersgegevens, omgevingskarakteristieken, wegcondities, menselijke factoren en geografische kenmerken. In het tweede deel van dit onderzoek wordt dan ook gebruik gemaakt van de techniek van frequente sets om elke cluster van straten te profileren in termen van de bovengenoemde beschikbare ongevalsdata. De sterkte van deze data mining techniek is het identificeren van ongevalskarakteristieken. (Author/publisher) The report is available at: http://www.luc.ac.be/dam/Papers/2003_clustering.pdf

Publicatie aanvragen

12 + 0 =
Los deze eenvoudige rekenoefening op en voer het resultaat in. Bijvoorbeeld: voor 1+3, voer 4 in.

Publicatie

Bibliotheeknummer
C 33254 [electronic version only]
Uitgave

Diepenbeek, Steunpunt Verkeersveiligheid bij Stijgende Mobiliteit, 2003, 26 p., 24 ref.; Rapportnummer RA-2003-27

Onze collectie

Deze publicatie behoort tot de overige publicaties die we naast de SWOV-publicaties in onze collectie hebben.