Haku

Automated multi-modal recognition of school violence

QR-koodi

Automated multi-modal recognition of school violence

Abstract School bullying is a common social problem among teenagers that occurs in various ways, and physical violence is considered the most harmful. However, all the existing methods for reporting school violence are human-driven, making them inconvenient for victims to use. The author’s research group therefore aims to develop automatic violence recognition methods. First, this thesis proposed a Fuzzy Multi-Threshold algorithm. However, as more activities involving players of different ages and genders were added, it failed to perform effectively. A Proportional K-Nearest Neighbors algorithm was therefore proposed to address this issue, achieving an average recognition accuracy of 80%. Speech emotion recognition was then incorporated. Time- and frequency-domain motion features were extracted for activity recognition, while Mel Frequency Cepstrum Coefficients were extracted for emotion recognition. A Back Propagation Neural Network was used as the classifier, achieving an average accuracy of 87.8%. To further enhance recognition performance, an additional movement sensor was utilized. Motion features were separately extracted from each sensor. An improved Relief-F algorithm was proposed to select useful and low-redundancy motion features, while a Radial Basis Function neural network was used as the classifier. An improved Dempster-Shafer fusion algorithm was proposed to combine the classification results of each sensor. An average recognition accuracy of 93.6% was achieved. To address the problem of bullies removing wearable sensors, an image-based violence recognition was proposed. Surveillance cameras capture images, and target-detecting algorithms and morphological processing methods were utilized to detect foreground targets. A circumscribed rectangular frame (CRF) integration method was proposed to refine the detected targets. CRF features and optical flow features were extracted, and three different selection methods were employed to select useful features. A Decision Tree – Support Vector Machine classifier was designed, achieving an average recognition accuracy of 97.6%. In summary, this thesis proposed two primary methods for recognizing school violence: movement-sensor-based; and surveillance camera-based. Both methods demonstrated satisfactory recognition results, suggesting the potential for the automatic detection of incidents of school violence.

Tiivistelmä Koulukiusaaminen on teini-ikäisten yleinen sosiaalinen ongelma, ja sitä tapahtuu monin tavoin fyysisen väkivallan ollessa vahingollisin. Nykyiset kouluväkivallasta ilmoittamisen menetelmät ovat kuitenkin uhrin aloitteeseen perustuvia ja näin ollen epämukavia käyttää. Tässä tutkimustyössä kehitetään kouluväkivallan tunnistamismenetelmiä, jotka havaitsevat kiusaamistapahtumat automaattisesti. Työssä kehitettiin ensin Fuzzy Multi-Threshold -algoritmi, joka kykeni luokittelemaan seitsemän erityyppistä fyysistä aktiviteettia. Ratkaisu kuitenkin menetti tarkkuuttaan, kun aineistoa laajennettiin eri-ikäisillä ja erisukupuolisilla koehenkilöillä. Seuraavaksi kehitettiin Proportional K-Nearest Neighbors -algoritmi ja tuloksena oli 80 % tunnistamistarkkuus. Ratkaisuun lisättiin emootion tunnistus puhesignaalista. Fyysisen aktiivisuuden piirteet laskettiin liikesignaalin aika- ja taajuusalueista ja puheäänen Mel Frequency Cepstrum Coefficients -piirteet laskettiin tunteiden tunnistamiseksi. Back Propagation -neuroverkko antoi tunnistustarkkuudeksi 87,8 %. Ratkaisuun lisättiin toinenkin liikeanturi ja piirteet laskettiin molemmista anturisignaaleista. Työssä kehitettiin parannettu Relief-F-algoritmi parhaiden piirteiden valintaan liikkeen ominaisuuksista. Luokittelijana käytettiin Radial Basis Function -neuroverkkoa. Anturien tuottamien signaalien luokittelutulosten yhdistäminen tehtiin Dempster-Shafer-fuusioalgoritmilla, jolloin saavutettiin 93,6 % luokittelutarkkuus. Koska on mahdollista, että kiusaajat poistavat puettavat anturit tai älypuhelimet, kehitettiin vaihtoehtoinen tapa tunnistaa kouluväkivalta videokuvien perusteella. Valvontakameran kuvan edustassa sijaitsevien kohteiden paikantamiseksi käytettiin kohteen havaitsemisalgoritmeja ja morfologisia operaatioita. Kohteen ympäröivälle suorakaiteelle laskettiin kuvapiirteet sisältäen optisen virtauksen piirteet, ja niistä valittiin parhaat kolmella eri piirteenvalintamenetelmällä. 2-kerroksinen luokittelija Decision Tree – Support Vector Machine -tekniikka tuotti tunnistustarkkuuden 97,6 %. Yhteenvetona, tässä työssä kehitettiin kaksi vaihtoehtoista menetelmää tunnistaa kouluväkivalta, eli liiketunnistimeen ja puheäänen analyysiin perustuva sekä valvontakameraan perustuva. Kehitetyt ratkaisut tarjoavat mahdollisuuden havaita kouluväkivallan tapahtumat automaattisesti ja suojata näin teini-ikäisiä kouluväkivallalta.

Tallennettuna:
Kysy apua / Ask for help

Sisältöä ei voida näyttää

Chat-sisältöä ei voida näyttää evästeasetusten vuoksi. Nähdäksesi sisällön sinun tulee sallia evästeasetuksista seuraavat: Chat-palveluiden evästeet.

Evästeasetukset