Cudze chwalicie,
swego nie znacie: czyli polski system do rozpoznawania obrazu
twarzy.
Kiedy osoby postronne zapytać o systemy rozpoznawania
twarzy, odpowiadają często, że tak, owszem, ale nie u nas. Wysoka
technologia, duże koszty, ogólnie mówiąc "gdzieś na
Zachodzie, albo w Ameryce". Nic bardziej błędnego. Na
polskim rynku funkcjonują już firmy proponujące działające rozwiązania,
a co więcej: mogące poszczycić się udanymi wdrożeniami.
Jednym z dostawców jest działająca od 1991 roku firma POLIXEL
S.A. oferująca rozwiązania dla telekomunikacji i systemy
do monitoringu. Wśród oferowanych przez nią rozwiązań znajduje
się m. innymi system Monitoringu i Nadzoru M3S. Producent rekomenduje
go przede wszystkim do:
Rozpoznawanie twarzy
Technika, która firma proponuje do rozpoznawania twarzy, oparta
jest o algorytm analizy składowych głównych (PCA) oraz
liniową analizę dyskryminacyjną Fisher'a (LDA).
Analiza głównych składowych (ang. Principal Component
Analysis, PCA) jest to metoda umożliwiająca wnioskowanie o obiektach
opisanych wieloma zmiennymi (np. człowiek może być opisany przez
wagę, wzrost, kolor włosów, wiek itd.) . Metoda ta dopasowuje
do chmury punktów w przestrzeni wektorowej tworzonej przez N
przypadków opisywanych każdy przez K zmiennych (obserwacje opisywane
przez oryginalne zmienne) nowe wzajemnie prostopadłe osie.
Liniowa Analiza Dyskryminacyjna (ang. Linear discriminant
analysis, LDA) i związana z nią liniowa analiza dyskryminacyjna
w oparciu o kryterium Fishera (ang. Fisher's linear discriminant,
FLD) są używanie do znalezienia liniowej kombinacji cech, które
najlepiej rozróżniają dwie lub więcej klas obiektów lub zdarzeń
(np. dwie różne twarze człowieka). Wynikowe kombinacje są używane
jako klasyfikator liniowy lub, częściej, służą redukcji wymiarów
do późniejszej klasyfikacji statystycznej.
Najpierw system musi wiedzieć, że to co widzi kamera to twarz.
Nazywa się to często etapem identyfikacji obrazu twarzy na obrazie
wejściowym. Ponieważ proponowany algorytm rozpoznawania ma się
integrować z systemami monitoringu, przyjęte zostało rozwiązanie
oparte o estymację ruchu. Pozwala ono na dość szybkie i łatwe
wyodrębnienie obrazu twarzy z nagrania.

Po zlokalizowaniu obraz twarzy musi być wydzielony
i znormalizowany do rozmiarów, które pozwalają na jego porównanie
ze wzorcem. Zostaje również przefiltrowany, tak aby dane były
jak najbardziej "czyste", pozbawione szumów i zakłóceń spowodowanych np. tłem.
Taki wyfiltrowany obraz twarzy poddawany jest przekształceniom
mającym na celu wyłonienie dla niego określonej liczby
cech, stanowiących identyfikator twarzy, czyli konstruowane
są tzw. deskryptory. Porównanie deskryptorów pozwala wyłonić
te z nich, które pasują do siebie najlepiej. Różnica pomiędzy
nimi określa funkcję podobieństwa obrazów twarzy i służy identyfikacji
oraz weryfikacji.

Rys: "Przykładowy schemat instalacji
systemu M3S"
M3S zamierza użyć np. kierownictwo klubu Wisły Kraków do ochrony
swoich meczów. System odpowiadał by za wyłowienie z
tłumu i zidentyfikowanie pseudokibiców, wcześniej zarejestrowanych
w bazach danych klubu. Pozwoliło by to na zablokowanie drogi
na stadion agresywnym i nieobliczalnym kibolom, zminimalizowało
prawdopodobieństwo burd podczas meczu.
Więcej informacji o systemie można uzyskać na stronach producenta:
www.polixel.pl