Петров, Георги (2008) Многомерна цифрова обработка и анализ на последователности от изображения : Автореферат на дисертация за получаване на научно образователна степен "доктор на НБУ" по научна специалност: 02.21.07 "Автоматизирани системи за обработка на информация и управление (по отрасли). PhD thesis, Нов български университет.
Preview |
PDF
Avtoreferat G12008-08-20.pdf 2MB |
Abstract
Настоящата дисертация (автореферат) акцентира върху модификацията, усъвършенстването и комбинирането на известни вероятностно статистически функционални модели за сегментиране на движението в системите за видео охрана и наблюдение (P. Iliev and L. Tsekov, 1993). Хипотезата която е изказана е да бъдат модифицирани методите за обработка и детекция на целите от системи за видео охрана, така че да станат приложими в системите за анализ, фрагментация и индексиране на видео филми. Анализирайки литературните източници (Greg P.,Ramin Z., 2005) е изказано предположението, че комбинирането на критериите на Колмогоров, Пийрсън и комплексен критерии за анализ на 3D хистограмите ще доведе до значително повишаване точността на детекцията на движение в сравнение с 2D хистограмния модел. Отчитайки особеностите на видео филмите е предложена модификация на цветния хистограмен подход (Yu-Jin Zhang, p41-57, 2007) и модификация на обектния контраст на изображенията (Stefan Winkler, p71-103, 2005), като елемент на визуалния модел за сегментиране на визуални сцени максимално близък до човешкото възприятие. Основна разлика на предлагания време пространствен 2D ентпориен модел даден от (Yu-Fеi Ma, Hong-Jiang Z. 2006) е използването вероятностно статистически критерии за 3D хистограмите. Друга разлика с (Roland M. 2005) е ползването на глобални вероятностно статистически методи вместо локални, което прави задачата по-лесно приложима върху големи обемни от цифрови видеозаписи без налична допълнителна информация за тяхното съдържание. Анализирани са вероятностно статистическите алгоритми за филтрация на цифрови видео филми (A2, A8, A9, 22, 32, 50, 76, 83, 84, 123, 136, 145), както и други методи за предварителна обработка чрез бърза Фурие и косинусова, Уолш-Адамар и Уеивлет трансформация (2, 11, 14, 33, 52, 53, 59, 60, 65, 72, 92), излизащи извън рамките на избрания от нас подход, като направените в тази посока публикации не са включени в общия списък на приложените публикации на дисертанта. За предварителна филтрация са изследвани два типа филтри: адаптивен модов (Д.Дончев, 2007) и медианен (Turney, R.D.; Reza, A.M.; Delva, J.G.R, 1999). Избрано е да бъде модифициран медианен филтър, чрез подбор на тегловни коефициенти (Gonzalo R. Arce, p139-180, 2005), което го прави подходящ за софтуерна реализация при филтърни ядра с малки размери 3х3 особено подходящо за изпълнение върху стандартни процесорни архитектури. Като основен информационен показател е избрано да бъде ползвана 2D и 3D ентропийната функция (C.K.Leung, F.K.Lam, 1997), като новото, е че изчислението на ентропията се прилага многократно, за да се осигури квантуване на изображенията на 4 или 8 нива (конкретната разработка е наградена, като оригинален функционален модел със съществени приноси - вж. сп. НАУКА кн.5 2009г.том XIX, издание на СУБ). На база анализа на 3D хистограмния модел за обработка и анализ на изображения е изказана и експериментално доказана хипотеза, че изполването на 4D нормирани хистограми в цялата последователност от семантично свързани изображения е особено удобно и универсално средство за сравняване на времепространствени последователности от 2D и други изображения за нуждите на мултимедията. Експериментално са избрани метрики за класификация на хистограмите на изображенията (Pavel Z,, Giuseppe A., Vlastislav D.,2005), като е предложена комбинирана метрика за качеството на изображенията и точността при фрагментация с ключови кадри (Heinrich H.B., Seong-Whan Lee, Tomaso A.P., C.W. (Eds.), p230-240, 2002). Предложени са коефициенти за определяне точността на методите за автоматизирана фрагментация на цифрови видеозаписи: TKFC, MKFI и KFDI. Използвана е комплексна метрика на качеството за цели семантично свързани последователности от изображения, комбинираща PSNR и MSE и контрастите в локалните ентропийно сегментираните области, третиращо последователността от кадри, като обособен уникален 3D обект. Така модифицираните методики за обработка, анализ и определяне на качеството позволяват създаването на параметрични многомерни идентификатори за описание на визуални сцени без човешка намера. Авторът счита, че методите запазват своята оригиналност и полезност предвид все по-масовото навлизане на устройства и системи генериращи големи обеми цифрови изображения (вкл. от видеоохранителни системи и за анализ на предаванията по телевизонните канали и др.), които следва да се съхраняват, предават и анализират автоматично.
Заб. Следва да се има предвид, че към настоящата дата (30.10.2012) представените в дисертацията авторски софтуерни модули не представляват интерес от гледна точка на бързодействие особено при наличие на мащабируеми и достъпни GP-GPU платформи.
Item Type: | Thesis (PhD) |
---|---|
Additional Information: | TITLE: Multidimensional digital image sequences processing and analysis, AUTHOR: Georgе Petrov |
Uncontrolled Keywords: | 3D histogram |
Subjects: | Computer science and information technologies > Computer science. Computer programming Telecommunication > Telecommunication systems and technology |
ID Code: | 1504 |
Deposited By: | Georgi Kostadinov Petrov |
Deposited On: | 05 Nov 2012 09:52 |
Last Modified: | 05 Nov 2012 09:53 |
Repository Staff Only: item control page