diff --git a/diploma.pdf b/diploma.pdf index 2376c5a..5ff6127 100644 Binary files a/diploma.pdf and b/diploma.pdf differ diff --git a/diploma.tex b/diploma.tex index d6352fd..ec28e61 100644 --- a/diploma.tex +++ b/diploma.tex @@ -379,7 +379,7 @@ Zahvala gre tudi družini za podporo pri pisanju diplomskega dela. \bigskip %\noindent\textbf{Povzetek:} -\noindent Diplomsko delo predstavlja implementacijo trenutno vodilne metode za geolokalizacijo brezpilotnih letalnikov, ob izgubi sistema za določanje položaja, implementacija ni bila javno dostopna. +\noindent Diplomsko delo predstavlja implementacijo trenutno vodilne metode za geolokalizacijo brezpilotnih letalnikov, ob izgubi sistema za določanje položaja; implementacija ni bila javno dostopna. V okviru dela smo ustvarili novo podatkovno zbirko, ki vsebuje pare slik iz brezpilotnega letalnika in pripadajočih satelitskih posnetkov. Osredotočili smo se na uporabo naprednih nevronskih mrež, zlasti na piramidni vision transformer (PVT). Ključno vlogo je imela siamska nevronska mreža za primerjavo vzorcev med obema vrstama slik. @@ -407,13 +407,13 @@ Delo zaključujemo s poudarkom na ključnih ugotovitvah in potencialu razvite me \bigskip %\noindent\textbf{Abstract:} -\noindent The thesis presents the implementation of the currently leading method for geolocation of unmanned aerial vehicles, in the event of a loss of the positioning system. -As part of the work, we created a new database containing pairs of images from unmanned aerial vehicles and corresponding satellite images. -We focused on the use of advanced neural networks, especially convolutional networks, transformer architecture, and its derivatives, such as Vision Transformer (ViT) and Pyramid Vision Transformer (PVT). -The Siamese neural network played a crucial role in comparing samples between the two types of images. -The methodology was supported by various optimization strategies, including the use of stratified sampling, Hanning window, and regularization techniques. +\noindent The thesis presents the implementation of the currently leading method for geolocation of unmanned aerial vehicles, in the event of a loss of the positioning system; the implementation was not publicly available. +As part of the work, we created a new dataset containing pairs of images from unmanned aerial vehicles and corresponding satellite images. +We focused on the use of advanced neural networks, especially the pyramid vision transformer (PVT). +A key role was played by the siamese neural network for comparing patterns between the two types of images. +The methodology was supported by various optimization strategies, including the use of stratified sampling, the Hanning window, and regularization techniques. The results confirm the effectiveness of the proposed method for accurate geolocation of unmanned aerial vehicles. -We conclude the work by emphasizing the key findings and the potential of the developed method. +We conclude the work with an emphasis on key findings and the potential of the developed method. \bigskip \noindent\textbf{Keywords:} \tkeywordsEn. @@ -1028,15 +1028,12 @@ Rezultat je toplotna karta iste velikosti kot vhodna satelitska slika v modelu W \subsection{Modul za izluščenje značilnosti} -Model WAMF-FPI temelji na strukturi, ki je podobna siamski arhitekturi, vendar se od tradicionalnih metod sledenja objektom loči v določenih ključnih točkah, ki jih bomo v tem razdelku opisali. -Zaradi občutne razlike med satelitskimi slikami in slikami brezpilotnega letalnika, ki izvirajo iz različnih naprav, veji modela WAMF-FPI za vsako od teh vrst slik ne uporabljata metode deljenja uteži. WAMF-FPI kot vhod uporablja satelitske slike dimenzij 400 × 400 × 3 in slike brezpilotnega letalnika dimenzij 128 × 128 × 3. Značilnosti obeh vrst slik so izluščene s pomočjo PCPVT-S. - V modelu smo odstranili zadnjo stopnjo PCPVT-S in uporabili samo prve tri stopnje za izluščene značilnosti. Pri dimenzijah vhodnih slik 400 x 400 x 3 in 128 x 128 x 3 oba pristopa pridobita značilnostne mape z obliko 25 x 25 x 256 in 8 x 8 x 320. -V primerjavi z Deit-S \cite{touvron2020training}, ki je bil uporabljen v FPI \cite{dai2022finding}, ima PCPVT-S piramidno predstavitvijo. +V primerjavi z Deit-S \cite{touvron2020training}, ki je bil uporabljen v FPI \cite{dai2022finding}, PCPVT-S uporablja piramidno predstavitev. Ta struktura je bolj prilagojena za naloge goste napovedi. Pravzaprav uporaba piramidne predstavitve zagotavlja osnovo za kasnejšo integracijo modula WAMF. Poleg tega mreža s piramidno predstavitvijo lahko zmanjša obseg potrebnih izračunov in s tem izboljša hitrost procesiranja, kar je ključno za učinkovito uporabo metode v praksi.