diff --git a/diploma.pdf b/diploma.pdf index 5cd5691..9c96a18 100644 Binary files a/diploma.pdf and b/diploma.pdf differ diff --git a/diploma.tex b/diploma.tex index a3b7819..b50cd00 100644 --- a/diploma.tex +++ b/diploma.tex @@ -378,14 +378,13 @@ Zahvala gre tudi družini za podporo pri pisanju diplomskega dela. \bigskip %\noindent\textbf{Povzetek:} -\noindent Diplomsko delo se osredotoča na uporabo naprednih nevronskih mrež za lokalizacijo brezpilotnih letalnikov s pomočjo satelitskih slik. -V uvodu je predstavljena temeljna terminologija in koncepti s področja nevronskih mrež. -V metodološkem delu so podrobno razložene konvolucijske nevronske mreže, transformerska arhitektura ter njeni derivati, kot sta Vision Transformer (ViT) in Piramidni vision transformer (PVT). -Posebno pozornost namenjamo Siamski nevronski mreži, ki je ključna za primerjavo vzorcev med satelitskimi in slikami iz brezpilotnega letalnika. -Podatkovna množica, uporabljena za učenje in testiranje, vključuje slike brezpilotnega letalnika in satelitske slike. -V razdelku rezultatov so predstavljene ključne faze implementacije, učenja modela, izbire kriterijske funkcije ter različne optimizacijske strategije, kot je uporaba stratificiranega vzorčenja. -Poudarjena je tudi vloga Hanningovega okna in regularizacijskih tehnik, kot je izpuščanje nevronov. -Delo zaključujemo s sklepnimi ugotovitvami, ki poudarjajo potencial in učinkovitost predlagane metode za natančno lokalizacijo brezpilotnih letalnikov. +\noindent Diplomsko delo predstavlja implementacijo trenutno vodilne metode za geolokalizacijo brezpilotnih letalnikov, ob izgubi sistema za določanje položaja. +V okviru dela smo ustvarili novo podatkovno zbirko, ki vsebuje pare slik iz brezpilotnega letalnika in pripadajočih satelitskih posnetkov. +Osredotočili smo se na uporabo naprednih nevronskih mrež, zlasti konvolucijskih mrež, transformerske arhitekture in njenih derivatov, kot sta Vision Transformer (ViT) in Piramidni vision transformer (PVT). +Ključno vlogo je imela Siamska nevronska mreža za primerjavo vzorcev med obema vrstama slik. +Metodologija je bila podprta z različnimi optimizacijskimi strategijami, vključno z uporabo stratificiranega vzorčenja, Hanningovega okna in regularizacijskih tehnik. +Rezultati potrjujejo učinkovitost predlagane metode za natančno geolokalizacijo brezpilotnih letalnikov. +Delo zaključujemo s poudarkom na ključnih ugotovitvah in potencialu razvite metode. \bigskip @@ -407,14 +406,13 @@ Delo zaključujemo s sklepnimi ugotovitvami, ki poudarjajo potencial in učinkov \bigskip %\noindent\textbf{Abstract:} -\noindent The thesis focuses on the use of advanced neural networks for the localization of drones using satellite imagery. -In the introduction, foundational terminology and concepts from the realm of neural networks are presented. -The methodology section provides a detailed exploration of convolutional neural networks, transformer architecture, and its derivatives like the Vision Transformer (ViT) and the Pyramid Vision Transformer (PVT). -Particular emphasis is given to the Siamese Neural Network, which is pivotal for comparing patterns between satellite and drone images. -The dataset used for training and testing encompasses drone images and satellite photos. -In the results section, key stages of implementation, model training, criterion function selection, and various optimization strategies, such as Stratified Sampling, are discussed. -The role of the Hanning window and regularization techniques like dropout is also highlighted. -The work concludes with final observations that underscore the potential and efficiency of the proposed method for precise drone localization. +\noindent The thesis presents the implementation of the currently leading method for geolocation of unmanned aerial vehicles, in the event of a loss of the positioning system. +As part of the work, we created a new database containing pairs of images from unmanned aerial vehicles and corresponding satellite images. +We focused on the use of advanced neural networks, especially convolutional networks, transformer architecture, and its derivatives, such as Vision Transformer (ViT) and Pyramid Vision Transformer (PVT). +The Siamese neural network played a crucial role in comparing samples between the two types of images. +The methodology was supported by various optimization strategies, including the use of stratified sampling, Hanning window, and regularization techniques. +The results confirm the effectiveness of the proposed method for accurate geolocation of unmanned aerial vehicles. +We conclude the work by emphasizing the key findings and the potential of the developed method. \bigskip \noindent\textbf{Keywords:} \tkeywordsEn. @@ -1042,9 +1040,11 @@ Na vsaki sliki je s pomočjo rdečega kroga označen center izreza, ki predstavl \chapter{Implementacija} \label{ch3} -V tem poglavju se bomo osredotočili na implementacijo modela WAMF-FPI, RDS metriko ter samo učenje modela. +V tem poglavju se bomo osredotočili na implementacijo modela WAMF-FPI, RDS metriko ter samo učenje modela. +Odločili smo se za lastno implementacijo metode, saj originalna koda iz članka \cite{wang2023wamf} ni bila javno dostopna. V naslednjem podpoglavju bomo podrobneje predstavili postopek implementacije. + \section{Implementacija metode WAMF-FPI} Sledenje objektov v okviru računalniškega vida običajno temelji na izračunu podobnosti med referenčno in iskalno podobo v trenutnem okviru. @@ -1384,7 +1384,7 @@ CWMSE & 0.007 & 0.07 & 0.06 & 242.70\\ \label{tab:metode} \end{table} -V tabeli \ref{tab:metode} prikazujemo napako v odstotkih za različne kriterijske funkcije glede na razdaljo. Iz tabele je razvidno, kolikšen delež primerov ima napako manjšo od določene razdalje. +V tabeli \ref{tab:metode_m} prikazujemo napako v odstotkih za različne kriterijske funkcije glede na razdaljo. Iz tabele je razvidno, kolikšen delež primerov ima napako manjšo od določene razdalje. \begin{table}[ht] \centering @@ -1393,9 +1393,9 @@ V tabeli \ref{tab:metode} prikazujemo napako v odstotkih za različne kriterijsk Kriterijska funkcija & $<$ 10m [\%] & $<$ 20m [\%] & $<$ 50m [\%] & $<$ 100m [\%] \\ \hline HANN & 65.22 & 71.66 & 75.87 & 81.45 \\ +GWMSE & 0.10 & 0.37 & 1.96 & 8.08 \\ +HWMSE & 0.00 & 0.10 & 1.35 & 6.71 \\ CWMSE & 0.05 & 0.22 & 1.93 & 8.59 \\ -MSE & 0.10 & 0.37 & 1.96 & 8.08 \\ -MSE & 0.00 & 0.10 & 1.35 & 6.71 \\ \hline \end{tabular} \caption{Rezultati ob uporabi različnih kriterijskih funkcij, kjer je prikazan odstotek primerov z napako manjšo od določene razdalje.}