Opis podatkovne mnozice izboljsan

main
Gašper Spagnolo 2023-09-02 15:03:13 +02:00
parent 35246616da
commit c95da8aed4
No known key found for this signature in database
GPG Key ID: 2EA0738CC1EFEEB7
14 changed files with 80 additions and 31 deletions

Binary file not shown.

View File

@ -798,12 +798,12 @@ y = \text{softmax}(W_2\text{ReLU}(W_1e))
\end{equation} \end{equation}
\end{center} \end{center}
Na sliki \ref{fig:vit} levo je videti kako se slika razdeli na pred vstopom v model. Na sliki \ref{fig:vit} je videti kako se slika razdeli na zaplate pred vstopom v model.
Na desni strani pa lahko opazimo, da sama arhitektura ViT uporablja klasičen transformerski kodirnik. Lahko opazimo, da sama arhitektura ViT uporablja klasičen transformerski kodirnik.
\begin{figure}[h] \begin{figure}[h]
\centering \centering
\includegraphics[width=\textwidth]{./img/vit.png} \includegraphics[width=0.6\textwidth]{./img/vit.png}
\caption{Skica ViT modela, iz članka \cite{vit}} \caption{Skica ViT modela, iz članka \cite{vit}}
\label{fig:vit} \label{fig:vit}
\end{figure} \end{figure}
@ -921,30 +921,22 @@ V primerjavi s tradicionalnimi metodami imajo siamske mreže večjo odpornost na
Zaradi globje hierarhične predstavitve slike so sposobne zaznati in primerjati kompleksne značilnosti, ki jih manj kompleksne metode morda ne bi opazile. Zaradi globje hierarhične predstavitve slike so sposobne zaznati in primerjati kompleksne značilnosti, ki jih manj kompleksne metode morda ne bi opazile.
\chapter{Podatkovna množica} \chapter{Podatkovna množica}
\todo{Dopolni poglavje z informacijami prejsnih datasetov}
\label{ch1} \label{ch1}
V raziskovalnem svetu je podatkovna množica ključnega pomena za razvoj, testiranje in validacijo modelov. V svetu raziskovanja je podatkovna množica ključnega pomena za razvoj, testiranje in validacijo modelov.
Kljub pomembnosti modela WAMF-FPI avtorji niso javno delili originalne podatkovne množice. Kljub obstoju številnih zbirk, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij, s katerimi se srečuje brezpilotni letalnik.
To je postavilo pred nas in vse druge, ki bi jih ta metoda lahko zanimala, izziv pri zbiranju primerne podatkovne osnove za analizo. Konkretno, CVUSA se osredotoča na zgradbe, medtem ko University-1652 predstavlja predvsem univerzitetna okolja.
Za doseganje konsistentnosti in kakovosti rezultatov smo se odločili samostojno kreirati in kurirati našo lastno podatkovno množico, ki odraža realne pogoje in scenarije uporabe.
Podatkovna množica, ki smo jo oblikovali, temelji na dveh glavnih virih vizualnih podatkov. Zaradi pomanjkljivosti obstoječih zbirk in odsotnosti specifične javno dostopne podatkovne zbirke UL14, ki so jo avtorji uporabili v \cite{dai2022finding}, smo se soočili z izzivom pri zbiranju primerne podatkovne osnove za analizo.
Prvi vir predstavljajo slike, pridobljene z brezpilotnimi letalniki. Da bi premostili to vrzel, smo se odločili za ustvarjanje lastne zbirke.
Te slike so bile pridobljene preko orodja Google Earth Studio \cite{google_earth_studio}, ki omogoča natančno in realno reprezentacijo terenskih značilnosti iz ptičje perspektive. Za pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \cite{google_earth_studio} in pridobili slike iz 11 večjih evropskih mest.
Te slike nudijo bogate detajle in so ključne za razumevanje fine strukture terena. Te slike odražajo raznolikost terena, vključno z zgradbami, parki, zelenimi in vodnimi površinami.
Dodatno smo uporabili Mapbox API \cite{mapbox_api} za pridobitev pripadajočih satelitskih slik.
Drugi vir podatkov predstavljajo satelitske slike, pridobljene preko Mapbox API \cite{mapbox_api}. Skupno je naša podatkovna množica obsežna in vključuje več kot 11.000 slik.
Satelitske slike prinašajo širši pogled na regijo in omogočajo razumevanje večjih geografskih in prostorskih vzorcev. V članku \cite{dai2022finding, wang2023wamf} so avtorji uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo.
V kombinaciji z slikami brezpilotnega letalnika te slike nudijo celovito sliko terena z različnih višin in ločljivosti. Ta zbirka se osredotoča večinoma na slike stavb večjih kitajskih univerz. V nasprotju s tem naša zbirka ponuja širši spekter značilnosti za analizo in bolje odraža realne okoliščine.
Cilj izdelave naše zbirke je bil zagotoviti raznolike podatke, ki bi lahko služili kot robustna osnova za testiranje in validacijo naše implementacije WAMF-FPI.
Skupno naša podatkovna množica vključuje več kot 11.000 slik posnetih z brezpilotnim letalnikom in njihovih pripadajočih satelitskih slik. Želimo se prepričati, da je naš pristop robusten in da lahko obravnava različne scenarije, ki jih lahko sreča brezpilotni letalnik v realnem svetu.
Ta obsežna zbirka podatkov nam omogoča, da model WAMF-FPI testiramo in validiramo v številnih različnih scenarijih in pogojih,
s čimer zagotavljamo njegovo robustnost in splošno uporabnost.
Za primerjavo, v članku so uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo \cite{dai2022finding, wang2023wamf}.
Ta množica predvsem vsebuje slike stavb večjih kitajskih univerz.
V nasprotju z UL14, naša podatkovna množica ne zajema samo stavb, temveč tudi parke,
zelene površine, vodnate površine in druge značilnosti terena, kar prinaša širši spekter značilnosti za analizo, ter predstavlja bolj realne okoliščine.
\section{Slike brezpilotnega letalnika} \section{Slike brezpilotnega letalnika}
Nabor podatkov, ki ga predstavljamo, je bil zasnovan z namenom raziskovanja in analizel lokalizacije brezpilotnih letalnikov v različnih mestnih scenarijih. Nabor podatkov, ki ga predstavljamo, je bil zasnovan z namenom raziskovanja in analizel lokalizacije brezpilotnih letalnikov v različnih mestnih scenarijih.
@ -982,7 +974,7 @@ Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF
\begin{figure}[h] \begin{figure}[h]
\centering \centering
\includegraphics[width=0.8\textwidth]{./img/cities.png} \includegraphics[width=\textwidth]{./img/cities.png}
\caption{Slika prikazuje lokacije mest, ki so vključena v nabor podatkov.} \caption{Slika prikazuje lokacije mest, ki so vključena v nabor podatkov.}
\label{fig:cities} \label{fig:cities}
\end{figure} \end{figure}
@ -1003,13 +995,20 @@ Takšne razlike lahko vplivajo na algoritme lokalizacije in navigacije brezpilot
\label{fig:region_structures} \label{fig:region_structures}
\end{figure} \end{figure}
Na sliki \ref{fig:drone_image_example} so prikazani raznoliki primeri zajeti z brezpilotnim letalnikom. Na slikah \ref{fig:drone_image_example_1} in \ref{fig:drone_image_example_2} so prikazani raznoliki primeri zajeti z brezpilotnim letalnikom.
\begin{figure}[H] \begin{figure}[H]
\centering \centering
\includegraphics[width=1\textwidth]{./img/drone_examples.png} \includegraphics[width=1\textwidth]{./img/drone_examples_grid1.png}
\caption{Raznoliki primeri slik zajetih z brezpilotnim letalnikom.} \caption{Raznoliki primeri slik zajetih z brezpilotnim letalnikom.}
\label{fig:drone_image_example} \label{fig:drone_image_example_1}
\end{figure}
\begin{figure}[H]
\centering
\includegraphics[width=1\textwidth]{./img/drone_examples_grid2.png}
\caption{Raznoliki primeri slik zajetih z brezpilotnim letalnikom.}
\label{fig:drone_image_example_2}
\end{figure} \end{figure}
\section{Satelitske slike} \section{Satelitske slike}
@ -1044,13 +1043,63 @@ Za pretvorbo geografskih koordinat (latitudo in longitudo) v ploščične koordi
\end{align*} \end{align*}
\end{itemize} \end{itemize}
Na sliki \ref{fig:sat_image_ljubljana} so prikazani primeri pripadajočih satelitskih slik za slike zajete z brezpilotnim letalnikom. Na slikah \ref{fig:sat_examples_grid_1} in \ref{fig:sat_examples_grid_2} so prikazani primeri pripadajočih satelitskih slik za slike zajete z brezpilotnim letalnikom.
\begin{figure}[h] \begin{figure}[h]
\centering \centering
\includegraphics[width=1\textwidth]{./img/corresponding_sat_examples.png} \includegraphics[width=0.9\textwidth]{./img/corresponding_sat_examples_grid1.png}
\caption{Primer pripadajočih satelitskih slik.} \caption{Primer pripadajočih satelitskih slik.}
\label{fig:sat_image_ljubljana} \label{fig:sat_examples_grid_1}
\end{figure}
\begin{figure}[h]
\centering
\includegraphics[width=0.9\textwidth]{./img/corresponding_sat_examples_grid2.png}
\caption{Primer pripadajočih satelitskih slik.}
\label{fig:sat_examples_grid_2}
\end{figure}
\section{Oznake}
V okviru raziskave smo iz visokoločljivostnih satelitskih TIFF datotek naključno izrezali regije velikosti 400x400 pikslov.
Pri vsaki iteraciji je bil izrez drugačen, s poudarkom na vključevanju referenčne točke lokalizacije v izrez.
Ta pristop zagotavlja izpostavljenost modela različnim scenarijem ob ohranjanju natančnosti lokalizacijskih podatkov.
Slike, pridobljene z brezpilotnimi letalniki, so bile obdelane s tehniko \textit{osrednjega izreza} in različnimi stopnjami povečave, združujoč detajlnost teh slik z obsežnostjo satelitskih posnetkov.
Spodaj na slikah \ref{fig:drone_sat_example_19}, \ref{fig:drone_sat_example_21}, \ref{fig:drone_sat_example_37}, \ref{fig:drone_sat_example_55} in \ref{fig:drone_sat_example_82} je prikazanih nekaj primerov takšnih izrezov.
Na vsaki sliki je s pomočjo rdečega krogeca označen center izreza, ki predstavlja referenčno točko lokalizacije iz brezpilotnega letalnika, s čimer je omogočeno lažje prepoznavanje osredotočenosti izreza.
\begin{figure}[h]
\centering
\includegraphics[width=1\textwidth]{./img/drone_sat_example_19.png}
\caption{Leva slika prikazuje Gradec s 2-kratno povečavo slike iz brezpilotnega letalnika, desna pa Trst s 2,5-kratno povečavo slike iz brezpilotnega letalnika.}
\label{fig:drone_sat_example_19}
\end{figure}
\begin{figure}[h]
\centering
\includegraphics[width=1\textwidth]{./img/drone_sat_example_37.png}
\caption{Leva slika prikazuje mesto Szombathely s 1,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa z 2-kratno povečavo slike iz brezpilotnega letalnika.}
\label{fig:drone_sat_example_37}
\end{figure}
\begin{figure}[h]
\centering
\includegraphics[width=1\textwidth]{./img/drone_sat_example_21.png}
\caption{Leva slika prikazuje Zagreb s 1,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Szombathely s 2,5-kratno povečavo slike iz brezpilotnega letalnika.}
\label{fig:drone_sat_example_21}
\end{figure}
\begin{figure}[h]
\centering
\includegraphics[width=1\textwidth]{./img/drone_sat_example_55.png}
\caption{Leva slika prikazuje Benetke s 3-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Pula s 2-kratno povečavo slike iz brezpilotnega letalnika.}
\label{fig:drone_sat_example_55}
\end{figure}
\begin{figure}[h]
\centering
\includegraphics[width=1\textwidth]{./img/drone_sat_example_82.png}
\caption{Leva slika prikazuje Trst s 3,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Pula z 1-kratno povečavo slike iz brezpilotnega letalnika.}
\label{fig:drone_sat_example_82}
\end{figure} \end{figure}
\chapter{Rezultati} \chapter{Rezultati}

Binary file not shown.

After

Width:  |  Height:  |  Size: 4.5 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 4.6 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.7 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.7 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.8 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.5 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.4 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.4 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.5 MiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 171 KiB

After

Width:  |  Height:  |  Size: 206 KiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 124 KiB

After

Width:  |  Height:  |  Size: 150 KiB

Binary file not shown.

Before

Width:  |  Height:  |  Size: 193 KiB

After

Width:  |  Height:  |  Size: 112 KiB