Opis podatkovne mnozice izboljsan
BIN
diploma.pdf
111
diploma.tex
|
@ -798,12 +798,12 @@ y = \text{softmax}(W_2\text{ReLU}(W_1e))
|
|||
\end{equation}
|
||||
\end{center}
|
||||
|
||||
Na sliki \ref{fig:vit} levo je videti kako se slika razdeli na pred vstopom v model.
|
||||
Na desni strani pa lahko opazimo, da sama arhitektura ViT uporablja klasičen transformerski kodirnik.
|
||||
Na sliki \ref{fig:vit} je videti kako se slika razdeli na zaplate pred vstopom v model.
|
||||
Lahko opazimo, da sama arhitektura ViT uporablja klasičen transformerski kodirnik.
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=\textwidth]{./img/vit.png}
|
||||
\includegraphics[width=0.6\textwidth]{./img/vit.png}
|
||||
\caption{Skica ViT modela, iz članka \cite{vit}}
|
||||
\label{fig:vit}
|
||||
\end{figure}
|
||||
|
@ -921,30 +921,22 @@ V primerjavi s tradicionalnimi metodami imajo siamske mreže večjo odpornost na
|
|||
Zaradi globje hierarhične predstavitve slike so sposobne zaznati in primerjati kompleksne značilnosti, ki jih manj kompleksne metode morda ne bi opazile.
|
||||
|
||||
\chapter{Podatkovna množica}
|
||||
\todo{Dopolni poglavje z informacijami prejsnih datasetov}
|
||||
\label{ch1}
|
||||
V raziskovalnem svetu je podatkovna množica ključnega pomena za razvoj, testiranje in validacijo modelov.
|
||||
Kljub pomembnosti modela WAMF-FPI avtorji niso javno delili originalne podatkovne množice.
|
||||
To je postavilo pred nas in vse druge, ki bi jih ta metoda lahko zanimala, izziv pri zbiranju primerne podatkovne osnove za analizo.
|
||||
Za doseganje konsistentnosti in kakovosti rezultatov smo se odločili samostojno kreirati in kurirati našo lastno podatkovno množico, ki odraža realne pogoje in scenarije uporabe.
|
||||
V svetu raziskovanja je podatkovna množica ključnega pomena za razvoj, testiranje in validacijo modelov.
|
||||
Kljub obstoju številnih zbirk, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij, s katerimi se srečuje brezpilotni letalnik.
|
||||
Konkretno, CVUSA se osredotoča na zgradbe, medtem ko University-1652 predstavlja predvsem univerzitetna okolja.
|
||||
|
||||
Podatkovna množica, ki smo jo oblikovali, temelji na dveh glavnih virih vizualnih podatkov.
|
||||
Prvi vir predstavljajo slike, pridobljene z brezpilotnimi letalniki.
|
||||
Te slike so bile pridobljene preko orodja Google Earth Studio \cite{google_earth_studio}, ki omogoča natančno in realno reprezentacijo terenskih značilnosti iz ptičje perspektive.
|
||||
Te slike nudijo bogate detajle in so ključne za razumevanje fine strukture terena.
|
||||
Zaradi pomanjkljivosti obstoječih zbirk in odsotnosti specifične javno dostopne podatkovne zbirke UL14, ki so jo avtorji uporabili v \cite{dai2022finding}, smo se soočili z izzivom pri zbiranju primerne podatkovne osnove za analizo.
|
||||
Da bi premostili to vrzel, smo se odločili za ustvarjanje lastne zbirke.
|
||||
Za pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \cite{google_earth_studio} in pridobili slike iz 11 večjih evropskih mest.
|
||||
Te slike odražajo raznolikost terena, vključno z zgradbami, parki, zelenimi in vodnimi površinami.
|
||||
Dodatno smo uporabili Mapbox API \cite{mapbox_api} za pridobitev pripadajočih satelitskih slik.
|
||||
|
||||
Drugi vir podatkov predstavljajo satelitske slike, pridobljene preko Mapbox API \cite{mapbox_api}.
|
||||
Satelitske slike prinašajo širši pogled na regijo in omogočajo razumevanje večjih geografskih in prostorskih vzorcev.
|
||||
V kombinaciji z slikami brezpilotnega letalnika te slike nudijo celovito sliko terena z različnih višin in ločljivosti.
|
||||
|
||||
Skupno naša podatkovna množica vključuje več kot 11.000 slik posnetih z brezpilotnim letalnikom in njihovih pripadajočih satelitskih slik.
|
||||
Ta obsežna zbirka podatkov nam omogoča, da model WAMF-FPI testiramo in validiramo v številnih različnih scenarijih in pogojih,
|
||||
s čimer zagotavljamo njegovo robustnost in splošno uporabnost.
|
||||
|
||||
Za primerjavo, v članku so uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo \cite{dai2022finding, wang2023wamf}.
|
||||
Ta množica predvsem vsebuje slike stavb večjih kitajskih univerz.
|
||||
V nasprotju z UL14, naša podatkovna množica ne zajema samo stavb, temveč tudi parke,
|
||||
zelene površine, vodnate površine in druge značilnosti terena, kar prinaša širši spekter značilnosti za analizo, ter predstavlja bolj realne okoliščine.
|
||||
Skupno je naša podatkovna množica obsežna in vključuje več kot 11.000 slik.
|
||||
V članku \cite{dai2022finding, wang2023wamf} so avtorji uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo.
|
||||
Ta zbirka se osredotoča večinoma na slike stavb večjih kitajskih univerz. V nasprotju s tem naša zbirka ponuja širši spekter značilnosti za analizo in bolje odraža realne okoliščine.
|
||||
Cilj izdelave naše zbirke je bil zagotoviti raznolike podatke, ki bi lahko služili kot robustna osnova za testiranje in validacijo naše implementacije WAMF-FPI.
|
||||
Želimo se prepričati, da je naš pristop robusten in da lahko obravnava različne scenarije, ki jih lahko sreča brezpilotni letalnik v realnem svetu.
|
||||
|
||||
\section{Slike brezpilotnega letalnika}
|
||||
Nabor podatkov, ki ga predstavljamo, je bil zasnovan z namenom raziskovanja in analizel lokalizacije brezpilotnih letalnikov v različnih mestnih scenarijih.
|
||||
|
@ -982,7 +974,7 @@ Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF
|
|||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=0.8\textwidth]{./img/cities.png}
|
||||
\includegraphics[width=\textwidth]{./img/cities.png}
|
||||
\caption{Slika prikazuje lokacije mest, ki so vključena v nabor podatkov.}
|
||||
\label{fig:cities}
|
||||
\end{figure}
|
||||
|
@ -1003,13 +995,20 @@ Takšne razlike lahko vplivajo na algoritme lokalizacije in navigacije brezpilot
|
|||
\label{fig:region_structures}
|
||||
\end{figure}
|
||||
|
||||
Na sliki \ref{fig:drone_image_example} so prikazani raznoliki primeri zajeti z brezpilotnim letalnikom.
|
||||
Na slikah \ref{fig:drone_image_example_1} in \ref{fig:drone_image_example_2} so prikazani raznoliki primeri zajeti z brezpilotnim letalnikom.
|
||||
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_examples.png}
|
||||
\includegraphics[width=1\textwidth]{./img/drone_examples_grid1.png}
|
||||
\caption{Raznoliki primeri slik zajetih z brezpilotnim letalnikom.}
|
||||
\label{fig:drone_image_example}
|
||||
\label{fig:drone_image_example_1}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[H]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_examples_grid2.png}
|
||||
\caption{Raznoliki primeri slik zajetih z brezpilotnim letalnikom.}
|
||||
\label{fig:drone_image_example_2}
|
||||
\end{figure}
|
||||
|
||||
\section{Satelitske slike}
|
||||
|
@ -1044,13 +1043,63 @@ Za pretvorbo geografskih koordinat (latitudo in longitudo) v ploščične koordi
|
|||
\end{align*}
|
||||
\end{itemize}
|
||||
|
||||
Na sliki \ref{fig:sat_image_ljubljana} so prikazani primeri pripadajočih satelitskih slik za slike zajete z brezpilotnim letalnikom.
|
||||
Na slikah \ref{fig:sat_examples_grid_1} in \ref{fig:sat_examples_grid_2} so prikazani primeri pripadajočih satelitskih slik za slike zajete z brezpilotnim letalnikom.
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/corresponding_sat_examples.png}
|
||||
\includegraphics[width=0.9\textwidth]{./img/corresponding_sat_examples_grid1.png}
|
||||
\caption{Primer pripadajočih satelitskih slik.}
|
||||
\label{fig:sat_image_ljubljana}
|
||||
\label{fig:sat_examples_grid_1}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=0.9\textwidth]{./img/corresponding_sat_examples_grid2.png}
|
||||
\caption{Primer pripadajočih satelitskih slik.}
|
||||
\label{fig:sat_examples_grid_2}
|
||||
\end{figure}
|
||||
|
||||
\section{Oznake}
|
||||
V okviru raziskave smo iz visokoločljivostnih satelitskih TIFF datotek naključno izrezali regije velikosti 400x400 pikslov.
|
||||
Pri vsaki iteraciji je bil izrez drugačen, s poudarkom na vključevanju referenčne točke lokalizacije v izrez.
|
||||
Ta pristop zagotavlja izpostavljenost modela različnim scenarijem ob ohranjanju natančnosti lokalizacijskih podatkov.
|
||||
Slike, pridobljene z brezpilotnimi letalniki, so bile obdelane s tehniko \textit{osrednjega izreza} in različnimi stopnjami povečave, združujoč detajlnost teh slik z obsežnostjo satelitskih posnetkov.
|
||||
Spodaj na slikah \ref{fig:drone_sat_example_19}, \ref{fig:drone_sat_example_21}, \ref{fig:drone_sat_example_37}, \ref{fig:drone_sat_example_55} in \ref{fig:drone_sat_example_82} je prikazanih nekaj primerov takšnih izrezov.
|
||||
Na vsaki sliki je s pomočjo rdečega krogeca označen center izreza, ki predstavlja referenčno točko lokalizacije iz brezpilotnega letalnika, s čimer je omogočeno lažje prepoznavanje osredotočenosti izreza.
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_sat_example_19.png}
|
||||
\caption{Leva slika prikazuje Gradec s 2-kratno povečavo slike iz brezpilotnega letalnika, desna pa Trst s 2,5-kratno povečavo slike iz brezpilotnega letalnika.}
|
||||
\label{fig:drone_sat_example_19}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_sat_example_37.png}
|
||||
\caption{Leva slika prikazuje mesto Szombathely s 1,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa z 2-kratno povečavo slike iz brezpilotnega letalnika.}
|
||||
\label{fig:drone_sat_example_37}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_sat_example_21.png}
|
||||
\caption{Leva slika prikazuje Zagreb s 1,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Szombathely s 2,5-kratno povečavo slike iz brezpilotnega letalnika.}
|
||||
\label{fig:drone_sat_example_21}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_sat_example_55.png}
|
||||
\caption{Leva slika prikazuje Benetke s 3-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Pula s 2-kratno povečavo slike iz brezpilotnega letalnika.}
|
||||
\label{fig:drone_sat_example_55}
|
||||
\end{figure}
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
\includegraphics[width=1\textwidth]{./img/drone_sat_example_82.png}
|
||||
\caption{Leva slika prikazuje Trst s 3,5-kratno povečavo slike iz brezpilotnega letalnika, desna pa mesto Pula z 1-kratno povečavo slike iz brezpilotnega letalnika.}
|
||||
\label{fig:drone_sat_example_82}
|
||||
\end{figure}
|
||||
|
||||
\chapter{Rezultati}
|
||||
|
|
After Width: | Height: | Size: 4.5 MiB |
After Width: | Height: | Size: 4.6 MiB |
After Width: | Height: | Size: 1.7 MiB |
After Width: | Height: | Size: 1.7 MiB |
After Width: | Height: | Size: 1.8 MiB |
After Width: | Height: | Size: 1.5 MiB |
After Width: | Height: | Size: 1.4 MiB |
After Width: | Height: | Size: 1.4 MiB |
After Width: | Height: | Size: 1.5 MiB |
Before Width: | Height: | Size: 171 KiB After Width: | Height: | Size: 206 KiB |
Before Width: | Height: | Size: 124 KiB After Width: | Height: | Size: 150 KiB |
BIN
img/vit.png
Before Width: | Height: | Size: 193 KiB After Width: | Height: | Size: 112 KiB |