Pocisti veliko
parent
fd13f7e187
commit
d859c090fb
BIN
diploma.pdf
BIN
diploma.pdf
Binary file not shown.
71
diploma.tex
71
diploma.tex
|
@ -444,7 +444,7 @@ S prihodom globokih konvolucijskih nevronskih mrež (CNN) in njihove dokazane sp
|
|||
Raziskave v \cite{location_dependence} so bile med prvimi, ki so se lotile tega področja z izvlečkom značilnosti za izziv geolokalizacije s pomočjo različnih pogledov, uporabljajoč vnaprej naučen CNN. Ugotovljeno je bilo, da visokonivojske plasti v CNN vsebujejo bogate semantične informacije, ki lahko pripomorejo k boljši geolokalizaciji.
|
||||
Nadaljnje raziskave v \cite{wide_area} so razširile ta koncept z natančnim prilagajanjem predhodno naučenih mrež, da bi zmanjšali razdaljo značilnosti med satelitskimi slikami in slikami iz brezpilotnega letalnika.
|
||||
|
||||
V \cite{deep_representations} je bil predstavljen pristop z uporabo modificirane siamske mreže \todo{nimam pojma kaj to pomeni}. Ta pristop uporablja kontrastno izgubo za optimizacijo parametrov mreže, kar omogoča boljše razlikovanje med podobnimi in različnimi lokacijami.
|
||||
V \cite{deep_representations} je bil predstavljen pristop z uporabo modificirane siamske mreže. Ta pristop uporablja kontrastno izgubo za optimizacijo parametrov mreže, kar omogoča boljše razlikovanje med podobnimi in različnimi lokacijami.
|
||||
V \cite{cvm_net} so bile predstavljene metode, ki so optimizirale opise slik, da so postale odporne na masivne spremembe perspektive, kot je pogled iz zraka proti tlem ali obratno.
|
||||
V \cite{optimal_transport} so predstavljene inovacije, ki uporabljajo prostorske informacije za izboljšanje globalnega koraka agregacije pri izvlečku značilnosti. Z uporabo mehanizma prostorske pozornosti so še dodatno izboljšali natančnost geolokalizacije.
|
||||
|
||||
|
@ -473,8 +473,8 @@ To omogoča WAMF-FPI-ju, da ohrani več informacij ter pridobi boljšo lokalizac
|
|||
Kljub številnim obstoječim zbirkam, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij s katerimi se srečuje brezpilotni letalnik.
|
||||
Na primer, zbirka CVUSA \cite{cvusa} je osredotočena predvsem na zgradbe.
|
||||
Zbirka University-1652 \cite{university1652} uporablja posnetke univerz, vendar nima dovolj raznolikih posnetkov, saj je omejena le na univerzitetna okolja.
|
||||
V našem delu smo se soočili z odsotnostjo specifične javno dostopne podatkovne zbirke UL14, katero so uporabili avtorji uporabili v \cite{dai2022finding}. Zaradi te pomanjkljivosti smo se odločili za ustvarjanje lastne zbirke s pomočjo Google Earth Studio \cite{google_earth_studio}. \todo{Tle je use podcrtano in jst nevem s cim zamenjat}
|
||||
Naša zbirka obsega 11 evropskih mest z raznoliko strukturo. Glavni cilj izdelave te zbirke je bil zagotoviti raznolike podatke, ki bi služili kot robustna osnova za testiranje in validacijo pristopov. S tem smo želeli zagotoviti, da naša implementacija lahko obravnava različne scenarije, ki jih lahko sreča brezpilotni letalnik v realnem svetu.
|
||||
V našem delu smo se soočili z odsotnostjo specifične javno dostopne podatkovne zbirke UL14, katero so uporabili avtorji uporabili v \cite{dai2022finding}. Zaradi te pomanjkljivosti smo se odločili za ustvarjanje lastne zbirke s pomočjo Google Earth Studio \cite{google_earth_studio}.
|
||||
Naša zbirka obsega 11 evropskih mest. Glavni cilj izdelave te zbirke je bil zagotoviti raznolike podatke, ki bi služili kot robustna osnova za testiranje in validacijo pristopov. S tem smo želeli zagotoviti, da naša implementacija lahko obravnava različne scenarije, ki jih lahko sreča brezpilotni letalnik v realnem svetu.
|
||||
Cilj izdelave zbirke je bil zagotoviti raznolike podatke, ki bi lahko služili kot robustna osnova za testiranje in validacijo naše implementacije WAMF-FPI.
|
||||
|
||||
V tej diplomski nalogi smo se odločili za implementacijo WAMF-FPI, kot je predstavljeno v izvornem članku \cite{wang2023wamf}, saj metoda velja za najnaprednejšo na področju.
|
||||
|
@ -503,12 +503,12 @@ Z vključitvijo vseh teh komponent in tehnik v naš model WAMF-FPI želimo razvi
|
|||
V nadaljevanju poglavja bomo vsako od teh komponent podrobno raziskali, da bi bolje razumeli njihove lastnosti in kako prispevajo k celotnemu modelu.
|
||||
|
||||
\section{Konvolucijske nevronske mreže}
|
||||
Konvolucijske nevronske mreže (CNN – Convolutional Neural Networks) so metoda globokega učenja,
|
||||
Konvolucijske nevronske mreže (ang. Convolutional Neural Networks - CNN) so metoda globokega učenja,
|
||||
specializirana za obdelavo vizualnih podatkov, zasnovana tako, da avtomatsko in adaptivno izvaja izvleček značilnosti iz slik.
|
||||
|
||||
\subsection{Struktura in delovanje}
|
||||
|
||||
Osnovni gradniki CNN obsegajo štiri glavne vrste plasti: konvolucijsko, aktivacijsko, združevalno (pooling) in polno povezano.
|
||||
Osnovni gradniki CNN obsegajo štiri glavne vrste plasti: konvolucijsko, aktivacijsko, združevalno (ang. pooling) in polno povezano.
|
||||
|
||||
\begin{enumerate}
|
||||
\item \textbf{Konvolucijska plast}:
|
||||
|
@ -519,7 +519,7 @@ Osnovni gradniki CNN obsegajo štiri glavne vrste plasti: konvolucijsko, aktivac
|
|||
\end{equation}
|
||||
|
||||
\item \textbf{Aktivacijska funkcija}:
|
||||
Po konvolucijski operaciji se uporabi aktivacijska funkcija za vsak izhod. Najpogosteje se uporablja funkcija \texttt{ReLU}:
|
||||
Po konvolucijski operaciji se uporabi aktivacijska funkcija za vsak izhod. Najpogosteje se uporablja funkcija ReLU:
|
||||
\begin{equation}
|
||||
\text{ReLU}(x) = \max(0, x)
|
||||
\end{equation}
|
||||
|
@ -538,11 +538,6 @@ Osnovni gradniki CNN obsegajo štiri glavne vrste plasti: konvolucijsko, aktivac
|
|||
Kjer je $O_i$ izhod, $W_{ij}$ matrika uteži, $I_j$ vhod in $b_i$ pristranskost (ang. bias).
|
||||
\end{enumerate}
|
||||
|
||||
\subsection{Značilnosti in prednosti}
|
||||
Konvolucijske mreže so sposobne avtomatskega zaznavanja hierarhičnih značilnosti \todo{Nimam pojma kaj je tuki}.
|
||||
Na nižjih ravneh mreže se zaznavajo nizkonivojske značilnosti, kot so robovi in teksture, na višjih ravneh pa se zaznavajo kompleksnejše strukture, kot so oblike in objekti.
|
||||
Ta hierarhična značilnost je tisto, kar omogoča CNN, da doseže izjemno natančnost pri različnih nalogah obdelave slik.
|
||||
|
||||
\section{Transformerska arhitektura}
|
||||
|
||||
V tem podpoglavju bomo obravnavali razvoj in lastnosti transformerske arhitekture.
|
||||
|
@ -608,10 +603,8 @@ Na sliki \ref{fig:rnn} je prikazana skica RNN modela.
|
|||
\end{figure}
|
||||
|
||||
\section{Zgradba transformerja}
|
||||
V kontekstu strojnega prevajanja so avtorji v članku \cite{vaswani2017attention} o pozornosti predstavili novo vrsto arhitekture, ki se izogiba mnogim pastem modelov, ki temeljijo na RNN.
|
||||
Kljub vsem napredkom pri kodirnikih-dekodirnikih RNN, ki smo jih obravnavali zgoraj, je ostalo dejstvo, da so RNN težko paralelizirani, ker zaporedno obdelujejo vhod.
|
||||
Ključna inovacija tega članka je, da so RNN in njihova skrita stanja v celoti nadomeščeni z operacijami na osnovi pozornosti, ki so v mnogih problematičnih režimih bolj učinkoviti.
|
||||
|
||||
Avtorji v članku \cite{vaswani2017attention} so predstavili novo arhitekturo za strojno prevajanje, ki se osredotoča na mehanizme pozornosti in se izogiba omejitvam RNN.
|
||||
Glavna inovacija je zamenjava RNN in njihovih skritih stanj z bolj učinkovitimi operacijami na osnovi pozornosti.
|
||||
Transformer model je model kodirnika-dekodirnika. Kodirnik sestavljajo $N$ blokov na levi, dekodirnik pa $N$ blokov na desni, vidno na sliki \ref{fig:transformer_network}.
|
||||
|
||||
\begin{figure}[h]
|
||||
|
@ -634,7 +627,6 @@ Tako kot v kodirniku, vsaki plasti sledi plast \textit{Dodaj in Normiraj}.
|
|||
Dekodirnik sprejme vse ciljne besede $\vec{E} = (e_0, ..., e_m)$ kot vhod.
|
||||
V procesu napovedovanja besede $e_i$ ima dekodirnik dostop do prej generiranih besed.
|
||||
Ne more pa imeti dostopa do besed, ki sledijo $e_i$, saj te še niso bile generirane.
|
||||
Maskiranje med učenjem nam omogoča, da posnemamo pogoje, s katerimi se bo model soočil med sklepanjem.
|
||||
Obstaja nekaj ključnih razlik od kodirnika - ena je, da so vhodi v prvo operacijo pozornosti v blokih dekodirnika maskirani, zato ime plasti.
|
||||
To pomeni, da se lahko katera koli beseda v ciljnem izhodu nanaša samo na besede, ki so prišle pred njo.
|
||||
Razlog za to je preprost: med sklepanjem generiramo predvideni prevod $\vec{E}$ besedo za besedo z uporabo izvornega stavka $\vec{F}$.
|
||||
|
@ -713,7 +705,7 @@ Transformerji so prvotno bili omejeni na obdelavo zaporedij, kar je idealno za j
|
|||
To se je spremenilo z razvojem Vision Transformerja (ViT) s strani Google-a \cite{vit}.
|
||||
Namesto da bi slike obdelovali kot dvodimenzionalne mreže pikslov (kot to počnejo konvolucijske nevronske mreže), Vision Transformer slike obravnava kot zaporedje majhnih kvadratov ali zaplat.
|
||||
To omogoča uporabo istih tehnik samo-pozornosti, ki so bile učinkovite v jezikovnih modelih, tudi za obdelavo slik.
|
||||
Ta pristop je pokazal obetavne rezultate, saj je Vision Transformer dosegel ali presegel učinkovitost konvolucijskih nevronskih mrež na številnih nalogah računalniškega vida.
|
||||
Ta pristop je pokazal obetavne rezultate, saj je Vision Transformer dosegel ali presegel učinkovitost konvolucijskih nevronskih mrež na številnih nalogah računalniškega vida \cite{vit}.
|
||||
|
||||
\subsection{Arhitektura ViT}
|
||||
|
||||
|
@ -881,10 +873,9 @@ V svetu raziskovanja je podatkovna množica ključnega pomena za razvoj, testira
|
|||
Kljub obstoju številnih zbirk, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij, s katerimi se srečuje brezpilotni letalnik.
|
||||
Konkretno, CVUSA se osredotoča na zgradbe, medtem ko University-1652 predstavlja predvsem univerzitetna okolja.
|
||||
Zaradi pomanjkljivosti obstoječih zbirk in odsotnosti javno dostopne zbirke UL14 iz \cite{dai2022finding}, smo imeli izziv z zbiranjem ustreznih podatkov za analizo.
|
||||
smo se soočili z izzivom pri zbiranju primerne podatkovne osnove za analizo.
|
||||
|
||||
Da bi premostili to vrzel, smo se odločili za ustvarjanje lastne zbirke.
|
||||
Za pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \cite{google_earth_studio} in pridobili slike iz 11 večjih evropskih mest.
|
||||
Za pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \cite{google_earth_studio} in pridobili slike iz 11 evropskih mest.
|
||||
Te slike odražajo raznolikost terena, vključno z zgradbami, parki, zelenimi in vodnimi površinami.
|
||||
Dodatno smo uporabili Mapbox API \cite{mapbox_api} za pridobitev pripadajočih satelitskih slik.
|
||||
|
||||
|
@ -908,11 +899,12 @@ Zajem slik je bil izveden na naključnih poteh po mestu, kar omogoča širok spe
|
|||
V mestnih območjih je poudarek na razumevanju, kako se brezpilotni letalniki lokalizirajo in navigirajo med visokimi zgradbami, kjer so lahko GPS signali zmanjšani ali moteni.
|
||||
V zelenih območjih je cilj razumeti, kako se brezpilotni letalniki obnašajo v okoljih, kjer so vizualni vzorci manj unikatni.
|
||||
V naboru podatkov za učenje je 10.000 slik iz desetih mest, pri čemer vsako mesto prispeva 1.000 slik.
|
||||
Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF (ang. Earth Centered, Earth Fixed) je globalni koordinatni sistem z izhodiščem v središču Zemlje.
|
||||
Brezpilotni letalniki so bili kalibrirani na višini 150 metrov nad navedeno nadmorsko višino mesta.
|
||||
Kamere na brezpilotnih letalnikih imajo vidno polje 80 stopinj in so usmerjene pravokotno na središče Zemlje. Vse slike so bile ustvarjene z uporabo orodja Google Earth Studio \cite{google_earth_studio}.
|
||||
|
||||
V naboru so mesta s tipično evropsko arhitekturo, kombinacijo zelenja in stavb.
|
||||
Mesta, vključena v učni nabor podatkov, so:
|
||||
\todo{Trst je nas}
|
||||
|
||||
\begin{itemize}
|
||||
\item \textbf{Maribor:} Nadmorska višina: 272m, Višina brezpilotnega letalnika: 150m, Skupaj: 422m nad morsko gladino.
|
||||
|
@ -928,7 +920,10 @@ Mesta, vključena v učni nabor podatkov, so:
|
|||
\end{itemize}
|
||||
|
||||
Dodatno je bil v nabor dodan tudi testni nabor podatkov za Ljubljano, ki vključuje 1.000 slik.
|
||||
Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF (Earth Centered, Earth Fixed) je globalni koordinatni sistem z izhodiščem v središču Zemlje.
|
||||
|
||||
Na Sliki \ref{fig:region_structures} je prikazana vizualna razdelitev zelenih površin in stavb za različna mesta, temelječa na analizi slik, ki smo jih zajeli v našem podatkovnem naboru.
|
||||
Vsako mesto razkriva svojo edinstveno strukturo in raven urbanizacije.
|
||||
Te razlike so ključnega pomena pri razumevanju izzivov, s katerimi se srečujejo brezpilotni letalniki pri lokalizaciji in navigaciji v različnih mestnih okoljih.
|
||||
|
||||
\begin{figure}[h]
|
||||
\centering
|
||||
|
@ -937,10 +932,6 @@ Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF
|
|||
\label{fig:cities}
|
||||
\end{figure}
|
||||
|
||||
Na Sliki \ref{fig:region_structures} je prikazana vizualna razdelitev zelenih površin in stavb za različna mesta, temelječa na analizi slik, ki smo jih zajeli v našem podatkovnem naboru.
|
||||
Vsako mesto razkriva svojo edinstveno strukturo in raven urbanizacije.
|
||||
Te razlike so ključnega pomena pri razumevanju izzivov, s katerimi se srečujejo brezpilotni letalniki pri lokalizaciji in navigaciji v različnih mestnih okoljih.
|
||||
|
||||
Nekatera mesta, kot sta Gradec in Pula, kažejo višjo stopnjo urbanizacije z minimalno prisotnostjo zelenih površin.
|
||||
To pomeni, da bodo brezpilotni letalniki v teh okoljih večinoma navigirali med zgradbami.
|
||||
Na drugi strani pa mesta, kot je Zagreb, predstavljajo večjo mešanico zgradb in zelenih površin.
|
||||
|
@ -972,15 +963,14 @@ Na slikah \ref{fig:drone_image_example_1} in \ref{fig:drone_image_example_2} so
|
|||
\section{Satelitske slike}
|
||||
Za vsako sliko posneto z brezpilotnim letalnikom smo poiskali ustrezeno satelitsko zaplato.
|
||||
Ta korak je bil ključnega pomena, saj je zagotovil, da so satelitske slike popolnoma usklajene z slikami posnetimi iz brezpilotnega letalnika v smislu geografske lokacije.
|
||||
Ko smo identificirali ustrezno satelitsko ploščico, smo jo prenesli neposredno iz Mapbox API-ja, priznanega vira za visokokakovostne satelitske slike.
|
||||
Da bi zagotovili dodatno globino in kontekst za vsako lokacijo, nismo prenesli samo osrednje ploščice, temveč tudi vse njene sosednje ploščice.
|
||||
Te sosednje ploščice smo nato združili z osrednjo ploščico za ustvarjanje enotne TIFF datoteke. \todo{Verjetno je pomebnen, saj je tako zgrajen dataset}
|
||||
Ko smo identificirali ustrezno satelitsko zaplato, smo jo prenesli neposredno iz Mapbox API-ja, vira za visokokakovostne satelitske slike.
|
||||
Da bi zagotovili dodatno globino in kontekst za vsako lokacijo, nismo prenesli samo osrednje zaplate, temveč tudi vse njene sosednje zaplate.
|
||||
Te sosednje zaplate smo nato združili z osrednjo zaplato za ustvarjanje enotne TIFF datoteke.
|
||||
|
||||
Ko govorimo o ploščicah v kontekstu kartografije in GIS (Geografski informacijski sistem), se običajno nanašamo na kvadratne segmente, ki pokrivajo Zemljo in se uporabljajo za hitrejše in učinkovitejše prikazovanje zemljevidov na spletu.
|
||||
Sistem ploščic je zelo priljubljen v spletnih kartografskih aplikacijah, kot je Google Maps.
|
||||
|
||||
Za pretvorbo geografskih koordinat (latitudo in longitudo) v ploščične koordinate (x, y) na določeni ravni povečave z uporabo Mercatorjeve projekcije, lahko izrazimo:
|
||||
Ko govorimo o zaplatah v kontekstu kartografije in GIS (Geografski informacijski sistem), se običajno nanašamo na kvadratne segmente, ki pokrivajo Zemljo in se uporabljajo za hitrejše in učinkovitejše prikazovanje zemljevidov na spletu.
|
||||
Sistem zaplat je zelo priljubljen v spletnih kartografskih aplikacijah, kot je Google Maps.
|
||||
|
||||
Za pretvorbo geografskih koordinat (latitudo in longitudo) v zaplatne koordinate (x, y) na določeni ravni povečave z uporabo Mercatorjeve projekcije, lahko izrazimo:
|
||||
|
||||
\begin{itemize}
|
||||
\item Pretvorba geografskih koordinat v radiane:
|
||||
|
@ -994,7 +984,7 @@ Za pretvorbo geografskih koordinat (latitudo in longitudo) v ploščične koordi
|
|||
x = \frac{\text{lon}_{\text{rad}}= + \pi}{2\pi}, \\
|
||||
y = \frac{\pi - \log(\tan(\frac{\pi}{4} + \frac{\text{lat}_{\text{rad}}}{2}))}{2\pi}
|
||||
\end{align*}
|
||||
\item Pretvorba normaliziranih koordinat v ploscicne koordinate:
|
||||
\item Pretvorba normaliziranih koordinat v zaplatne koordinate:
|
||||
\begin{align*}
|
||||
\text{tile}_{\text{x}} = \text{floor}(x \times 2^z), \\
|
||||
\text{tile}_{\text{y}} = \text{floor}(y \times 2^z)
|
||||
|
@ -1073,7 +1063,7 @@ Kot naslednji korak smo preučili stratificirano vzorčenje, tehniko, ki bi lahk
|
|||
Pregledali smo tudi vpliv Hanningovega okna ter analizirali, kako različne velikosti tega okna vplivajo na končne rezultate modela.
|
||||
|
||||
V zaključni fazi naših eksperimentov smo se osredotočili na regularizacijo, predvsem na tehniko izpuščanja nevronov.
|
||||
Zaradi kompleksnosti modelov globokega učenja smo želeli razumeti, kako bi taka regularizacija lahko pomagala preprečiti prekomerno prilagajanje ter izboljšala splošno učinkovitost modela.
|
||||
Zaradi kompleksnosti modelov globokega učenja smo želeli razumeti, kako bi regularizacija lahko pomagala preprečiti prekomerno prilagajanje ter izboljšala splošno učinkovitost modela.
|
||||
Vsako od teh področij je v nadaljevanju podrobno obravnavano, pri čemer so podane analize, interpretacije in ključne ugotovitve, ki smo jih pridobili v tem procesu.
|
||||
|
||||
\section{Implementacija}
|
||||
|
@ -1086,7 +1076,7 @@ Metoda iskanja točk uporablja satelitsko sliko kot referenčno in sliko iz brez
|
|||
Obe sliki – posneto z brezpilotnim letalnikom in satelitsko sliko relevantnega območja – se nato prenesejo v end-to-end mrežo.
|
||||
Po obdelavi je rezultat toplotna karta, kjer točka z najvišjo vrednostjo predstavlja lokacijo brezpilotnega letalnika, kot jo predvideva model.
|
||||
Lokacijo nato preslikamo na satelitsko sliko, pri čemer položaj brezpilotnega letalnika določimo na podlagi geografske širine in dolžine, ki jih vsebuje satelitska slika.
|
||||
V FPI \cite{dai2022finding} avtorji kot modul za izluščenje značilnosti uporabljajo dva Deit-S \cite{touvron2020training} brez deljenih uteži za vertikalne poglede slike brezpilotnega letalnika in satelitske slike .
|
||||
V FPI \cite{dai2022finding} avtorji kot modul za izluščenje značilnosti uporabljajo dva Deit-S \cite{touvron2020training} brez deljenih uteži za vertikalne poglede slike brezpilotnega letalnika in satelitske slike.
|
||||
Izluščene značilnosti nato uporabimo za izračun podobnosti in izdelavo toplotne karte. Lokacijo z najvišjo vrednostjo toplotne karte nato preslikamo na satelitsko sliko, da določimo lokacijo brezpilotnega letalnika.
|
||||
|
||||
V FPI je za izračun podobnosti uporabljena zadnja plast zemljevidnih značilnosti \cite{dai2022finding}.
|
||||
|
@ -1108,9 +1098,9 @@ Rezultat je toplotna karta iste velikosti kot vhodna satelitska slika v modelu W
|
|||
|
||||
\subsection{Modul za izluščenje značilnosti}
|
||||
|
||||
WAMF-FPI temelji na strukturi, ki je podobna siamski arhitekturi \todo{popravi}, vendar se od tradicionalnega sledenja objektom loči v ključnih aspektih.
|
||||
Model WAMF-FPI temelji na strukturi, ki je podobna siamski arhitekturi, vendar se od tradicionalnih metod sledenja objektom loči v določenih ključnih točkah, ki jih bomo v tem razdelku opisali.
|
||||
Zaradi občutne razlike med satelitskimi slikami in slikami brezpilotnega letalnika, ki izvirajo iz različnih naprav, veji modela WAMF-FPI za vsako od teh vrst slik ne uporabljata metode deljenja uteži.
|
||||
WAMF-FPI kot vhod uporablja satelitske slike dimenzij 400 × 400 × 3 in slike brezpilotnega letalnika dimenzij 128 × 128 × 3.
|
||||
WAMF-FPI kot vhod uporablja satelitske slike dimenzij 400 × 400 × 3 in slike brezpilotnega letalnika dimenzij 128 × 128 × 3.
|
||||
Značilnosti obeh vrst slik so izluščene s pomočjo PCPVT-S.
|
||||
|
||||
V modelu smo odstranili zadnjo stopnjo PCPVT-S in uporabili samo prve tri stopnje za izluščene značilnosti. Pri dimenzijah vhodnih slik 400 x 400 x 3 in 128 x 128 x 3 oba pristopa pridobita značilnostne mape z obliko
|
||||
|
@ -1127,9 +1117,6 @@ Kljub temu je končni izhod stisnjen samo za faktor štiri v primerjavi z vhodom
|
|||
Pristranskost, ki je posledica nizke ločljivosti značilnostne mape, je bila odstranjena že na samem začetku.
|
||||
Ker značilnostna mapa z visoko ločljivostjo vsebuje več prostorskih informacij, je bila združena z globoko značilnostno mapo, bogato s semantičnimi informacijami, preko lateralne povezovalne strukture.
|
||||
|
||||
WAMF-FPI uporablja konvolucijske mreže za izluščenje značilnosti iz vhodnih slik.
|
||||
Konvolucija je ključna operacija, ki modelu omogoča, da prepoznava vzorce in značilnosti v slikah.
|
||||
|
||||
Prva faza obdelave v metodi WAMF-FPI je uporaba konvolucijskega jedra velikosti ena, ki prilagodi kanalsko dimenzijo tri-stopnjske značilnostne mape, pridobljene s pomočjo PCPVT-S.
|
||||
Število izhodnih kanalov je bilo nastavljeno na 64, kar zagotavlja kompaktno in učinkovito zastopanje značilnosti.
|
||||
Po tej fazi sledi upsampling operacija na značilnostnih mapah zadnjih dveh stopenj, ki poveča njihovo ločljivost in s tem omogoča bolj precizno lokalizacijo.
|
||||
|
@ -1681,8 +1668,8 @@ Spodaj so izpostavljene naše glavne ugotovitve in predlogi:
|
|||
Metoda WAMF-FPI predstavlja pomemben korak naprej v lokalizaciji brezpilotnih letalnikov, še posebej v okoljih, kjer je satelitski signal omejen ali nezanesljiv.
|
||||
Kljub obetavni učinkovitosti metode pa obstajajo še nekateri izzivi in priložnosti za izboljšave.
|
||||
Naša raziskava je postavila trdne temelje za nadaljnji razvoj in implementacijo metode v realnih sistemih brezpilotnih letalnikov.
|
||||
Naslednji koraki bi vključevali nadaljnje optimizacije modela, razširitev podatkovnih zbirk in končno implementacijo na dejanskih brezpilotnih letalnikih.
|
||||
\todo{add uporaba casovne nevem kaj, feedback loop}
|
||||
Naslednji koraki bi vključevali nadaljnje optimizacije modela, razširitev podatkovnih zbirk, uporabo časovne informacije,
|
||||
vzpostavitev povratne zanke (ang. feedback loop) in končno implementacijo na dejanskih brezpilotnih letalnikih.
|
||||
|
||||
\appendix
|
||||
\chapter{Primeri izračuna RDS}
|
||||
|
|
Loading…
Reference in New Issue