Dodatni popravki

main
Gašper Spagnolo 2023-09-09 14:21:38 +02:00
parent 5aabae209b
commit 22fb46a29d
No known key found for this signature in database
GPG Key ID: 2EA0738CC1EFEEB7
2 changed files with 20 additions and 35 deletions

Binary file not shown.

View File

@ -295,12 +295,12 @@ Po potrebi sestavite lastno zbirko slik, ki bo dovolj zahtevna in raznovrstna.
\bigskip \bigskip
\noindent\textbf{Title:} UAV localization \noindent\textbf{Title:} UAV localization
Recently, the use of drones is becoming more and more widespread.
Despite their versatility, the question arises: how do drones behave when they lose contact with the global positioning system? The thesis focuses on the localization of aircraft based on satellite images, explore the field and evaluate the current most promising method.
If necessary, construct your own dataset of images that will be challenging and diverse enough.
\bigskip \bigskip
\noindent\textbf{Description:}\\ \noindent\textbf{Description:}\\
Recently, the use of drones is becoming more and more widespread.
Despite their versatility, the question arises: how do drones behave when they lose contact with the global positioning system? The thesis focuses on the localization of aircraft based on satellite images, explore the field and evaluate the current most promising method.
If necessary, construct your own dataset of images that will be challenging and diverse enough.
\vfill \vfill
@ -382,7 +382,7 @@ Zahvala gre tudi družini za podporo pri pisanju diplomskega dela.
\noindent Diplomsko delo predstavlja implementacijo trenutno vodilne metode za geolokalizacijo brezpilotnih letalnikov, ob izgubi sistema za določanje položaja, implementacija ni bila javno dostopna. \noindent Diplomsko delo predstavlja implementacijo trenutno vodilne metode za geolokalizacijo brezpilotnih letalnikov, ob izgubi sistema za določanje položaja, implementacija ni bila javno dostopna.
V okviru dela smo ustvarili novo podatkovno zbirko, ki vsebuje pare slik iz brezpilotnega letalnika in pripadajočih satelitskih posnetkov. V okviru dela smo ustvarili novo podatkovno zbirko, ki vsebuje pare slik iz brezpilotnega letalnika in pripadajočih satelitskih posnetkov.
Osredotočili smo se na uporabo naprednih nevronskih mrež, zlasti na piramidni vision transformer (PVT). Osredotočili smo se na uporabo naprednih nevronskih mrež, zlasti na piramidni vision transformer (PVT).
Ključno vlogo je imela Siamska nevronska mreža za primerjavo vzorcev med obema vrstama slik. Ključno vlogo je imela siamska nevronska mreža za primerjavo vzorcev med obema vrstama slik.
Metodologija je bila podprta z različnimi optimizacijskimi strategijami, vključno z uporabo stratificiranega vzorčenja, Hanningovega okna in regularizacijskih tehnik. Metodologija je bila podprta z različnimi optimizacijskimi strategijami, vključno z uporabo stratificiranega vzorčenja, Hanningovega okna in regularizacijskih tehnik.
Rezultati potrjujejo učinkovitost predlagane metode za natančno geolokalizacijo brezpilotnih letalnikov. Rezultati potrjujejo učinkovitost predlagane metode za natančno geolokalizacijo brezpilotnih letalnikov.
Delo zaključujemo s poudarkom na ključnih ugotovitvah in potencialu razvite metode. Delo zaključujemo s poudarkom na ključnih ugotovitvah in potencialu razvite metode.
@ -455,7 +455,7 @@ Vsaka posodobitev ali sprememba v osnovni nevronski mreži, ki se uporablja za p
Ko brezpilotni letalnik zajame sliko za primerjavo, mora biti ta slika primerjana z vsako sliko v bazi, da se ugotovi najboljše ujemanje. Ko brezpilotni letalnik zajame sliko za primerjavo, mora biti ta slika primerjana z vsako sliko v bazi, da se ugotovi najboljše ujemanje.
V praksi to pomeni, da ko imamo bazo sestavljeno iz milijonov slik, bo vsaka nova poizvedovalna slika potrebovala milijone primerjav, kar je precej časovno potratno in računsko intenzivno. V praksi to pomeni, da ko imamo bazo sestavljeno iz milijonov slik, bo vsaka nova poizvedovalna slika potrebovala milijone primerjav, kar je precej časovno potratno in računsko intenzivno.
V kontekstu omejitev tradicionalnih metod prepoznavanja slik so raziskovalci razvili pristop, imenovan FPI (Finding Point with Image) \cite{dai2022finding}. V kontekstu omejitev tradicionalnih metod prepoznavanja slik so raziskovalci razvili pristop, imenovan FPI (ang. Finding Point with Image) \cite{dai2022finding}.
FPI sprejme dva vhodna podatka: sliko posneto z brezpilotnim letalnikom in pripadajočo satelitsko sliko. FPI sprejme dva vhodna podatka: sliko posneto z brezpilotnim letalnikom in pripadajočo satelitsko sliko.
V kontekstu te satelitske slike je mesto, kjer je bila slika iz brezpilotnega letalnika posneta. Za obdelavo vsake slike se uporablja posebna nevronska mreža, kjer vsaka mreža obdeluje svoj nabor podatkov brez deljenja uteži z drugo. V kontekstu te satelitske slike je mesto, kjer je bila slika iz brezpilotnega letalnika posneta. Za obdelavo vsake slike se uporablja posebna nevronska mreža, kjer vsaka mreža obdeluje svoj nabor podatkov brez deljenja uteži z drugo.
Ko sta sliki obdelani in njihove značilke izluščene, se med njima izvede operacija korelacije. Ta mera podobnosti se predstavi v obliki toplotne karte, ki prikazuje stopnjo ujemanja med sliko brezpilotnega letalnika in satelitsko sliko. Najvišja vrednost na toplotni karti natančno označuje mesto, kjer je brezpilotni letalnik posnel svojo sliko na večji satelitski sliki. Informacija se nato neposredno prevede v natančno lokalizacijo brezpilotnega letalnika na satelitski sliki. Ko sta sliki obdelani in njihove značilke izluščene, se med njima izvede operacija korelacije. Ta mera podobnosti se predstavi v obliki toplotne karte, ki prikazuje stopnjo ujemanja med sliko brezpilotnega letalnika in satelitsko sliko. Najvišja vrednost na toplotni karti natančno označuje mesto, kjer je brezpilotni letalnik posnel svojo sliko na večji satelitski sliki. Informacija se nato neposredno prevede v natančno lokalizacijo brezpilotnega letalnika na satelitski sliki.
@ -632,7 +632,7 @@ Avtorji to izrazijo v spodnji obliki \cite{vaswani2017attention}:
\text{MultiHead}(Q, K, V) = \text{Concat}(\text{head}_1, ..., \text{head}_h)W_O. \text{MultiHead}(Q, K, V) = \text{Concat}(\text{head}_1, ..., \text{head}_h)W_O.
\end{equation} \end{equation}
Vsak $\text{head}_i$ je rezultat izvajanja Scaled Dot-Product Attention na $i$-tem nizu transformiranih poizvedb, ključev in vrednosti: Vsak $\text{head}_i$ je rezultat izvajanja utežene točkovne produktne pozornosti na $i$-tem nizu transformiranih poizvedb, ključev in vrednosti:
\begin{equation} \begin{equation}
\text{head}_i = \text{Attention}(QW_{Qi}, KW_{Ki}, VW_{Vi}), \text{head}_i = \text{Attention}(QW_{Qi}, KW_{Ki}, VW_{Vi}),
\end{equation} \end{equation}
@ -742,7 +742,7 @@ Arhitektura Twins-PCPVT \cite{chu2021twins} je zasnovana na osnovi PVT in CPVT \
V PVT so uporabljena absolutna pozicijska kodiranja, medtem ko Twins-PCPVT uporablja pogojna pozicijska kodiranja (ang. Conditional Positional Encoding -- CPE), V PVT so uporabljena absolutna pozicijska kodiranja, medtem ko Twins-PCPVT uporablja pogojna pozicijska kodiranja (ang. Conditional Positional Encoding -- CPE),
ki so bila predlagana v CPVT. ki so bila predlagana v CPVT.
PVT je uvedel piramidno večstopenjsko predstavitvijo z namenom boljšega obravnavanja nalog goste napovedi, kot so zaznavanje objektov in semantična segmentacija. PVT je uvedel piramidno večstopenjsko predstavitev z namenom boljšega obravnavanja nalog goste napovedi, kot so zaznavanje objektov in semantična segmentacija.
Vendar je bilo ugotovljeno, da je manjša učinkovitost PVT-ja v veliki meri posledica uporabe absolutnih pozicijskih kodiranj. Vendar je bilo ugotovljeno, da je manjša učinkovitost PVT-ja v veliki meri posledica uporabe absolutnih pozicijskih kodiranj.
Absolutna pozicijska kodiranja se soočajo s težavami pri obdelavi vhodov različnih velikosti, kar je pogosto v nalogah goste napovedi. Absolutna pozicijska kodiranja se soočajo s težavami pri obdelavi vhodov različnih velikosti, kar je pogosto v nalogah goste napovedi.
@ -808,12 +808,12 @@ V svetu raziskovanja je podatkovna množica ključnega pomena za razvoj, testira
Kljub obstoju številnih zbirk, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij, s katerimi se srečuje brezpilotni letalnik. Kljub obstoju številnih zbirk, kot so CVUSA \cite{cvusa}, CVACT \cite{cvact} in University-1652 \cite{university1652}, večina ne zajema vseh realnih situacij, s katerimi se srečuje brezpilotni letalnik.
CVUSA se osredotoča na zgradbe, medtem ko University-1652 predstavlja predvsem univerzitetna okolja. Poleg tega so objekti v sredini slike. CVUSA se osredotoča na zgradbe, medtem ko University-1652 predstavlja predvsem univerzitetna okolja. Poleg tega so objekti v sredini slike.
Zaradi pomanjkljivosti obstoječih zbirk in ker zbirka UL14 iz \cite{dai2022finding} ni dostopna, smo se soočili z izzivom pridobivanja ustreznih podatkov za analizo. Zaradi pomanjkljivosti obstoječih zbirk in ker zbirka UL14 iz \cite{dai2022finding} ni dostopna, smo se soočili z izzivom pridobivanja ustreznih podatkov za analizo.
Zbirka vsebuje posnetke s pogledom od zgoraj navzdol in je osredotočena na pogled iz brezpilotnega letalnika.
Da bi premostili to vrzel, smo se odločili, da ustvarimo lastno zbirko. Da bi premostili to vrzel, smo se odločili, da ustvarimo lastno zbirko.
Za učinkovito in fleksibilno pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \footnote{Google Earth Studio: \url{https://www.google.com/earth/studio/}} in pridobili slike iz 11 evropskih mest. Za učinkovito in fleksibilno pridobivanje slik iz brezpilotnega letalnika smo uporabili orodje Google Earth Studio \footnote{Google Earth Studio: \url{https://www.google.com/earth/studio/}} in pridobili slike iz 11 evropskih mest.
Te slike odražajo raznolikost terena, vključno z zgradbami, parki, zelenimi in vodnimi površinami. Te slike odražajo raznolikost terena, vključno z zgradbami, parki, zelenimi in vodnimi površinami.
Dodatno smo uporabili Mapbox API \footnote{Mapbox API: \url{https://www.mapbox.com/api-documentation/}} za pridobitev pripadajočih satelitskih slik. Dodatno smo uporabili Mapbox API \footnote{Mapbox API: \url{https://www.mapbox.com/api-documentation/}} za pridobitev pripadajočih satelitskih slik.
Zbirka vsebuje posnetke s pogledom od zgoraj navzdol in je osredotočena na pogled iz brezpilotnega letalnika.
Skupno naša podatkovna baza vključuje več kot 11.000 slik. Slike so bile pridobljene s simulacijo letenja in so razvrščene v koherentnem časovnem zaporedju. Skupno naša podatkovna baza vključuje več kot 11.000 slik. Slike so bile pridobljene s simulacijo letenja in so razvrščene v koherentnem časovnem zaporedju.
V članku \cite{dai2022finding, wang2023wamf} so avtorji uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo. V članku \cite{dai2022finding, wang2023wamf} so avtorji uporabili podatkovno množico UL14, ki vključuje 6.768 slik za učenje in 2.331 slik za validacijo.
@ -835,7 +835,7 @@ Zajem slik je bil izveden na naključnih poteh po mestu, kar omogoča širok spe
V mestnih območjih je poudarek na razumevanju, kako se brezpilotni letalniki lokalizirajo in navigirajo med visokimi zgradbami, kjer so lahko GPS signali zmanjšani ali moteni. V mestnih območjih je poudarek na razumevanju, kako se brezpilotni letalniki lokalizirajo in navigirajo med visokimi zgradbami, kjer so lahko GPS signali zmanjšani ali moteni.
V zelenih območjih je cilj razumeti, kako se brezpilotni letalniki obnašajo v okoljih, kjer so vizualni vzorci manj unikatni. V zelenih območjih je cilj razumeti, kako se brezpilotni letalniki obnašajo v okoljih, kjer so vizualni vzorci manj unikatni.
V naboru podatkov za učenje je 10.000 slik iz desetih mest, pri čemer vsako mesto prispeva 1.000 slik. V naboru podatkov za učenje je 10.000 slik iz desetih mest, pri čemer vsako mesto prispeva 1.000 slik.
Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF. Sistem ECEF (ang. Earth Centered, Earth Fixed) je globalni koordinatni sistem z izhodiščem v središču Zemlje. Vsaka slika je opremljena z oznakami lokacije kamere v sistemu ECEF \footnote{ECEF: \url{http://dirsig.cis.rit.edu/docs/new/coordinates.html}}. Sistem ECEF (ang. Earth Centered, Earth Fixed) je globalni koordinatni sistem z izhodiščem v središču Zemlje.
Brezpilotni letalniki so bili kalibrirani na višini 150 metrov nad navedeno nadmorsko višino mesta. Brezpilotni letalniki so bili kalibrirani na višini 150 metrov nad navedeno nadmorsko višino mesta.
Kamere na brezpilotnih letalnikih imajo vidno polje 80 stopinj in so usmerjene pravokotno na središče Zemlje. Vse slike so bile ustvarjene z uporabo orodja Google Earth Studio \footnote{Google Earth Studio: \url{https://www.google.com/earth/studio/}}. Kamere na brezpilotnih letalnikih imajo vidno polje 80 stopinj in so usmerjene pravokotno na središče Zemlje. Vse slike so bile ustvarjene z uporabo orodja Google Earth Studio \footnote{Google Earth Studio: \url{https://www.google.com/earth/studio/}}.
@ -1045,20 +1045,8 @@ Ta struktura je bolj prilagojena za naloge goste napovedi.
Pravzaprav uporaba piramidne predstavitve zagotavlja osnovo za kasnejšo integracijo modula WAMF. Pravzaprav uporaba piramidne predstavitve zagotavlja osnovo za kasnejšo integracijo modula WAMF.
Poleg tega mreža s piramidno predstavitvijo lahko zmanjša obseg potrebnih izračunov in s tem izboljša hitrost procesiranja, kar je ključno za učinkovito uporabo metode v praksi. Poleg tega mreža s piramidno predstavitvijo lahko zmanjša obseg potrebnih izračunov in s tem izboljša hitrost procesiranja, kar je ključno za učinkovito uporabo metode v praksi.
Po obdelavi slike s pomočjo PCPVT-S se podobnost neposredno izračuna na zadnjih značilnostnih mapah.
Kljub temu je končni izhod stisnjen samo za faktor štiri v primerjavi z vhodom, kar je potem z bikubično interpolacijo povečano nazaj na velikost vhodne satelitske slike.
Pristranskost, ki je posledica nizke ločljivosti značilnostne mape, je bila odstranjena že na samem začetku. Pristranskost, ki je posledica nizke ločljivosti značilnostne mape, je bila odstranjena že na samem začetku.
Ker značilnostna mapa z visoko ločljivostjo vsebuje več prostorskih informacij, je bila združena z globoko značilnostno mapo, bogato s semantičnimi informacijami, preko lateralne povezovalne strukture. Končni izhod je stisnjen samo za faktor štiri v primerjavi z vhodom, kar je potem z bikubično interpolacijo povečano nazaj na velikost vhodne satelitske slike.
Prva faza obdelave v metodi WAMF-FPI je uporaba konvolucijskega jedra velikosti ena, ki prilagodi kanalsko dimenzijo tri-stopenjske značilnostne mape, pridobljene s pomočjo PCPVT-S.
Število izhodnih kanalov je bilo nastavljeno na 64, kar zagotavlja kompaktno in učinkovito zastopanje značilnosti.
Po tej fazi sledi upsampling operacija na značilnostnih mapah zadnjih dveh stopenj, ki poveča njihovo ločljivost in s tem omogoča bolj precizno lokalizacijo.
Te mape se nato kombinirajo z značilnostnimi mapami istega merila iz osnovnega modela.
Končno, značilnosti so dodatno izluščene s pomočjo konvolucijskega jedra velikosti 3, kar modelu omogoča izluščenje bolj kompleksnih značilnosti iz združenih map.
Rezultat je združena značilnostna mapa, ki združuje plitve (prostorske) in globoke (semantične) informacije.
Ta bogata kombinacija modelu omogoča učinkovito prepoznavanje in lokalizacijo objektov na vhodnih slikah.
\subsection{Arhitektura utežno-prilagodljivega združevanja večznačilnostnih lastnosti (WAMF)} \subsection{Arhitektura utežno-prilagodljivega združevanja večznačilnostnih lastnosti (WAMF)}
Modul za združevanje značilnosti je zasnovan tako, da združuje informacije iz dveh ločenih vhodnih tokov, v tem primeru iz UAV (brezpilotnega letalnika) in SAT (satelita). Modul za združevanje značilnosti je zasnovan tako, da združuje informacije iz dveh ločenih vhodnih tokov, v tem primeru iz UAV (brezpilotnega letalnika) in SAT (satelita).
@ -1112,7 +1100,8 @@ Na izhodu dobimo toplotno karto iste velikosti kot vhodna satelitska slika v WAM
\subsection{Metrika RDS} \subsection{Metrika RDS}
Da bi lahko ovrednotili in primerjali zmogljivost našega modela, uporabljamo metriko RDS \cite{wang2023wamf}. Zaradi različnih meril podatkov v naboru podatkov vsak piksel v različnih satelitskih slikah predstavlja različno razdaljo. Da bi lahko ovrednotili in primerjali zmogljivost našega modela, uporabljamo metriko RDS \cite{wang2023wamf}.
Zaradi različnih meril podatkov v naboru podatkov vsak piksel v različnih satelitskih slikah predstavlja različno razdaljo.
Čeprav model morda najde točko, ki je na satelitski sliki blizu dejanske lokacije, lahko v resničnem prostoru povzroči veliko napako. Čeprav model morda najde točko, ki je na satelitski sliki blizu dejanske lokacije, lahko v resničnem prostoru povzroči veliko napako.
Da bi se izognili težavam zaradi spremembe merila, RDS izračuna relativno razdaljo na ravni pikslov med napovedano in dejansko točko. Da bi se izognili težavam zaradi spremembe merila, RDS izračuna relativno razdaljo na ravni pikslov med napovedano in dejansko točko.
@ -1131,14 +1120,14 @@ kjer so:
\item \( k \) je faktor merila, ki je v tem delu postavljen na 10. \item \( k \) je faktor merila, ki je v tem delu postavljen na 10.
\end{itemize} \end{itemize}
Za lažje razumevanje delovanja RDS metrike smo dodali Dodatek \ref{appendix:RDS} k diplomskemu delu, ki vsebuje tri primere izračuna metrike. Za lažje razumevanje delovanja metrik RDS smo dodali Dodatek \ref{appendix:RDS} k diplomskemu delu, ki vsebuje tri primere izračuna metrike.
\subsection{Učenje modela} \subsection{Učenje modela}
Model smo učili na računalniškem sistemu s procesorjem Intel(R) Xeon(R) CPU E5-2690 v3 @ 2.60GHz z 12 jedri ter grafično kartico NVIDIA GeForce RTX 3060 z 12 GB pomnilnika. Model smo učili na računalniškem sistemu s procesorjem Intel(R) Xeon(R) CPU E5-2690 v3 @ 2.60GHz z 12 jedri ter grafično kartico NVIDIA GeForce RTX 3060 z 12 GB pomnilnika.
Razvoj je temeljil na platformi Ubuntu z uporabo Python \footnote{Programski jezik Python: \url{https://www.python.org/}} knjižnice PyTorch \footnote{Knjižnica Pytorch: \url{https://pytorch.org/}}. Razvoj je temeljil na platformi Ubuntu z uporabo Python \footnote{Programski jezik Python: \url{https://www.python.org/}} knjižnice PyTorch \footnote{Knjižnica Pytorch: \url{https://pytorch.org/}}.
V času učenja našega modela ni prišlo do povečane energetske porabe, saj je bil računalnik neprestano napajan iz lokalne sončne elektrarne. V času učenja našega modela ni prišlo do povečane energetske porabe, saj je bil računalnik neprestano napajan iz lokalne sončne elektrarne.
To pomeni, da je bil celoten postopek učenja izveden na okolju prijazen način, brez dodatnega obremenjevanja električnega omrežja ali uporabe fosilnih goriv. To pomeni, da je bil celoten postopek učenja izveden na okolju prijazen način, brez dodatnega obremenjevanja električnega omrežja.
Za dosego optimalnih rezultatov smo uporabili naslednje specifične hiperparametre in nastavitve: Za dosego optimalnih rezultatov smo uporabili naslednje specifične hiperparametre in nastavitve:
@ -1153,7 +1142,7 @@ Za dosego optimalnih rezultatov smo uporabili naslednje specifične hiperparamet
\item[Vizualizacija:] vključena za spremljanje napredka učenja. \item[Vizualizacija:] vključena za spremljanje napredka učenja.
\end{description} \end{description}
Za vsako iteracijo učenja smo iz vsake satelitske slike naključno izrezali regijo velikosti 400 x 400 pikslov. Za vsako iteracijo učenja smo iz vsake satelitske slike naključno izrezali regijo velikosti 400 x 400 pikslov.
Ključnega pomena je bilo, da se je točka lokalizacije vedno nahajala nekje znotraj te izrezane regije. Ključnega pomena je bilo, da se je točka lokalizacije vedno nahajala nekje znotraj te izrezane regije.
Med postopkom učenja smo izvajali osrednji izrez (ang. center crop) velikosti 128 x 128 pikslov iz slike z ločljivostjo 1920 x 1080. Med postopkom učenja smo izvajali osrednji izrez (ang. center crop) velikosti 128 x 128 pikslov iz slike z ločljivostjo 1920 x 1080.
Ta pristop nam je omogočil simulacijo različnih višin brez potrebe po generiranju podatkovnega nabora z različnimi višinami. Ta pristop nam je omogočil simulacijo različnih višin brez potrebe po generiranju podatkovnega nabora z različnimi višinami.
@ -1192,7 +1181,7 @@ Namesto enakega pomena vseh pozitivnih vzorcev, kriterijska funkcija Hanning dod
\label{fig:gt_heatmap_with_label} \label{fig:gt_heatmap_with_label}
\end{figure} \end{figure}
To je zato, ker je pomembnost središčnega položaja veliko večja kot pomembnost robovnih položajev, kar je v kontekstu satelitskih slik logično in smiselno. To je zato, ker je pomembnost središčnega položaja veliko večja kot pomembnost robovnih položajev, kar je v kontekstu satelitskih slik smiselno.
Za normalizacijo teh pozitivnih uteži se uporablja Hanningovo okno, za normalizacijo negativnih uteži pa \( 1 / \# \text{negativnih vzorcev} \). Za normalizacijo teh pozitivnih uteži se uporablja Hanningovo okno, za normalizacijo negativnih uteži pa \( 1 / \# \text{negativnih vzorcev} \).
Uteži so dodeljene tako, da je vsota uteži pozitivnih in negativnih vzorcev enaka 1. Uteži so dodeljene tako, da je vsota uteži pozitivnih in negativnih vzorcev enaka 1.
A ker je število negativnih vzorcev običajno večje od števila pozitivnih vzorcev, postane utež negativnih vzorcev manjša. A ker je število negativnih vzorcev običajno večje od števila pozitivnih vzorcev, postane utež negativnih vzorcev manjša.
@ -1215,7 +1204,7 @@ Uteži primerov:
kjer je: kjer je:
\begin{itemize} \begin{itemize}
\item \textbf{NG} je Negativna utež \item \textbf{NG} je negativna utež
\item \textbf{NN} je število vseh uzorcev \item \textbf{NN} je število vseh uzorcev
\item \textbf{NW} je normalizacijski faktor \item \textbf{NW} je normalizacijski faktor
\item \textbf{HN(n)} je vrednost Hanningove funkcije na lokaciji. \item \textbf{HN(n)} je vrednost Hanningove funkcije na lokaciji.
@ -1435,10 +1424,6 @@ Kljub temu je treba upoštevati omejitve stratificiranega vzorčenja, kot so ome
\section{Vpliv velikosti Hanningovega okna} \section{Vpliv velikosti Hanningovega okna}
Hanningova kriterijska funkcija je ključna za določanje uteži vzorcev v satelitskih slikah. Hanningova kriterijska funkcija je ključna za določanje uteži vzorcev v satelitskih slikah.
Spreminjanje velikosti njenega okna neposredno vpliva na razporeditev in obliko uteži, kar ima posledično vpliv na kakovost rezultatov.
\subsection{Dinamika različnih velikosti Hanningovih oken}
Majhna velikost okna omejuje območje vzorcev, ki ga zajema. Majhna velikost okna omejuje območje vzorcev, ki ga zajema.
Takšna omejitev lahko zmanjša učinkovitost povratnega razširjanja med učenjem modela, saj kriterijska funkcija nima dovolj širokega vpliva na celotno mrežo. Takšna omejitev lahko zmanjša učinkovitost povratnega razširjanja med učenjem modela, saj kriterijska funkcija nima dovolj širokega vpliva na celotno mrežo.
Nasprotje predstavlja preveliko okno, ki zajema široko paleto vzorcev. Kljub širšemu zajemu, lahko detajli v sliki postanejo manj opazni, kar zmanjšuje natančnost predikcij. Nasprotje predstavlja preveliko okno, ki zajema široko paleto vzorcev. Kljub širšemu zajemu, lahko detajli v sliki postanejo manj opazni, kar zmanjšuje natančnost predikcij.
@ -1451,7 +1436,7 @@ Referenčni sliki za testiranje sta prikazani na sliki \ref{fig:sat_drone}.
\begin{figure}[h] \begin{figure}[h]
\centering \centering
\includegraphics[width=\textwidth]{./img/sat_drone.png} \includegraphics[width=0.9\textwidth]{./img/sat_drone.png}
\caption{Primer referenčnih slik, ki smo jih uporabili za testiranje.} \caption{Primer referenčnih slik, ki smo jih uporabili za testiranje.}
\label{fig:sat_drone} \label{fig:sat_drone}
\end{figure} \end{figure}
@ -1460,7 +1445,7 @@ Eksperimenti so bili izvedeni z različnimi velikostmi oken, da bi ugotovili nji
Podatki kažejo na optimalno ravnovesje med velikostjo oken in natančnostjo modela. Podatki kažejo na optimalno ravnovesje med velikostjo oken in natančnostjo modela.
Najboljše uspešnosti so bile dosežene z okni velikosti 31 in 33. Te velikosti sovpadajo s priporočili iz literature, kjer je bila optimalna velikost okna določena na 33 \cite{wang2023wamf}. Najboljše uspešnosti so bile dosežene z okni velikosti 31 in 33. Te velikosti sovpadajo s priporočili iz literature, kjer je bila optimalna velikost okna določena na 33 \cite{wang2023wamf}.
Čeprav imajo nekatera druga okna boljšo vrednost kriterijske funkcije (vidno v dodatku \ref{appendix:primerjava3d}), je analiza slik pokazala, da je najmanj šuma prav pri oknih velikosti 31 in 33. Čeprav imajo nekatera druga okna boljšo vrednost kriterijske funkcije (vidno v Dodatku \ref{appendix:primerjava3d}), je analiza slik pokazala, da je najmanj šuma prav pri oknih velikosti 31 in 33.
Okna, ki imajo manjše ali večje jedro od teh velikosti, začnejo vnašati šum na različnih lokacijah, kar vodi do zmanjšane natančnosti pri lokalizaciji. Ta šum lahko moti interpretacijo satelitskih slik in zmanjša zanesljivost modela. Okna, ki imajo manjše ali večje jedro od teh velikosti, začnejo vnašati šum na različnih lokacijah, kar vodi do zmanjšane natančnosti pri lokalizaciji. Ta šum lahko moti interpretacijo satelitskih slik in zmanjša zanesljivost modela.
Zaključimo lahko, da je izbira prave velikosti Hanningovega okna ključna za doseganje optimalnih rezultatov. Zaključimo lahko, da je izbira prave velikosti Hanningovega okna ključna za doseganje optimalnih rezultatov.
@ -1590,7 +1575,7 @@ Neprednaučena mreža & 8.21 & 0.627 & 0.630 & 60.23 \\
Kriterijska funkcija & $<$ 10m [\%] & $<$ 20m [\%] & $<$ 50m [\%] & $<$ 100m [\%] \\ Kriterijska funkcija & $<$ 10m [\%] & $<$ 20m [\%] & $<$ 50m [\%] & $<$ 100m [\%] \\
\hline \hline
Prednaučena mreža & 65.22 & 71.66 & 75.87 & 81.45 \\ Prednaučena mreža & 65.22 & 71.66 & 75.87 & 81.45 \\
Brez prednaučene mreže & 34.98 & 34.45 & 53.43 & 64.79 \\ Neprednaučena mreža & 34.98 & 34.45 & 53.43 & 64.79 \\
\hline \hline
\end{tabular} \end{tabular}
\caption{Rezultati ob uporabi prednaučene mreže, kjer je prikazan odstotek primerov z napako manjšo od določene razdalje.} \caption{Rezultati ob uporabi prednaučene mreže, kjer je prikazan odstotek primerov z napako manjšo od določene razdalje.}