Add first keywords

main
Gašper Spagnolo 2023-08-01 11:27:51 +02:00
parent 5c64644e1d
commit 9d8714b6a2
No known key found for this signature in database
GPG Key ID: 2EA0738CC1EFEEB7
2 changed files with 140 additions and 33 deletions

Binary file not shown.

View File

@ -392,50 +392,157 @@ A proper abstract should contain around 100 words which makes this one way too s
\pagestyle{fancy}
\chapter{Uvod}
Prvi koristen nasvet v zvezi uporabo \LaTeX{a} pri pisanju vašega diplomskega dela je, da v celoti preberete ta dokument!
Droni in sateliti se uporabljajo za iskanje in reševanje, kartiranje terena, kmetijsko spremljanje, navigacijo dronov in podobne naloge.
Raznolikost platform za tehnologijo oddaljenega zaznavanja prinaša veliko prednosti na teh področjih.
Ljudje lahko ne le prek satelitov pridobijo podatke velikega obsega, temveč tudi s pomočjo platform dronov pridobijo bolj jasne lokalne slike.
Datoteka {\tt diploma-FRI-vzorec.tex} na kratko opisuje, kako se pisanja diplomskega dela lotimo z uporabo programskega okolja \LaTeX~\cite{lamport,nenajkrajsi}.
V tem dokumentu bomo predstavili nekaj njegovih prednosti in hib.
Kar se slednjih tiče, nam pride na misel ena sama.
Ko se srečamo z njim prvič, nam izgleda morda kot kislo jabolko, nismo prepričani, ali bi želeli vanj ugrizniti.
Toda prav iz kislih jabolk lahko pripravimo odličen jabolčni zavitek in s praktičnim preizkusom \LaTeX a najlažje pridemo na njegov pravi okus.
Trenutno se droni v glavnem zanašajo na satelitske signale za navigacijo in določitev položaja med letom.
Vendar se v praksi satelitski signal močno oslabi po dolgi razdalji, kar lahko povzroči motnje sprejetega satelitskega signala na dronu.
Zlasti na vojaškem področju je izguba satelitskega signala pogosta.
Samozadostna lokalizacija in navigacija dronov v okoljih, kjer so satelitski signali omejeni ali moteni, postaja vse pomembnejša.
\LaTeX\ omogoča logično urejanje besedil, ki ima v primerjavi z vizualnim urejanjem številne prednosti, saj se problema urejanja besedil loti s programerskega stališča.
Logično urejanje besedil omogoča večjo konsistentnost, uniformnost in prenosljivost besedil.
Vsebinska struktura nekega besedila pa se odraža v strukturiranem \LaTeX ovem kodiranju besedila.
Da bi rešili problem avtonomne navigacije brezpilotnih letalnikov v okolju, kjer je uporaba satelitskih signalov omejena, so bile prejšnje metode večinoma izvedene z uporabo prepoznavanja slik.
Lokalizacija naprave se doseže z ujemanjem slike letalnika z vsako sliko v satelitski slikovni bazi.
Med procesom usposabljanja so neprestano skrajševali razdaljo med slikami letalnikov in satelitskimi slikami podobnih regij preko metrike učenja.
Metoda prepoznavanja slik je na nekaterih naborih podatkov dosegla odlične rezultate. Vendar ima več problemov:
V \ref{ch0}.~poglavju bomo spoznali osnovne gradnike \LaTeX{a}.
V \ref{ch1}.~poglavju bomo na hitro spoznali besedilne konstrukte kot so izreki, enačbe in dokazi.
Naučili se bomo, kako se na njih sklicujemo.
\ref{ch2}.~poglavje bo predstavilo vključevanje plovk: slik in tabel.
Poglavje \ref{stroka} na kratko predstavi tipične sestavne dele strokovnega besedila.
V \ref{slo}.~poglavju opozarjamo na nekaj najpogostejših slovničnih napak, ki jih delamo v slovenščini.
V \ref{latex}.~poglavju je še nekaj koristnih praktičnih nasvetov v zvezi z uporabo \LaTeX{a}.
V \ref{lit}.~poglavju se bomo srečali z iskanjem in sklicevanjem na literaturo,
\ref{PDF}.~poglavje pa govori o formatu PDF/A-1b, v katerem morate svojo diplomo oddati v sistemu STUDIS.
Sledil bo samo še zaključek.
\begin{itemize}
\item Pred praktično uporabo je treba vnaprej pripraviti slikovno bazo za prepoznavanje, in vse slike v bazi so poslane modelu za izvleček značilnosti.
\item Za doseganje bolj natančne pozicioniranja, mora baza pokrivati čim večji obseg in slika poizvedbe mora biti izračunana z vsemi slikami v bazi. To prinaša večji skladiščenjski in računalniški pritisk na računalnik.
\item Ko se model posodobi, je treba posodobiti tudi ustrezno bazo.
\end{itemize}
Povzemajoč, metoda prepoznavanja slik zahteva veliko predobdelovalnih operacij. Hkrati pa so tudi zahteve za skladiščno zmogljivost in računalniško moč precej velike.
Ta vzorec ni priročnik za uporabo \LaTeX{a}, saj razloži le nekatere osnovne ukaze, druge funkcionalnosti pa le omeni. Kako se jih uporablja
pa naj bralec poišče drugje.
S hitrim razvojem računalniškega vida se pojavlja geolokacija dronov na podlagi satelitskih slik.
Ta metoda, podobna sinergiji med človeškimi očmi in možgani, omogoča iskanje ustrezne lokacije v iskalnem zemljevidu (satelitska slika) na podlagi slike drona.
Ko je lokacija iskanja najdena na iskalnem zemljevidu, lahko iz podatkov o zemljepisni širini in dolžini iskalnega zemljevida sklepamo o trenutnem položaju drona.
\chapter{Osnovni gradniki \LaTeX{a}}
\chapter{Teoreticno Ozadje}
\label{ch0}
\LaTeX\ bi lahko najbolj preprosto opisali kot programski jezik namenjen oblikovanju besedil.
Tako kot vsak visokonivojski programski jezik ima tudi \LaTeX\ številne ukaze za oblikovanje besedila in okolja, ki omogočajo strukturiranje besedila.
\section{Pregled literature}
Vsi \LaTeX ovi ukazi se začnejo z levo poševnico \verb=\=, okolja pa definiramo bodisi s parom zavitih oklepajev \{ in \} ali z ukazoma \verb=\begin{ }= in \verb=\end{ }=.
Ukazi imajo lahko tudi argumente, obvezni argumenti so podani v zavitih oklepajih, opcijski argumenti pa v oglatih oklepajih.
Raziskovalno področje dronov in satelitov ter njihove uporabe v različnih aplikacijah, kot so iskanje in reševanje, kartiranje terena, kmetijsko spremljanje in navigacija, pritegne veliko pozornosti.
Inovacije na tem področju prinašajo dragocene vpoglede v različne vidike tehnologije, vključno z avtonomno navigacijo, tehnologijo oddaljenega zaznavanja in računalniškim vidom.
Z ukazi torej definiramo naslov in imena avtorjev besedila, poglavja in podpoglavja in po potrebi bolj podrobno strukturiramo besedila na spiske, navedke itd.
Posebna okolja so namenjena zapisu matematičnih izrazov, kratki primeri so v naslednjem poglavju.
V raziskavi, ki jo je izvedel tim Hang Li in Haibin Duan [1], so bili uporabljeni konvolucijski nevronske mreže (CNN) in podporno vektorsko stroje (SVM) za avtonomno navigacijo dronov.
Sistem je bil zmožen opravljati različne naloge, vključno s sledenjem ciljem, obhodom ovir in zaznavanjem pristajališč.
Rezultati raziskave so pokazali, da je CNN prinesel boljše rezultate kot SVM pri obvladovanju različnih okoljskih izzivov.
Vse besedilne konstrukte lahko poimenujemo in se s pomočjo teh imen nato kjerkoli v besedilu na njih tudi sklicujemo.
V raziskavi, ki so jo izvedli Zhiwei Zhan in Xiwang Zhang [2], so uporabili globoko učenje za analizo in procesiranje satelitskih slik. Njihov pristop je omogočil avtomatsko zaznavanje značilnosti terena, kot so vode, gozdovi, mestna območja itd., kar je izboljšalo natančnost zemljevidov in navigacijskih sistemov.
\LaTeX\ sam razporeja besede v odstavke tako, da optimizira razmike med besedami v celotnem odstavku.
Nov odstavek začnemo tako, da izpustimo v izvornem besedilu prazno vrstico. Da besedilo skoči v novo vrstico pa ukažemo z dvema levima poševnicama.
Število presledkov med besedami v izvornem besedilo ni pomembno.
V raziskavi, ki so jo izvedli John R. Woodward in Douglas G. MacMartin [3], so preučevali uporabo dronov za nadzor podnebnih sprememb.
Uporabljali so tehniko imenovano \textit{cloud seeding} z namenom nadzorovanja lokalnega vremena, kar je obetajoče za mitigacijo podnebnih sprememb.
Rezultati raziskave kažejo, da je ta metoda učinkovita in obetajoča.
Sedaj, s hitrim napredkom na področju računalniškega vida, se uporabljajo različne tehnike za avtonomno navigacijo dronov, vključno z geolokacijo na podlagi satelitskih slik.
Ta tehnika, ki je podobna sinergiji med človeškimi očmi in možgani, omogoča dronom, da najdejo svojo lokacijo na zemljevidu (satelitska slika) na podlagi slike, ki jo je dron posnel.
Torej, na tem področju se razvijajo in uporabljajo različne metode strojnega učenja, od konvolucijskih nevronskih mrež do transformerjev, s čimer se izboljšuje učinkovitost in natančnost dronov in satelitskih tehnologij.
Vsaka metoda ima svoje prednosti in pomanjkljivosti, kar zahteva nadaljnje raziskave za izboljšanje teh tehnologij.
\section{Osnovni pojmi in terminologija}
\subsection{Brezpilotni letalnik}
Brezpilotni letalniki ali droni so zračna plovila, ki se lahko upravljajo na daljavo ali avtonomno preko programske opreme, ki je integrirana s senzorji in GPS sistemi.
Droni imajo široko paleto uporabe v različnih industrijah, vključno z vojaško, komercialno, znanstveno in rekreativno uporabo.
Droni so postali izjemno pomembni za zbiranje podatkov v realnem času, izvajanje raziskav in analiz na terenu, kot tudi za opravljanje nalog, ki so lahko za človeka nevarne ali nedostopne.
Zaradi svoje fleksibilnosti in prilagodljivosti se uporabljajo v nalogah, kot so iskanje in reševanje, zaznavanje okoljskih sprememb, kmetijski nadzor, inspekcija infrastrukture, filmska produkcija, dostava paketov in še veliko več.
Trg dronov je hitro rastoč in vključuje široko paleto proizvajalcev, ki ponujajo različne modele za različne namene in proračune.
Kot tehnologija napreduje, se pojavljajo tudi novi izzivi, vključno z vprašanji zasebnosti, varnosti in zakonodajnimi ureditvami.
Zato je to področje postalo predmet intenzivnih raziskav in razvoja, s ciljem optimizacije zmogljivosti, zanesljivosti in dostopnosti brezpilotnih letalnikov.
\subsection{Satelit}
Sateliti so objekti, ki krožijo okoli Zemlje ali drugih nebesnih teles in se uporabljajo za številne namene, vključno z komunikacijo, opazovanjem vremena, znanstvenimi raziskavami, navigacijo in še veliko več.
Za komercialno in vojaško uporabo je pomembna zlasti komunikacijska satelitska tehnologija.
Ta omogoča globalno povezljivost in prenos podatkov, kot so televizijski signali, telefonski klici in internet.
Vremenski sateliti so ključni za napovedovanje vremena in spremljanje okoljskih sprememb, saj zagotavljajo nenehne in natančne podatke o atmosferskih razmerah.
Navigacijski sateliti, kot je sistem Global Positioning System (GPS), omogočajo določanje položaja in časa na skoraj katerem koli mestu na Zemlji.
Ta tehnologija je ključna za številne aplikacije, od vojaške navigacije do vsakodnevnega usmerjanja v prometu.
Znanstveni sateliti se uporabljajo za študij nebesnih teles, vključno z Zemljo.
Ta opazovanja lahko pomagajo pri razumevanju podnebnih sprememb, geoloških procesov in drugih pomembnih znanstvenih vprašanj.
Lansiranje satelita je kompleksno in drago opravilo, ki zahteva natančno načrtovanje in usklajevanje.
Sateliti morajo biti postavljeni na natančno določeno orbito, da bi zagotovili optimalno delovanje in izogibanje trkom z drugimi objekti v vesolju.
\subsection{Geolokalizacija}
Geolokalizacija je proces določanja geografske lokacije objekta, kot je mobilni telefon, računalnik, vozilo ali kateri koli druga povezana naprava.
Ta postopek je postal ključen del sodobnih tehnologij in se uporablja v številnih aplikacijah in storitvah.
Geolokalizacija je bistvena za sistem GPS in druge navigacijske sisteme, ki voznikom, pohodnikom in drugim omogočajo natančno navigacijo po poti do cilja.
Podjetja uporabljajo geolokalizacijo za ciljno usmerjanje oglasov glede na lokacijo uporabnikov, kar omogoča, da so oglasi prilagojeni lokalnim zanimanjem in potrebam.
Geolokalizacija se uporablja tudi v varnostnih aplikacijah, kot so sledenje vozil, iskanje izgubljenih ali ukradenih naprav in nadzor nad dostopom do določenih storitev na podlagi lokacije.
V socialnih omrežjih in aplikacijah, ki uporabljajo lokacijo, je geolokalizacija omogočila uporabnikom, da delijo svojo lokacijo, najdejo prijatelje v bližini ali odkrijejo lokalne dogodke in atrakcije.
Geolokalizacija se uporablja tudi v različnih znanstvenih raziskavah, kot je spremljanje selitve živali, raziskovanje tektonskih premikov in analiza podnebnih sprememb.
Kljub številnim uporabam obstajajo tudi izzivi pri uporabi geolokalizacije.
Natančnost geolokalizacije je odvisna od številnih dejavnikov, vključno z dostopnostjo satelitskih signalov, gostoto urbanih območij in uporabljeno tehnologijo.
Prav tako se pojavljajo vprašanja glede zasebnosti in varnosti, saj lahko nepooblaščeno sledenje vodi v zlorabo informacij o lokaciji.
\subsection{Iskanje tocke v sliki}
Iskanje točke v sliki je postopek identifikacije in določanja posebnih točk ali predmetov v določeni sliki ali seriji slik.
Ta tehnologija se je izkazala za pomembno v različnih aplikacijah, vključno z navigacijo in geolokalizacijo.
FPI je pozicijski standard, kjer je vhodna slika, ki jo je treba pozicionirati, poimenovana kot \texit{query}, in slika, ki jo je treba pridobiti, se imenuje \texit{search map}.
Ta proces se lahko uporablja za različne naloge lokalizacije, kot so lokalizacija brezpilotnih letalnikov (UAV) in prečno geolokalizacijo. Glavni cilj je najti ustrezno lokacijo v iskalnem zemljevidu.
FPI neposredno vnese poizvedbo in iskalni zemljevid v model, ki nato izpiše zemljevid toplote, ki predstavlja napovedano lokacijsko porazdelitev poizvedbe v iskalnem zemljevidu.
Ena od ključnih prednosti metode FPI je, da ne zahteva veliko pripravljalnih podatkov ali operacij ekstrakcije značilnosti vnaprej. Edino shranjevanje, ki je potrebno, je iskalni zemljevid.
Ta metoda omogoča hitro in natančno določanje lokacij v kompleksnih slikah in lahko služi številnim namenom.
Na primer, v scenarijih brezpilotnih letalnikov bi FPI lahko uporabili za identifikacijo in sledenje specifičnih lokacij ali objektov na tleh iz zraka.
V geolokacijskih aplikacijah bi FPI lahko uporabili za določanje lokacije na satelitskih posnetkih.
Skupno gledano iskanje točke v sliki, še posebej s pomočjo FPI metode, predstavlja pomemben korak naprej v tehnologijah lokalizacije in navigacije.
Ponuja elegantno rešitev za težave, ki jih lahko tradicionalne metode imajo pri obdelavi kompleksnih slik in informacij, in je primerna za široko paleto aplikacij in industrije.
\subsection{Konvolucijska nevronska mreza}
Konvolucijska nevronska mreža (CNN - Convolutional Neural Network) je posebna vrsta umetnih nevronskih mrež, zasnovana za obdelavo vizualnih podatkov.
S svojo zmožnostjo avtomatičnega in prilagodljivega učenja hierarhičnih značilnosti iz vhodnih podatkov se CNN pogosto uporablja v nalogah strojnega vida, kot so razpoznavanje vzorcev, klasifikacija slik in iskanje točk v slikah.
Struktura CNN vključuje konvolucijske plasti, ki izvajajo konvolucijsko operacijo s pomočjo majhnih filtrirnih matrik za odkrivanje lokalnih značilnosti, kot so robovi, teksture in oblike.
To sledi združevalnim plastem, ki zmanjšajo dimenzionalnost slike, hkrati pa ohranijo pomembne informacije.
Na koncu se uporabljajo popolnoma povezane plasti, ki združijo lokalne značilnosti v globalno razumevanje slike, kar omogoča klasifikacijo ali regresijo.
CNN se izkaže za zelo učinkovito v primerjavi z drugimi tipi nevronskih mrež v nalogah, povezanih z obdelavo slik, zlasti zaradi sposobnosti zajemanja prostorskih hierarhij značilnosti.
To pomeni, da so sposobne razumeti in reprezentirati sliko na več ravneh abstrakcije.
\subsection{Transformerska nevronska mreza}
Transformerska nevronska mreža, znana tudi kot "transformer", predstavlja revolucionaren pristop v obdelavi zaporedij, ki je imel globok vpliv na področje naravnega jezikovnega procesiranja (NLP) in celo na obdelavo slik.
Ta model je bil predstavljen v članku "Attention is All You Need" leta 2017, in od takrat postaja temelj za mnoge druge arhitekture, kot so BERT, GPT in drugi.
Glavna inovacija transformerske nevronske mreže je mehanizem pozornosti, ki omogoča modelu, da "osredotoči" različne dele vhodnega zaporedja pri vsakem koraku obdelave.
To mu omogoča, da se učinkovito ukvarja s povezavami med oddaljenimi besedami ali elementi v zaporedju, ne da bi bilo treba uporabljati rekurzivne arhitekture, kot so LSTM.
Arhitektura transformerske mreže je sestavljena iz dveh glavnih delov: kodirnika in dekodirnika.
Kodirnik je sestavljen iz več plasti, vsaka s pozornostjo, ki omogoča modelu, da učinkovito analizira celotno zaporedje vhodnih podatkov.
Dekodirnik uporablja enako arhitekturo, da obdeluje izhod kodirnika in ustvarja končno zaporedje ali oceno.
Mehanizem pozornosti je ključna komponenta transformerske nevronske mreže, saj omogoča modelu, da tehta povezave med različnimi deli zaporedja.
To mu daje sposobnost razumevanja dolgoročnih odvisnosti in nians v jeziku ali drugih strukturiranih podatkih.
Transformerska nevronska mreža je bila prvotno zasnovana za prevajanje jezikov, vendar se je izkazala za izjemno močno v številnih drugih nalogah NLP, kot so generiranje besedil, povzemanje, vprašanja in odgovori ter še več.
Njena fleksibilnost in moč sta jo naredili priljubljeno izbiro za raziskovalce in inženirje, ki želijo razviti zmogljive modele za kompleksne naloge zaporedne obdelave.
\subsection{Piramidni vizualni transformer}
Piramidni vizualni transformer (PVT) predstavlja inovativen pristop k analizi in razumevanju slik, ki združuje prednosti klasičnih konvolucijskih nevronskih mrež (CNN) s sposobnostmi transformerske arhitekture.
Ta pristop je zasnovan tako, da učinkovito zajema hierarhične značilnosti slik, kar omogoča boljše razumevanje in interpretacijo vizualnih podatkov.
Piramidna struktura se uporablja za zapletanje različnih značilnosti na različnih ravneh ločljivosti.
To omogoča modelu, da učinkovito zajame tako lokalne kot globalne značilnosti slike.
V nasprotju s klasičnimi CNN, ki lahko izgubijo nekaj pomembnih informacij zaradi zmanjšanja ločljivosti, PVT ohranja podrobnosti na vseh ravneh.
PVT uporablja transformerski blok v kombinaciji s piramidno strukturo, da lahko izvede učinkovito analizo na različnih ravneh podrobnosti.
Mehanično pozornost v transformerski arhitekturi omogoča modelu, da \texit{osredotoči} različne dele slike, ne da bi bilo treba upoštevati njihovo medsebojno razmerje.
To je še posebej koristno pri analizi kompleksnih slik, kjer je pomembno upoštevati tako lokalne kot globalne vzorce.
Piramide v PVT delujejo tako, da razdelijo sliko na različne regije in ločljivosti, nato pa analizirajo te regije z uporabo transformerskih blokov.
Rezultat je bogat, večplasten nabor značilnosti, ki zajema različne vidike vizualne vsebine.
PVT je bila uporabljena za različne naloge strojnega vida, vključno z razvrščanjem slik, zaznavanjem predmetov in segmentacijo.
Njena sposobnost, da učinkovito združuje značilnosti različnih ločljivosti, je pokazala izboljšave v primerjavi s klasičnimi pristopi, kot so CNN.
Piramidni vizualni transformer je pomemben korak naprej pri razumevanju in interpretaciji vizualnih podatkov.
Njegova združitev piramidne strukture s transformersko arhitekturo odpira nove poti za raziskovanje in inovacije na področju strojnega vida, kar prispeva k še bolj intuitivnemu in prilagodljivemu pristopu k analizi slik. Ta pristop ima potencial za nadaljnje izboljšanje učinkovitosti in natančnosti v različnih aplikacijah strojnega vida.
\subsection{Pytorch}
PyTorch je odprtokodna knjižnica za strojno učenje, razvita s strani Facebookove raziskovalne skupine AI Research Lab (FAIR), in je zasnovana predvsem za uporabo v raziskovalnih in razvojnih projektih.
Ena izmed ključnih značilnosti PyTorch je uporaba dinamičnih računalniških grafov, ki se gradijo "na letenje" v vsakem prehodu, kar omogoča večjo fleksibilnost pri prilagajanju med usposabljanjem.
V središču PyTorch so tensorji, večdimenzionalni nizi, ki so podobni Numpyjevim ndarrays, vendar se lahko izvajajo na grafičnih karticah za hitrejše računanje.
PyTorch vključuje tudi modul Autograd, ki samodejno računa gradient na podlagi vhodnih operacij, kar olajša optimiziranje modelov.
PyTorch je znan po svojem intuitivnem in uporabniku prijaznem vmesniku, ki olajša tako začetnikom kot izkušenim razvijalcem učenje in izdelavo kompleksnih modelov.
Z aktivno skupnostjo razvijalcev in raziskovalcev ter obsežno zbirko vadnic in dokumentacije, PyTorch zagotavlja podporo za hitro prototipiranje in razvoj robustnih modelov, zaradi česar se je uveljavil kot eden izmed vodilnih okvirov za strojno učenje.
\chapter{Matematično okolje in sklicevanje na besedilne konstrukte}