Lectio praecursoria

24/04/2016

Arvoisa kustos, kunnioitettu vastaväittäjä, hyvät kuulijat.

Lektiossa käsittelen käänteisongelmia ja erityisesti sähköimpedanssitomografiaa. Tätä varten kuvailen ensin mikä on suora ongelma ja mikä on käänteis- eli inversio-ongelma. Suorassa ongelmassa kappaleen tai ilmiön rakenne tunnetaan. Rakenteesta yritetään päätellä kappaleen käytös joissain olosuhteissa. Käänteisongelmassa havaitaan kappaleen käytös tietyissä olosuhteissa. Käytöksestä yritetään päätellä kappaleen rakennetta. Käyn läpi esimerkkejä asian selventämiseksi.

Röntgen-kuvaa varten ihmisen läpi lähetetään säteilyä, josta osa imeytyy kudoksiin ja loppu pääsee läpi mitattavaksi. Kudokset, joiden läpi säteily kulkee, määrittävät säteilyn vaimenemisen. Röntgenkuvantamiseen liittyvä suora ongelma on laskea, kuinka paljon säteilyä läpäisee ihmisen missäkin kohdassa.

Röntgenkuvantamiseen liittyvässä käänteisongelmassa tiedämme, kuinka suuri osa säteilystä on läpäissyt kehon missäkin kohdassa. Tästä haluamme selvittää, mitä kudoksia on ollut säteilyn matkalla. Koska luukudos imee säteilyä runsaasti ja rasvakudos sekä keuhkot vain vähän, voi kehon koostumuksen selvittää; näin tehdään DXA-tutkimuksissa.

Väitöskirja käsittelee Calderónin ongelmaa. Calderónin ongelma on yksinkertaistava matemaattinen malli sähköimpedanssitomografialle, tai vastaavalle lämpöön perustuvalle kuvantamiselle. Lämpötila on konkreettisempi, joten aloitan siitä.

Lämpimässä saunassa sekä puisten lauteiden että teräksisten naulojen lämpötila on sama. Teräs kuitenkin johtaa lämpöä huomattavasti paremmin kuin puu ja naula nopeammin kuin laude. Siksi naula tuntuu laudetta kuumemmalta. Täten on mahdollista saada selville jotain kappaleen johtavuudesta tutkimalla lämmön virtausta kappaleen pinnalla. Käänteisongelmien tutkimuksessa tuloksia, joissa selvitetään kappaleen pinnan johtavuus, kutsutaan reunamääritystuloksiksi. Tässä nimenomaisessa esimerkissä myös johtavuus pintaa syvemmällä vaikuttaa tulokseen.

Kuvittele käteesi metallinen juomapullo. Onko kyseessä termospullo vai aivan tavallinen metallista tehty pullo? Metalli johtaa lämpöä hyvin. Termospullossa on metallikerrosten välissä tyhjiö, joka ei johda lämpöä, eli toimii eristeenä. Täytä pullo kuumalla vedellä. Jos pullon ulkopinta lämpenee nopeasti, on kyseessä tavallinen pullo. Jos ulkopinta ei pian lämpene, on kyseessä termospullo. Näin havaitset eristeen pullon sisällä rikkomatta pulloa. Ympäröivää ainetta huomattavasti pienemmän tai suuremman johtavuuden aluetta kutsutaan sisältymäksi. Sisältymien havaitseminen ja kuvaileminen on osa käänteisongelmien tutkimusta.

Abstraktimmin: Suora ongelma on laskea, miten lämpötila vaihtelee kappaleen sisällä, kun lämpötila ulkopinnalla tiedetään ja lämmönjohtavuus kappaleen sisällä tunnetaan. Matemaattisessa ongelmassa tutkitaan tilannetta, jossa lämpötila kappaleen sisällä on ehtinyt tasaantua, eikä siis muutu ajan myötä. Calderónin käänteisongelma on selvittää kappaleen sisäinen lämmönjohtavuus. Tiedot, joiden perusteella se tulisi selvittää, ovat kappaleen pintalämpötilat ja niihin liittyvät lämmön johtumiset. Tarkemmin sanottuna, nopeus jolla lämpö johtuu pois kappaleesta tai sisään kappaleeseen tunnetaan. Kappaleen sisällä tapahtuvaa lämmön johtumista ei saada etukäteen tietää.

Calderónin ongelmassa oletetaan, että kaikki mahdolliset reunalämpötilat ja niihin liittyvät lämmön johtumisnopeudet tiedetään. Käytännössä tämä on ilmeisen mahdotonta ja joudutaan tyytymään äärelliseen määrään mittauksia.

Sama matemaattinen malli kuvaa sekä sähkön että lämmön virtausta tilanteessa, jossa jännitteen tai lämpötilan jakauma ei muutu ajan myötä. Tällöin lämpötila ja jännite vastaavat toisiaan, samoin kuin sähkövirta ja lämpövirta. Lämpövirta kuvaa lämmön johtumista.

Sähköimpedanssitomografia yrittää selvittää kappaleen sähkönjohtavuutta mittaamalla jännitettä ja sähkövirtaa kappaleen ulkopinnoilta.

Alberto Pedro Calderón, jonka mukaan Calderónin ongelma on nimetty, työskenteli öljy-yhtiössä, jonka palveluksesta hän siirtyi matematiikan tutkimiseen. Calderónin ensimmäinen ja ainoa käänteisongelmia koskeva artikkeli sai inspiraationsa öljyn etsimisestä sähköisin mittauksin. Vettä — kuten vuotavia kohtia putkistoissa — voi etsiä vastaavin menetelmin.

Muina esimerkkeinä lääketieteen ulkopuolelta mainitsen maamiinojen havaitsemisen ja betonirakenteiden tutkimisen.

Miinan metallikuori johtaa sähköä paljon paremmin kuin maa yleensä. Kostea betoni johtaa hiukan sähköä, kun taas betonia vahvistavat rautatangot johtavat sitä hyvin ja halkeamat betonissa eivät lainkaan. Tämä mahdollistaa betonirakenteiden eheyden tarkistamisen särkemättä rakennetta. Jos betonin päällystää ohuella kerroksella sähköä johtavaa maalia, niin pienikin murtuma vaurioittaa maalikerrosta. Vaurio näkyy helposti sähköisissä mittauksissa.

Lääketieteellisessä kuvantamisessa sähköimpedanssitomografiaa käytetään rintasyövän etsimiseen ja keuhkojen tarkkailuun. Syöpäkudos kasvattaa itseensä runsaasti verisuonia ja runsas verimäärä aiheuttaa kudoksen sähkönjohtavuuden kasvun. Keuhkot täyttävä ilma puolestaan ei johda hyvin sähköä, joten hengitys ja häiriöt keuhkojen toiminnassa voi havaita.

Vertailen seuraavaksi sähköimpedanssitomografiaa ja röntgenkuvantamista keskenään. Röntgenkuvantamisella on pitkä historia ja sen taustalla oleva matematiikka on hyvin tunnettua. Ongelma on matemaattisesti helpompi kuin impedanssitomografiassa. Röntgenin avulla voi piirtää tarkkarajaisia kuvia. Impedanssitomografialla piirretyt kuvat eivät ole tarkkarajaisia, mutta johtavuuserot erottuvat niissä selvästi. Tärkeämpää on kuitenkin röntgenkuvauksessa käytetty radioaktiivinen eli ionisoiva säteily. Ionisoivalle säteilylle altistuminen nostaa syövän riskiä. Syöpäpotilasta seuratessa syöpäkasvaimen rohkaiseminen aina, kun syövän tilannetta tarkkaillaan, on erityisen ikävää.

Impedanssitomografia ei käytä ionisoivaa säteilyä, eikä siis kasvata syöpäriskiä. Tutkimusten mukaan rintasyövän seulonnassa impedanssitomografian käyttö yhdessä muiden menetelmien kanssa on tuottanut hyviä tuloksia ja pelkkä impedanssitomografia on myös toiminut kohtuullisesti.

Ennen kuin kerron omasta tutkimuksestani, mainitsen Ohmin lain, joka saattaa olla tuttu koulufysiikasta. Ajattele kuparilangan pätkää. Jos laitat sen osaksi sähköpiiriä ja langan päiden välillä on jännite-ero, niin sähkövirta kulkee langan läpi. Sähkövirran suuruus ja jännite ovat suoraan verrannolliset eli riippuvat toisistaan lineaarisesti – jos toisen kaksinkertaistaa, niin myös toinen kaksinkertaistuu. Sähkövirran suuruuden ja jännitteen suhde on langan sähkönjohtavuus eli resistanssin, vastuksen, käänteisluku. Jännitteen, virran ja johtavuuden välistä suhdetta kutsutaan Ohmin laiksi. Ohmin laki on likimääräinen kuvaus luonnon toiminnasta, eikä päde kaikissa olosuhteissa.

Väitöskirjassani tutkin Ohmin lain sijasta potenssilakia vastaavaa matemaattista mallia. Ohmin lain mukaan jännite-ero ja virta kytkeytyvät lineaarisesti, mikä vastaa potenssia yksi. Potenssilakitilanteessa potenssi voi olla muukin positiivinen luku kuin yksi. Väitöskirjan otsikossa esiintyvä p liittyy materiaalin noudattamaan potenssilakiin.

Potenssilaki on esimerkki epälineaarisesta suhteesta. Lineaariset ongelmat ovat matematiikassa helpompia kuin epälineaariset samasta syystä kuin banaanikärpäsen tutkiminen on helpompaa kuin kaikkien elävien olentojen tutkiminen. Tässä analogiassa potenssilakia noudattavat materiaalit vastaavat kärpästen alalahkoa – potenssilait kattavat suuremman kirjon materiaaleja kuin pelkät lineaariset suhteet, mutta maailma on vielä paljon laajempi.

Materiaaleja, jotka noudattavat potenssilakiversiota Ohmin laista, käytetään esimerkiksi varistoreissa. Varistorin sähkönjohtavuus ja vastus riippuvat jännitteestä. Varistoreita käytetään ainakin ylijännitesuojissa. Ei ole selvää, haluaako kukaan kuvantaa varistoria tai muuta potenssilain mukaan käyttäytyvää materiaalia sähköisin mittauksin, joten väitöskirja on matemaattista perustutkimusta.

Matemaattisena mallina potenssilaki on kuitenkin luonnollinen yleistys tavalliselle Ohmin laille. Potenssilakia noudattavien materiaalien tutkimus antaa tietoa menetelmistä, jotka saattavat toimia myös muissa epälineaarisissa tilanteissa.

Tutkimuksen tulokset koskevat suoraa ongelmaa, reunamääritystä ja sisältymiä. Suorana ongelmana tutkin tapausta, jossa kappaleen sisällä on eristäviä ja täydellisesti johtavia sisältymiä. Esimerkkinä on tyhjiökerros termospullossa tai rautatanko hiukan kostessa betonissa. Raudan johtavuus on niin paljon suurempi kuin ympäröivän aineen, että sen käsittely äärettömänä ei luultavasti aiheuta merkittävää virhettä. Käy ilmi, että suora ongelma on järkevä tällaisissa tilanteissa.

Reunamääritys vastaa karkeasti saunassa naulan tai puun koskemista. Aiemmin professorit Mikko Salo ja Xiao Zhong olivat antaneet reunamääritystuloksen, jonka mukaan potenssilakitilanteessa saadaan selville johtavuus kappaleen pinnalla. Väitöskirja kertoo, miten myös johtavuuden derivaatta saadaan selville kappaleen pinnalla. Derivaatta kertoo johtavuuden muutoksesta, kun siirrytään hiukan sisemmäs kappaleeseen. Tulos ei kuitenkaan riitä kappaleen sisäosien johtavuuden määrittämiseen.

Sisältymä tarkoittaa kappaleen osaa, jossa johtavuus on huomattavasti suurempi tai pienempi kuin ympäröivässä aineessa. Jos sisältymän johtavuus on sopiva, eli pysyy kaukana nollasta ja äärettömästä, eristeestä ja suprajohteesta, niin sisältymä paikannetaan ja sen karkea koko saadaan myös selville.

Jos sisältymän johtavuus on joko nolla tai ääretön, eli sisältymä on eriste tai täydellisen johtava, niin saadaan selville, onko sisältymää. Lisäksi sisältymälle saadaan yläraja eli sisältymää suurempi alue löydetään, mutta tarkkuudesta ei ole takeita.

Toinen esijulkaisuni, joka on kirjoitettu yhteistyössä väitöstyön ohjaajani Mikko Salon sekä Manas Karin kanssa, löytyy arXivista osoitteesta http://arxiv.org/abs/1410.4048 . Manas on post doc -tutkija Jyväskylässä, eli kankeasti suomennettuna väitöskirjan jälkeisiä jatkotutkintoja suorittamassa.

Toinen artikkeli käsittelee suurinpiirtein samaa aihetta kuin ensimmäinen, mutta tulokset ovat varsin erilaisia. Kirjoitan ongelmasta kohtalaisen yleistajuisesti. Viimeksi mukana oli aavistus ongelman historiaa ja matemaattisempaa selitystä, joten en toista niitä tällä kertaa. Tämän tuloksen matemaattinen esitys löytyy arXivista.

Oletetaan, että meillä on sähköä (tai lämpöä; matemaattinen malli on sama) johtava kappale, jonka sisäistä rakennetta halutaan tutkia. Sähköimpedanssitomografian avulla voidaan esimerkiksi yrittää löytää syöpäkasvaimia, koska ne johtavat sähköä ympäröivää kudosta tehokkaammin, koska niisä on tehostunut verenkierto. Tutkittavan kappaleen ympärille asetetaan elektrodeja, joiden avulla asetetaan jännite-eroja. Jännite-erojen aiheuttama virta mitataan. Tästä tiedosta pyritään selvittämään kappaleen (sähkön) johtavuus. Vastaavasti asettamalla lämpötila kappaleen reunoilla ja mittaamalla lämmön johtumista kappaleeseen ja kappaleesta saadaan samanlaista dataa.

Jännite-erojen aiheuttaman virran mittaus vastaa jännitejakauman ylläpidon vaatimaa tehoa, eli käytännössä asetelmassa mitataan jännite-erojen ylläpidon vaatimaa tehoa. Ajatellaan kahta kappaletta, joista toinen on vakiojohtavuuksinen – yksiköt sopivasti valitsemalla voidaan olettaa johtavuuden olevan yksi kaikkialla kappaleessa. Ajatellaan, että toinen kappale sisältää inkluusion, eli alueen, jossa johtavuus on joko huomattavasti suurempi tai huomattavasti pienempi kuin ympäristössä – voisi esimerkiksi olla, että inkluusion johtavuus vaihtelee kahdesta kymmeneen, tai kuudesosasta kolmasosaan. Keskityn tässä tilanteeseen, jossa inkluusion johtavuus on suurempi kuin ympäristön. Pienemmän johtavuuden tilanne toimii vastaavasti.

Suurempi johtavuus tarkoittaa järjestelmän vaativan enemmän energiaa. Tilanne on helpompi ajatella lämmön kautta. Ajatellaan, että joku haluaisi samaan tilaan sekä lämpimän että kylmän alueen – vaikkapa +10 astetta ja +30 astetta. Jos nämä haluaisi samaan teollisuushalliin, ei ongelmaa olisi – patterit kovemmalle toisessa päässä kuin toisessa. Jos haluaisi vastaavan eron olohuoneeseen, niin työtä pitäisi tehdä paljon enemmän, koska matka kuuman ja kylmän alueen välillä olisi lyhempi. Alueiden tuominen aivan vierekkäin vaatii erittäin suuret määrät työtä, koska lämmin ilma sekoittuisi välittömästi kylmän kanssa. Suuri johtavuus vastaa etäisyyksien lyhentämistä, koska lämpö pääsee liikkumaan nopeammin ja tasoittamaan eroja nopeammin.

Jos vertaamme vakiojohtavuuksista kappaletta ja samankokoista ja -muotoista kappletta, jossa on suuren johtavuuden alue, niin saman reunajännitejakauman ylläpito vaatii korkeajohtavuuksisen alueen tilanteessa enemmän tehoa. Tämä ero on mahdollista havaita käytetyillä mittausmenetelmillä. Menetelmässä asetetaan jännitteet siten, että osaan alueesta keskittyy paljon jännite-eroja ja siten virtaa, ja toiseen osaan erittäin vähän eroja ja virtaa. Jos korkeajohtavuuksinen alue osuu suurten jännite-erojen puolelle, niin huomataan, että jännitteiden ylläpitäminen vaatii huomattavasti oletettua enemmän tehoa, ja jos inkluusio on kokonaan matalien erojen puolella, saadaan oletetun kaltaisia tuloksia. Täten saadaan tietoa korkeajännitteisen alueen sijainnista.

Koska tutkimme johtavuusyhtälön epälineaarista versiota (epälineaarinen tarkoittaa, että suureiden väliset verrannollisuudet ovat monimutkaisempia kuin suora tai käänteinen verrannollisuus), eli niin sanottua p-Laplace -yhtälöä, on sopivia jännitejakaumia hankala keksiä. Pystymme asettamaan jännitteen ainoastaan niin, että jonkun suoran (2-ulotteisessa tilanteessa) tai tason (3-ulotteisessa tilanteessa; yleisemmin hypertason) toisella puolella on suuria jännite-eroja ja toisella puolella pieniä. Lineaarisessa tapauksessa pystytään luomaan myös pallonmuotoisia alueita, joissa on suuret jännite-erot, mikä johtaa parempiin kuvantamistuloksiin. Rajoitteen takia pystymme rajaamaan korkean johtavuuden alueen suorilla tai tasoilla. Emme siis saa havaittua kohteen yksityiskohtaista muotoa – aivan kuin kohteen ympärille olisi viritetty kireä pressu, ja näemme vain sen, emmekä sen alla olevan pihakeinun rakennetta, tai yleisemmin kappaleen pinnassa olevia painaumia tai onkaloita. Jos inkluusioita on useita, niin havaitsemme yhden suuren alueen. Matematiikan kielellä havaitsemme inkluusion konveksin verhon.

Menetelmän jota käytämme (ns. enclosure method eli kotelointimenetelmä) kehitti alunperin Ikehata Masaru, ja muitakin menetelmiä löytyy, mutta niiden soveltamista p-Laplace -luonteiseen johtavuusyhtälöön emme ole vielä yrittäneet. Ehkä joskus. Laajempaa kirjallisuuskatsausta voi lueskella artikkelista.

Tähän mennessä p-Laplace -yhtälöön perustuvassa Calderónin ongelmassa osataan tehdä seuraavaa: Isotrooppinen johtavuus ja johtavuuden ensimmäinen derivaatta saadaan selville kappaleen reunalla, ja vakiojohtavaisesta taustamateriaalista voidaan havaita inkluusion konveksi verho. Nyt näemme ainakin hiukan kappeel sisälle, mutta emme vielä tyydyttävällä tavalla.

Aiemmin tänä vuonna sain viimeisteltyä ensimmäisen esijulkaisuni, joka on luettavissa arXivista: http://arxiv.org/abs/1403.0428 . Lähetin sen myös erääseen tieteelliseen lehteen, jonka kautta se nyt on vertaisarvioitavana. Jos artikkeli hyväksytään, niin teen ehdotetut korjaukset ja se julkaistaan. Jos artikkelia ei hyväksytä, niin lähetän sen luultavasti korjattuna toiseen lehteen.

Artikkeli liittyy sähköimpedanssitomografian matemaattiseen teoriaan. Kysymys kuuluu seuraavasti: Jos meillä on jokin kappale, jonka sähkönjohtavuus haluttaisiin selvittää rikkomatta sitä, niin miten tämä mahtaisi onnistua? Johtavuuden selvittäminen olisi hyödyllinen esimerkiksi rintasyövän havaitsemisessa – syöpäkudos johtaa sähköä paremmin kuin terve kudos, koska siinä virtaa enemmän verta. Toinen sovellus mahdollistaa halkeamien ja metallisauvojen havaitsemisen betonimöykkyjen sisältä. Ongelman esitteli alunperin Alberto Calderón, joka halusi käyttää menetelmää öljyn etsimiseen maaperästä. Ongelma tunnetaan tästä syystä Calderónin ongelmana.

Calderónin ongelma on esimerkki käänteis- eli inversio-ongelmasta. Käänteisongelmassa tiedetään miten jokin fysikaalinen ilmiö toimii eli tunnetaan niin sanottu suora ongelma, joka kertoo sähkön käytöksen, kun tunnetaan kappaleen johtavuus. Tästä tiedosta ja tekemällä mittauksia halutaan selvittää tuntematon johtavuus. Mittaukset tehdään kappaleen reunalla ja kertovat potentiaalierot sekä sähkövirran suuruuden (toinen asetetaan, toinen mitataan).

Tutkin ongelman yleistystä, jossa sähkön käytöstä kuvataan epälineaarisella mallilla. Yleistyksen soveltuvuus on kyseenalaista ja kyseessä on enemmän perustutkimus, jonka voisi toivoa antavan uusia matemaattisia työkaluja alkuperäisen Calderónin ongelman tutkimiseen, kehittää teoriaa epälineaarisiin tapauksiin yleensä, tai jopa myöhemmin osoittautua soveltuvaksi itsessään.

Matemaattisesti ongelma muotoillaan parametrisoituna osittaisdifferentiaaliyhtälönä, josta reunamittauksia vastaavasta tiedosta yritetään päätellä parametrin arvo. Parametri vastaa sähkönjohtavuutta.

Olkoon \Omega \subseteq \mathbb{R}^d siisti rajoitettu alue ja ulottuvuus d > 1. Tutkitaan johtavuusyhtälöä eli painotettua Laplace-yhtälöä
\nabla \cdot (\gamma \nabla u) = 0,
jossa \gamma on sähkönjohtavuus. Sen voi olettaa positiiviseksi ja sekä ylhäältä että alhaalta rajoitetuksi funktioksi.

Potentiaali- ja sähkövirtamittaukset vastaavat Dirichlet- ja Neumann-tyyppisiä reuna-arvoja. Toiset asetetaan ja toiset saadaan selville. Tämän voi kuvata esimerkiksi DN-kuvauksella (Dirichlet to Neumann map), joka kuvaa annetut Dirichlet-reuna-arvot Neumann-arvoiksi. Kysymys kuuluu, että voidaanko johtavuus \gamma esittää DN-kuvauksen avulla.

Tutkin tämän kysymyksen yleistystä p-Laplace-yhtälölle:
\nabla \cdot (\gamma |\nabla u|^{p-2}\nabla u) = 0.
Kun p = 2, palautuu p-Laplace-yhtälö tavalliseen Laplace-yhtälöön. Potenssi p valitaan avoimelta väliltä ]1,\infty[ – rajatapaukset 1 ja \infty ovat luonteeltaan hyvin erilaisia. Yhtälön käytös on vähemmän mukavaa kuin tavallisen Laplace-yhtälön – se on vain kerran jatkuvasti derivoituva (ja derivaatta on Hölder-jatkuva), jos johtavuuden säännöllisyys tämän sallii, kun Laplace-yhtälön ratkaisut ovat analyyttisia (johtavuuden salliessa). Yhtälö ei ole lineaarinen, mikä aiheuttaa useita ongelmia, ja ratkaisut asuvat luonnostaan refleksiivisessä Banach-avaruudessa W^{1,p}, eivätkä Hilbertin avaruudessa kuten Laplace-yhtälön ratkaisut.

Mikko Salo (joka ohjaa väitöstyötäni) ja Xiao Zhong (joka ohjasi graduni) todistivat aiemmin, että p-Laplace-tilanteessa johtavuuden arvot alueen reunalla saadaan määritettyä DN-kuvauksesta. Minä laajensin heidän tulostaan näyttämällä, että myös johtavuuden ensimmäinen derivaatta saadaan selville. Sekä Mikon ja Xiaon että minun tulokseni ovat konstruktiivisia, eli tulokset olisi mahdollista toteuttaa tietokoneella, ja käyttävät vain paikallista tietoa, eli johtavuus reunapisteen lähellä saadaan selville käyttämällä tietoa vain mielivaltaisen läheltä kyseistä reunapistettä.

Jos kaikki derivaatat reunalla saadaan selville, niin analyyttinen johtavuus saadaan selvitettyä myös alueen sisuksessa. Vähemmän säännöllisen johtavuuden selvittäminen vaatisi huomattavasti vaativampia tekniikoita, jos se on edes mahdollista.

Ymmärrys

09/02/2010

Jotain on tullut yliopistossa opittua. Matematiikan luonteesta kaksi asiaa, filosofiasta yksi.

Matikka ensin.

  1. Jokainen väittämä on oikeutettava.
  2. Oikeuttaminen eli laskeminen ei ole kiinnostavaa – se, mitä argumentteja ja työkaluja täytyy, kannattaa tai voi käyttää on.

Sitten filosofia.

  1. Vastaukset (eli filosofiset teoriat) eivät ole mielekkäitä tuntematta kysymyksiä eli (aate)historiallista taustaa. Kysymysten vaihtuminen ja syntyminen on kiinnostavaa, vastaukset vain joskus.

Matemaattisesta näkökulmasta katsottuna filosofia on triviaalia (eli ilmiselvää) tai huonosti perusteltua. Tästä voi päätellä filosofian olevan hyödytöntä tai näkökulman olevan huono. Jälkimmäinen on osoittautunut hyödyllisemmäksi ajattelutavaksi.

Matematiikkaa en vielä osaa tarkastella filosofisesti. Vastaukset ovat triviaaleja, joten en ole löytänyt oikeita kysymyksiä vielä.

Taideaineita

24/01/2010

Kouluun pitäisi saada lisää taideaineiden opetusta (jota koskien kannattaa lukea entisen opettajan teksti). Nykyään siellä opetetaan musiikkia, kuvaamataitoa ja käsitöitä.

Vaihdan aihetta hetkeksi. Useat ammattimaiset matemaatikot kuvaavat työtään taiteeksi tai ainakin käyttävät oleellisesti taiteista tunnettuja sanankäänteitä: (Hyvät) todistukset ovat kauniita tai elegantteja, esimerkiksi.

Vaihdan uudestaan aihetta. Se on kivaa. Matematiikan opetuksessa käytetyt tehtävätyypit ovat seuraavia: Ensin kirjoitetaan lukuja, sitten aletaan opettelemaan käsitteitä, aletaan laskemaan, aletaan tekemään sanallisia tehtäviä, tulee matematiikan piirissä soveltavia tehtäviä (yläaste tai lukio), tulee soveltavia sanallisia tehtäviä (viimeistään lukio), tulee mekaanisia todistuksia (lukio tai viimeistään yliopiston aineopinnot) ja tulee luovuutta vaativia todistuksia (yliopiston aine- tai syventävät opinnot). Myöhemmin toivottavasti tulee väitteiden eli kysymysten ja ongelmien yleistämistä (syventävät tai jatko-opinnot) ja sitten luovaa kysymysten kehittelyä eli asettamista (tutkimus).

Musiikkia on tullut peruskoulussa ja vähän lukiossakin opiskeltua. Siinä harjoiteltiin vähän tekniikkaa eli soittamista, nuottien tulkintaa tai nuottiavaimen kirjoittamista sekä laulutaitoa. Samoin kuvaamataidossa tuli vähän tekniikkaa: Vesivärejä, perspektiivejä, joitain eksoottisia temppuja. Käsitöissä oli kohtalaisen runsaasti tekniikkaa.

Verrataan vaatimustasoja. Matematiikassa on tenttiä (tai koetta) tentin perään ja tietty taso ainakin teoriassa vaaditaan. Heikosti menestyville ainakin teoriassa annetaan tukiopetusta. Lähes kaikki oppivat teknisen puolen hyvin; juuri kukaan ei tiedä luovasta puolesta mitään. Perustelen edellisen virkkeen ensimmäisen lauseen myöhemmin.

Taideaineissa ei juuri mitään vaadita. En osaa laulaa, soittaa enkä juurikaan piirtää, mutta silti sain numeroina muistaakseni seiskoja, joku kuutonen mukana mausteena, ehkä kasikin. En tiedä yleisestä menestyksestä, mutta olettaisin sen olevan heikkoa. Tavoitteena on enemmänkin inspiroida harrastamaan kuin opettaa tekniikkaa (jolla tarkoitan esimerkiksi taitoa soittaa kitaraa).

Ihmiset sanovat olevansa huonoja matematiikassa. Tätä kuulee kiinnostavissa tilanteissa; esimerkiksi matematiikkaa sivuaineena lukevilta yliopistolaisilta. Suurin syy väittämään on kova vaatimustaso. Jos taideaineiden opetusmäärä laitettaisiin vastaamaan matematiikan nykyistä ja tekniikan oppimista painotettaisiin ja vaadittaisiin, alkaisi erittäin moni sanomaan olevansa huono taideaineissa.

Liikunta muistuttaa sikäli matematiikkaa, että siinä opetellaan paljon tiettyjä taitoja ja myös ruumiinhallintaa, kun taas luova puoli jää vähälle.

Äidinkielessä tasapainotetaan luovaa ja teknistä puolta, jotka myös tukevat toisiaan – kielioppia, aineenkirjoitusta, lukemista ja tekstien tulkintaa. Oppiaineena äidinkieli on laaja.

Pitäisi lisätä taideaineiden opetusta. Kelpaisiko matematiikka tai liikunta?

Dimensiolause

06/10/2009

Hieman matematiikka, vaihteeksi. Ensin hieman alkuhöpinöitä. Minulla ei ole hyvää kuvaa matemaattisen sisällön haastavuudesta ja esityksen laadusta, joten kertokaa ihmeessä, kuinka pitkälle pystytte sitä seuraamaan.

Olen sivutoimisena tuntiopettajan yliopistolla; tarkennettuna, pidän yhden matematiikan perusopintokurssin yhtä harjoitusryhmää. Harjoitusryhmät toimivat siten, että noin viikkoa etukäteen opiskelijoille jaetaan viidestä kymmeneen harjoitustehtävää, jotka ihmisten oletetaan tekevän kotona. Demotilaisuudessa sitten ihmiset laittavat rukseja lappuun, siten merkiten tekemänsä tehtävät. Niitä sitten taululle kirjoitellaan ja muille selitetään.

Minun roolini on päättää, kuka tekee mitäkin tehtäviä, tai tarkistetaanko niitä kenties ryhmässä, ja tarkastaa taululle tulevat tehtävät. Lisäksi niitä tulee selventää muille kurssilaisille. Välillä teen myös malliratkaisut kaikille harjoituksia pitäville, ja ilmeisesti myös tenttejä pääsen tarkistamaan jossain vaiheessa.

Viime maanantaina hoksasin jotain uutta ja hienoa dimensiolauseesta, joten ajattelin sen myös tänne kirjoitella.

Sitten hieman lineaarialgebraa, nimenomaan äärellisulotteisissa tilanteissa. Lineaarinen tarkoittaa suoraviivaista. Lineaarikuvaus, kirjaimena usein L, on kuvaus (eli funktio) yhdeltä lineaariavaruudelta toiselle. Lineaari- eli vektoriavaruus voi esimerkiksi olla lukusuora, taso tai kolmiulotteinen avaruus. Tässä rajoitun tarkistelemaan reaaliavaruuksia, jotka merkitään perinteisesti \mathbb{R}^n, missä n on ulottuvuus eli dimensio. Lukusuora on \mathbb{R} eli \mathbb{R}^1, taso on \mathbb{R}^2, kolmiulotteinen avaruus on \mathbb{R}^3. Tässä n siis on joku luonnollinen luku. Vektoriavaruuksissa on mielekästä laskea niiden alkioita eli vektoreita yhteen ja kertoa niitä reaaliluvuilla. Lisäksi vektoriavaruuksissa on aina yksikäsitteinen nolla-alkio, jota merkitään vain numerolla nolla. Surkastunut erikoistapaus lineaariavaruudesta on nolla-avaruus: Se sisältää pelkän nollan. Se on tylsä, mutta yksinkertaistaa asioita, joten se hyväksytään lineaariavaruudeksi. Tyhjää joukkoa yleensä ei hyväksytä, koskapa sille ei käyttöä olisi lainkaan ja se vaatisi erityishuomiota.

Kuvaus L: \mathbb{R}^n \to \mathbb{R}^m on lineaarinen, jos se toteuttaa kaksi ehtoa:

  1. Kaikilla reaaliluvuilla a ja kaikilla vektoreilla x \in \mathbb{R}^n pätee L(ax) = aL(x)
  2. Kaikilla vektoreilla x,y \in \mathbb{R}^n pätee L(x+y) = L(x) + L(y)

Laiskoina otuksina matemaatikot joskus jättävät sulut kirjoittamatta, koskapa lineaarikuvausten tapauksessa se ei aiheuta epäselvyyttä. Tätä tapaa en nyt ota käyttöön.

Ensimmäisestä ominaisuudesta yllä seuraa, että L(0) = 0L(x) = 0, missä x on mielivaltainen vektori; siis lineaarikuvaus kuvaa nollan aina nollaksi. Tästä utelias matemaatikko saa päähänsä kysyä: kuvaako jokin lineaarikuvaus muita lukuja nollaksi? Toinen kysymys koskee lineaarikuvausten injektiivisyyttä, eli kuvaavatko ne aina eriävät lähtöavaruuden alkiot eri alkioiksi maalipuolella? On helppoa (ensimmäisen vuoden matematiikan opiskelijalle helppoa) osoittaa, että lineaarikuvausten tapauksessa nämä kaksi kysymystä ovat yhtäpitäviä: kuvaus on injektio jos ja vain jos se kuvaa ainoastaan nollan nollaksi.

Toinen matemaatikoita kuvausten yhteydessä askarruttava asia on kuvauksen surjektiivisuus, jolla tarkoitamme sitä, osuuko kuvaus kaikkiin maalipuolen arvoihinsa. Surjektiivisuuden selvittäminen helposti ja siististi vaatii dimensiolauseen; käsin sen voi myös tehdä ihan määritelmän mukaan, mutta sen sivuutan tässä.

Lineaariavaruuksilla on dimensio, joka kertoo, kuinka suuria ne ovat. Aloitetaan tasosta: ajattele suorakulmion muotoista tasoa, esimerkiksi pöytää tai paperiarkkia. Kiinnitä siitä yksi piste nollaksi; vaikkapa kulma. Nyt, jos saat kulkea vain yhden pöydänsivun suuntaisesti (sekä eteen- että taaksepäin) ja aloitat nollasta, saavutat vain yhdellä suoralla olevat pisteet. Toisaalta, jos saat kulkea sekä pysty- että vaakasuoraan (tai pohjois-etelä- ja itä-länsi-suuntiin) ja yhdistellä näitä mielivaltaisesti, niin pääset mihin tahansa pöydän pisteeseen. Tämä pätee yleisesti: Jos tasolta ottaa kaksi suuntaa, eli kaksi pistettä (nollan kiinnittämisen takia jokainen siitä poikkeava piste määrää suunnan) jotka eivät kumpikaan ole nollia, niin nämä suunnat virittävät koko tason, kunhan eivät ole samalla suoralla eli samansuuntaisia (tai vastakkaissuuntaisia). Tästä syystä on perusteltua sanoa, että tason ulottuvuus on kaksi: tasan kaksi vektoria virittävät sen. Kolmiulotteisen avaruuden dimensio on yllättäen kolme: suunniksi voi valita esimerkiksi sivulle, eteen ja ylös. Yksiulotteisen avaruuden eli lukusuoran virittää yksi vektori. Nolla-avaruuden dimensioksi määritellään nolla, mikä vaikuttaa myös intuition mukaiselta. Voidaan osoittaa, että kaikki saman ulottuvuuden avaruudet ovat oleellisesti samanlaisia; tämä pätee vain äärellisulotteisille avaruuksille, enkä lainkaan muista todistuksen vaativuutta tai ideaa.

Pitänee tässä aliavaruuksistakin muutama sana sanoa. Tasolla kulkeva suora on tason yksiulotteinen aliavaruus, millä tarkoitetaan sitä, että se on itsessään aliavaruus, mutta sattuu olemaan upotettu tasoon. Aliavaruus on helppo käsite, eikä sen kanssa kannata hirveästi hikoilla. Kolmiulotteisen avaruuden sisässä oleva taso, esimerkiksi talon seinä, on ihan kelvollinen mielikuva aliavaruudesta. (Pitänee huomauttaa, että kaikki lineaariavaruudet jatkuvat äärettömän pitkälle kaikkiin suuntiin, joihin ne ylipäätänsä ulottuvat; aivan kuin lukujakin löytyy mielivaltaisen suuria. Esimerkit ovat äärellisiä johtuen fyysisen maailman rajoituksista, joita pahoittelen.)

Takaisin lineaarikuvauksiin. Niillä on aina joku lähtöavaruus ja joku maaliavaruus. Niiden välillä ei vielä ole mitään yhteyttä. Otetaan käyttöön uusi käsite: Kuva-avaruus. Se on aina maaliavaruuden aliavaruus ja voi joskus olla koko maaliavaruus (joka siis on oma aliavaruutensa; matemaattisen kielenkäytön ihmeitä). Äärimmäinen esimerkki on nollakuvaus, joka kuvaa koko lähtöavaruuden nollaksi. Tällöin kuvajoukko on pelkän nollan sisältävä joukko. Toisaalta reaaliakselilta eli lukusuoralta itselleen olevan kuvauksen kuvajoukko on, paitsi nollakuvauksen tapauksessa, koko reaaliakseli. On helppoa näyttää, että lineaarikuvauksen kuva-avaruus on aina lineaariavaruus.

Vielä yksi käsite: Lineaarikuvauksen ydin on se lähtöavaruuden joukko, joka kuvautuu nollaksi. Joskus ytimessä on pelkkän nolla, joskus taas koko lähtöavaruus, joskus jotain niiden välistä. Myös ydin on aliavaruus (tämäkään ei ole hankalaa todeta).

Sitten dimensiolause: Se sanoo, että lineaarikuvauksen ytimen dimensio plus kuvajoukon dimensio on aina lähtöavaruuden dimensio. Lause, englanniksi theorem, tarkoittaa merkittävää tulosta.

Todistusta en muista tähän hätään, mutta tuloksen ymmärtämisestä voin jotain sanoa. Lähtöavaruudessa on jokin kiinnitetty määrä ulottuvuuksia, eli tietty dimensio. Osa näistä ulottuvuuksista voi upota nollaan; tällöin ne siis ovat ytimen ulottuvuuksia. Loput sitten virittävät aliavaruuden maaliavaruuteen, eli siis kuvajoukon. Tästä syystä dimensioiden summan täytyy täsmätä. Tässä oli suuri oivallukseni, joka on hyvinkin itsestäänselvä nyt, kun sen hoksaa. Näin aina.

Tuloksesta on useita seurauksia. Yksi helppo on, että kuvajoukon ulottuvuus on korkeintaan yhtä suuri kuin lähtöavaruuden ulottuvuus; tavallaan lineaarikuvaus voi menettää tietoa, mutta uutta se ei luo.