AALTO-YLIOPISTO Archive

Viikon tulos: Genomisten tietoaineistojen tutkimusta pilvilaskennan avulla

Genomisten tietoaineistojen, kuten ihmisen perimän tutkimus vaatii tehokasta tutkimusinfrastruktuuria. Uusi mittalaitetekniikka on haastanut tietoteknisen infrastruktuurin suorituskyvyn ja vaatii uudenlaisten pilvilaskennan työkalujen kehittämistä.

 Aalto-yliopisto ja Tieteen tietotekniikan keskus CSC ovat kehittäneet osana Cloud Software -hanketta pilvilaskentaan perustuvia ratkaisuja genomisen tietoaineiston hyödyntämiseksi tehokkaasti. Yhteistyössä kehitetyt Hadoop-BAM ja SeqPig -ohjelmistot auttavat tutkijoita analysoimaan valtavia tietoaineistoja nopeuttaen työskentelyä ja mahdollistaen aivan uudenlaisten data-analyysien tekemisen.

Molekyylibiologian ja lääketieteen tutkimuksen kehittyessä jatkuvasti myös tutkimusympäristön on pysyttävä ajan tasalla. Uuden sukupolven sekvenointilaitteet tuottavat niin valtavia määriä mittausdataa, että perinteiset ohjelmistot eivät enää kykene sitä käsittelemään. Niinpä tärkeään asemaan ovatkin nousseet pilvilaskennan menetelmät, jotka mahdollistavat datan hajautuksen suurelle määrälle laskentapalvelimia. Erityisesti map-reduce -laskentamalli ja sen toteuttava avoimen lähdekoodin Hadoop-teknologia ovat keskeisiä nykypäivän massiivisesti hajautetussa laskennassa.

Hankkeessa on kehitetty Hadoop-BAM ja SeqPig -ohjelmistot, jotka mahdollistavat uusien sekvenointilaitteiden tuottaman mittausdatan käsittelyn tehokkaasti Hadoop-ympäristössä. Testeissä ohjelmat skaalautuivat hyvin kymmenille laskentapalvelimille ja jopa 180 prosessoriytimelle. Hadoop-BAM -ohjelmistosta raportoiva artikkeli on julkaistu arvostetussa Bioinformatics-lehdessä (http://sourceforge.net/projects/hadoop-bam/). Hankkeessa on myös kehitetty visualisointityökaluja osaksi CSC:n kehittämää Chipster-ohjelmistoa, jotta laskennan tuloksena syntyviä suuria tulosaineistoja voidaan havainnollistaa ja tarkastella vaivattomasti.

Kehitetyt menetelmät ja ohjelmistot ovat herättäneet jo kansainvälistä kiinnostusta. Hadoop-BAM on otettu käyttöön esimerkiksi yhdysvaltalaisen Institute of Systems Biologyn kehittämässä SAMQA-työkalussa, jossa sitä on käytetty mittavan Cancer Genome Atlas -aineiston käsittelyyn. SeqPig-ohjelmisto on kehitetty yhteistyössä italialaisen CRS4-laskentakeskuksen kanssa.

Cloud Software Finland on Tieto- ja viestintätekniikan tutkimus Oy:n (TIVIT) huippuosaamiskeskittymän ohjelma, joka yhdistää yliopistojen ja yritysten osaamista pilviteknologioiden tutkimuksessa ja kehityksessä.

Viikon tulos: Uusia korkeakoulukursseja

Keväällä 2012 Aalto-yliopiston taiteen ja suunnittelun korkeakoulussa järjestettiin median laitoksella kaksi uutta kurssia, joissa TIVITin NextMedia -projektin tutkija Harri Heikkilä toimi suunnittelijana ja vetäjänä.

Publishing Design for Emerging Publishing Platforms, tuttavallisemmalta nimeltään Tablettitaittokurssi, oli kuuden opintokrediitin kokonaisuus, jossa opeteltiin tekemään ePUB-muotoista kirjaa ja rakentamaan digitaalista mallia vuorovaikutteiseksi tehdystä julkaisusta ja harjoiteltiin tablettijulkaisujen arvioimista sekä hyviä työkäytäntöjä. Yhteistyökumppaneina olivat HBL ja Otava. Otavalle tuotettiin mallia digitaalisesta lastenkirjasta ja HBL:n tulevaa tablettijulkaisua arvioitiin. Lopputyönä opiskelijat tekivät vuorovaikutteisia malleja julkaisuista ja haastattelivat lehtiä tablettijulkaisukokemuksista.

User-Centred Graphic Design -kurssilla eli Käyttäjäkeskeisen graafisen suunnittelun opintojaksolla parikymmentä opiskelijaa perehtyi uuteen näkökulmaan graafisessa suunnittelussa: kuinka saavutettavuus ja estetiikka yhdistetään? Kurssilla etsittiin graafisessa suunnittelussa kadoksissa ollutta käyttäjää ja perehdyttiin käyttäjätestaukseen ja heuristiseen arviointiin. Harjoitustyönä tuotettiin “Pieni kirja esteettömästä suunnittelusta”, joka on tiedottajille tarkoitettu graafisen suunnittelun opas. Tämän lisäksi kehitettiin infografiikkaa Selkokeskukselle ja kunnallisvaaleihin selko-äänestysopasta. Kurssilla arvioitiin myös WSOY:n 20+12 -tablettijulkaisua.

NextMediassa saadut kokemukset olivat tutkija Harri Heikkilän mukaan keskeisessä osassa kurssin toteutumisessa. Kurssilla tuotettu kirjanen on parhaillaan Aalto-yliopiston julkaisuosaston käsittelyssä. Kurssilla käytetty ja kehitetty tablettijulkaisun arviointikaavio on saatavissa Heikkilältä, harri.heikkila@aalto.fi

UCGD

KUVA: Johanna Rotko esittelee ongelmakohtia, Prashant Coakley ja Vahid Mortezaei arvioivat.

TIVITin ohjelmissa syntyy vuodessa satoja tuloksia: akateemisia tutkimus- ja konferenssipapereita, opinnäytteitä, softanpätkiä, liiketoimintaideoita, patentteja – ja niin edelleen. Koska yksittäiset tulokset ovat suuressa mittakaavassa useimmiten pieniä ja ne julkaistaan hajallaan eri ohjelmien sisällä, nostamme mielestämme erityisen onnistuneita tuloksia esille blogissamme Viikon tulos -sarjassa. Tutustu muihin tuloksiin: http://www.activityblog.fi/category/viikon-tulos/