FinnGen 1-2

Hankkeen kahdessa ensimmäisessä vaiheessa (FinnGen 1 ja 2, 2017-2023) keskityttiin genotyyppi-fenotyyppi -tietovarannon rakentamiseen ja geneettisiin assosiaatioanalyyseihin. Syksyllä 2023 FinnGen saavutti tavoitteensa, eli tietokannan, joka sisältää 520 000 biopankkiluvan antaneen henkilön geno- ja fenotyypitiedot.

Elokuussa 2023 alkaneessa FinnGenin kolmannessa vaiheessa tietokantaan lisätään tietoa, jotta hankkeen ensimmäisissä vaiheissa löydettyjen sairauksien puhkeamista, etenemistä ja hoitovastetta voidaan ymmärtää.

FinnGen 1 (2017-2020)

FinnGen-hanke alkoi vuonna 2017, jolloin alettiin keräämään tutkimusnäytteitä suomalaisista biopankeista. Noin 185 000 näytettä oli peräisin aiemmista tutkimuksista ja ne oli jo tallennettu biopankkeihin, lisäksi 335 000 näytettä kerättiin FinnGen-hankkeen kuuden ensimmäisen vuoden aikana biopankeista. FinnGenissä genotyypitettiin näytteet ja yhdistettiin ne useista kansallisista rekistereistä saatuihin pitkittäisiin terveystietoihin, mukaan lukien tietoihin syntymästä, kuolemasta, sairauksista, sairaalakäynneistä ja ostetuista lääkkeistä.

Samaan aikaan perustettiin tietotekniikkainfrastruktuuri tietojen ja tulosten analysointia, visualisointia ja jakamista varten. FinnGen perusti turvallisen, auditoidun laskentaympäristön tietojen analysointia ja tallentamista sekä tulosten jakamista varten. FinnGenin luoma Google Cloud -ympäristö täyttää kaikki tietoturva- ja tietosuojavaatimukset, ja siinä on kaksi pääkomponenttia, joista toinen sisältää analyysitulokset helposti selattavassa muodossa (ei yksilötason tietoja) ja toinen, Sandbox, joka mahdollistaa yksilötason geneettisten ja rekisteripohjaisten fenotyyppitietojen analysoinnin.

FinnGen-hankkeen kuuden ensimmäisen vuoden aikana tuotettiin uusi, kerättyihin näytteisiin perustuva, yksilöiden genotyyppi- ja fenotyyppitietoja sisältävä aineisto (data freeze), joka tuotettiin FinnGenin tutkijoiden analysoitavaksi kuuden kuukauden välein. Ensimmäinen noin 52 000 yksilöä käsittävä aineistoversio julkaistiin helmikuussa 2018. Tuotetun datan määrä karttui sen mukaan, kun siihen lisättiin ~35 000-50 000 genotyypitettyä yksilöä kuuden kuukauden välein.

GWAS- ja PheWas-tuloksia useille tuhansille sairauspäätepisteille (fenotyypit, jotka kliiniset asiantuntijat ovat määritelleet rekisteritietojen perusteella) sekä GWAS-osumien finemapping, GWAS-osumien kolokalisaatiotulokset, GWAS-tulosten autoreportointi (automaattinen annotaatio), meta-analyysit (UK Biobank ja Estonian Biobank) ja varianttien annotaatiot tuotettiin myös keskitetysti kuuden kuukauden välein. GWAS-tulokset jaettiin vuoden kuluttua kunkin aineistoversion jälkeen julkisesti koko tiedeyhteisön käyttöön. 
 

FinnGen 2 (2020-2023)

FinnGen 1:n keskeiset toiminnot jatkuivat FinnGen 2:ssa, eli fenotyyppi- ja genotyyppitiedot ja analyysituloksia julkaistiin kuuden kuukauden välein (ja tulokset jaettiin julkisesti vuotta myöhemmin). Myös laskentaympäristön ylläpitoa ja analyysityökalujen kehittämistä jatkettiin.

FinnGen 1:n ja 2:n näytteenottojakso huipentui lopullisen datakokonaisuuden julkaisuun syyskuussa 2023, jolloin FinnGen saavutti tavoitteensa, joka oli kerätä näytteet ja tuottaa geno- ja fenotyyppidataa noin 10 % suomalaisista. Lopullinen kokonaisuus sisältää 520 000 suomalaisen genotyyppi- ja fenotyypitiedot.

FinnGen 2:n aikana tehtiin myös pilotteja tutkimuksen laajentamiseksi kuudella osa-alueella. Nämä pilotit (Expansion areas)  olivat: E1 - kohdennettu rekrytointi rekrytoinnin tehostamiseksi valituilla alueilla sairaalabiopankeissa; EA2 - FinnGen-tutkimushenkilöiden kutsuminen vastaamaan terveyskyselyyn ja tekemään kognitiivinen testi; EA3 - fenotyyppien rikastaminen kliinisillä tiedoilla valituilla tautialueilla; EA4 - FinnGen-tutkimuksen replikaatio sisältäen 500 päätetapahtuman meta-analyysi; EA5 - näytteiden keräys verianalyysiä varten ja suomessa yleisten alleelien funktionaalinen karakterisointi proteomiikan tai snRNASeq + ATACSeq -menetelmällä osasta näytteitä; EA6 - kognitiivista heikkenemistä koskeva proof of concept -tutkimus Alzheimerin taudin alkuvaiheessa. EA-tutkimusten tulokset ovat vaikuttaneet FinnGen 3:n suunnitteluun.