wiki:StoryConvertGenoData

Version 12 (modified by Morris Swertz, 12 years ago) (diff)

--

As a admin I want to prepare geno data linked to pheno data

TracNav(MolgenisAppStories)?

Scrum: ticket:1052

How to demo:

  • Individuals that are not selected are removed from data set (2.5M snps, max 20k individuals, in practice ~5k individuals)
  • Genotype data can be converted from TriTyper? into PLINK format
  • Genotype data can be converted from TriTyper? into binary format (for viewing)
  • Genotype data is linked to phenotype data using the study specific pseudonyms (of Individuals)
  • There are manuals of TriTyper?, PLINK and Binary format

Question

  • Can Harm-Jan provide us data in PLINK format?
  • in BIM format genotype data, phenotype data selection is seperate use case.

Pre-condition

  • Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
  • Genotype data is in TriTyper? format (???)
  • Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.

Acceptance criteria

  • Er is een lijst met onderzoekspseudoniem en Marcelpseudoniem (alleen voor de geselecteerde individuen!)
  • Lijst gaat mee in data export/import naar CIT Publish (tijdelijk)
  • Convertor leest TriTyper? format file, filtert op individuen, en schrijft weg naar PLINK met onderzoekspseudoniem