Version 12 (modified by 13 years ago) (diff) | ,
---|
As a admin I want to prepare geno data linked to pheno data
Scrum: ticket:1052
How to demo:
- Individuals that are not selected are removed from data set (2.5M snps, max 20k individuals, in practice ~5k individuals)
- Genotype data can be converted from TriTyper? into PLINK format
- Genotype data can be converted from TriTyper? into binary format (for viewing)
- Genotype data is linked to phenotype data using the study specific pseudonyms (of Individuals)
- There are manuals of TriTyper?, PLINK and Binary format
Question
- Can Harm-Jan provide us data in PLINK format?
- in BIM format genotype data, phenotype data selection is seperate use case.
Pre-condition
- Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
- Genotype data is in TriTyper? format (???)
- Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.
Acceptance criteria
- Er is een lijst met onderzoekspseudoniem en Marcelpseudoniem (alleen voor de geselecteerde individuen!)
- Lijst gaat mee in data export/import naar CIT Publish (tijdelijk)
- Convertor leest TriTyper? format file, filtert op individuen, en schrijft weg naar PLINK met onderzoekspseudoniem