wiki:StoryConvertGenoData

Version 4 (modified by Morris Swertz, 12 years ago) (diff)

--

As a admin I want to prepare geno data linked to pheno data

TracNav(MolgenisAppStories)?

Scrum: ticket:1052

How to demo:

  • Genotype data can be converted from TriTyper? into PLINK format AND binary format (or binary format only?)
  • Genotype data is filtered for only the selected Individuals
  • Genotype data is linked to phenotype data using the study specific pseudonyms (of Individuals)

Pre-condition

  • Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
  • Genotype data is in TriTyper? format (???)
  • LL PatientID's gaan niet van LRA naar Target Stage.
  • Target Stage bevat LL bronpseudoniem.
  • Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.

Acceptance criteria

  • Bij aanmaken dataset in UMCG Publish voor een onderzoek wordt Marcels spreadsheet op dezelfde manier gepseudonimiseerd als de pheno data, van Patient ID naar bronpseudoniem naar onderzoekspseudoniem. Dit levert lijst op met onderzoekspseudoniem en Marcelpseudoniem (alleen voor de geselecteerde individuen!)
  • Lijst gaat mee in data export/import naar CIT Publish
  • Convertor leest TriTyper? format file, filter op individuen, en schrijft weg naar PLINK met onderzoekspseudoniem