Changes between Version 13 and Version 14 of MolgenisAppStories


Ignore:
Timestamp:
2011-11-25T14:32:20+01:00 (13 years ago)
Author:
jlops
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • MolgenisAppStories

    v13 v14  
    1 Om deze achterstand weg te werken wil ik vrijdag middag van jullie een
    2 lijst van alle relevante user stories in 1 word document/dropbox of
    3 (gcc) wiki (wat jullie voorkeur heeft). Per story wil ik dat jullie
    4 opschrijven:
    5 * de acceptance criteria / demo / requirements
    6 * al jullie open vragen, hoe onnozel ook
    7 * schets van voorlopig ontwerp / implementatie status
    8 * de taken die jullie hiervoor op het scrum bord hebben staan
     1Om deze achterstand weg te werken wil ik vrijdag middag van jullie een lijst van alle relevante user stories in 1 word document/dropbox of (gcc) wiki (wat jullie voorkeur heeft). Per story wil ik dat jullie opschrijven:
     2
     3 * de acceptance criteria / demo / requirements
     4 * al jullie open vragen, hoe onnozel ook
     5 * schets van voorlopig ontwerp / implementatie status
     6 * de taken die jullie hiervoor op het scrum bord hebben staan
    97
    108== As LL team we want to be able to deploy VMs with a basic toolset ==
    11 
    129== As LL team we want to connect each WOM to the proper VM ==
    13 
    1410== As LL team we want to provide a Molgenis Research Portal for each study ==
    15 
    1611== In the Molgenis Research Portal, we want to have a Phenotype Matrix Viewer ==
    17 
    1812== As a user, I want to select a phenotype and a list of individuals in the Molgenis Research Portal and then run a GWAS on the LL geno data ==
    19 
    2013=== We must have the imputed Third Release geno data on gpfs storage ===
    21 * Harm-Jan is currently imputing; this will take another two weeks.
    22 * After that we can upload these data (in TriTyper format?) to gpfs.
     14 * Harm-Jan is currently imputing; this will take another two weeks.
     15 * After that we can upload these data (in TriTyper format?) to gpfs.
    2316
    2417Harm-Jan:
     
    30232 vraagjes:
    3124
    32 (1)
    33 Wat is de preciese imputatie procedure?
    34 (of verschilt die niet van wat Alex doet)?
    35 We moeten onderzoekers namelijk precies kunnen vertellen wat ze krijgen.
     25(1) Wat is de preciese imputatie procedure? (of verschilt die niet van wat Alex doet)? We moeten onderzoekers namelijk precies kunnen vertellen wat ze krijgen.
    3626
    37 (2)
    38 Dit is namelijk iets wat LifeLines straks gewoon zelf moet kunnen (dwz
    39 Alex pipeline werkt al op compute dus als die identiek is hebben we
    40 'go').
     27(2) Dit is namelijk iets wat LifeLines straks gewoon zelf moet kunnen (dwz Alex pipeline werkt al op compute dus als die identiek is hebben we 'go').
    4128
    42 @Joeri: het zou mooi zijn alle info die HarmJan nu noemt dus ook
    43 getoond kunnen worden. Je zou HWE en MAF kunnen zien als features,
    44 elke SNP als target, en dan dus values voor elke combo.
     29@Joeri: het zou mooi zijn alle info die HarmJan nu noemt dus ook getoond kunnen worden. Je zou HWE en MAF kunnen zien als features, elke SNP als target, en dan dus values voor elke combo.
    4530
    4631=== We need to be able to link geno to pheno data ===
    47 
    4832Proposal by Jan-Lucas:
    4933
    5034Uitgangspunten:
    51 a. Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
    52 b. LL PatientID's gaan niet van LRA naar Target Stage.
    53 c. Target Stage bevat LL bronpseudoniem.
    54 d. Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.
    55  
    56 Voorstel zelf:
    57 1. Marcels spreadsheet wordt geimporteerd in LRA, indien niet mogelijk in aparte database.
    58 2. Bij aanmaken dataset in UMCG Publish voor een onderzoek wordt Marcels spreadsheet op dezelfde manier gepseudonimiseerd als de LRA data, van Patient ID naar bronpseudoniem naar onderzoekspseudoniem. Dit levert lijst op met onderzoekspseudoniem en Marcelpseudoniem.
    59 3. Lijst gaat mee in data export/import naar CIT Publish.
    60 4. Op CIT publish komt een view die vertaling maakt van Marcelpseudoniem naar onderzoekspseudoniem per onderzoek. View kan relatoneel zijn, maar ook XML opeleveren.
    61 5. Op CIT publish komt een database procedure voor legen van tabel met pseudoniemen.
    62  
    63 6. Als LRA dat op CIT Publish staat wordt view uitgelezen, op basis hiervan kan procedure "replace pseudonyms" uitgevoerd worden (uit Gert-Jans PPTX).
    64 7. Na procedure "replace pseudonyms" wordt eventueel aangemaakte file met pseudoniemen verwijderd. (Bij voorkeur heeft procedure die lijst in memory, maar als in file dan moet deze verwijderd.
    65 8. Na procedure "replace pseudonyms" wordt tabel met pseudoniemen geleegd voor dat onderzoek, dan met aanroepen database procedure.
     35
     36 a. Marcel spreadsheet bevat LLPatient ID's en Marcel Pseudoniemen (gekoppeld).
     37 a. LL PatientID's gaan niet van LRA naar Target Stage.
     38 a. Target Stage bevat LL bronpseudoniem.
     39 a. Voor onderzoek wordt LL bronpseudoniem vervangen door onderzoekpseudoniem.
     40
     41 Voorstel zelf:
     42
     43 1. Marcels spreadsheet wordt geimporteerd in LRA, indien niet mogelijk in aparte database.
     44 1. Bij aanmaken dataset in UMCG Publish voor een onderzoek wordt Marcels spreadsheet op dezelfde manier gepseudonimiseerd als de LRA data, van Patient ID naar bronpseudoniem naar onderzoekspseudoniem. Dit levert lijst op met onderzoekspseudoniem en Marcelpseudoniem.
     45 1. Lijst gaat mee in data export/import naar CIT Publish.
     46 1. Op CIT publish komt een view die vertaling maakt van Marcelpseudoniem naar onderzoekspseudoniem per onderzoek. View kan relatoneel zijn, maar ook XML opeleveren.
     47 1. Op CIT publish komt een database procedure voor legen van tabel met pseudoniemen.
     48
     49 6. Als LRA dat op CIT Publish staat wordt view uitgelezen, op basis hiervan kan procedure "replace pseudonyms" uitgevoerd worden (uit Gert-Jans PPTX).
     50 6. Na procedure "replace pseudonyms" wordt eventueel aangemaakte file met pseudoniemen verwijderd. (Bij voorkeur heeft procedure die lijst in memory, maar als in file dan moet deze verwijderd.
     51 6. Na procedure "replace pseudonyms" wordt tabel met pseudoniemen geleegd voor dat onderzoek, dan met aanroepen database procedure.
     52
    6653== As a LL data manager, I want to have a Catalog of the LL phenotype data ==
     54 * Functional design / mock-up of Catalog on [[Catalogue]]
     55 * We still need a technical design of the Catalog.
     56 * Despoina and Chao need LL metadata to fill their first version of the catalog with. Joris will provide them these data, however, they are still incomplete and will probably change.
    6757
    68 * Functional design / mock-up of Catalog on [[Catalogue]]
    69 * We still need a technical design of the Catalog.
    70 * Despoina and Chao need LL metadata to fill their first version of the catalog with. Joris will provide them these data, however, they are still incomplete and will probably change.
     58== As a LL data manager, I want to load data from publish layer into EAV (pheno model) ==
     59I don't know if this is the right place to put this, but this is more a to-do for the "dataLoader". At this moment the loader is able to load data into pheno model.
    7160
     61 * Add logging (so we can see what going on when it crashes in production environment, if it ever occurs)
     62   * Add Thread Monitor
     63 * How to handle/load/implement descriptive tables like LAB_BEPALING, this table is actually big list of Measurements with a lot of extra fields.
     64   * options:
     65     * Create a new type that extends Measurement and hold the additional fields
     66     * Merge data into the label of Category
     67 * How to handle/load/implement that table that describes which foreign keys are used between the tables.
     68   * The matrix viewer should know this info as well to build correct queries
     69 * Re-factor lifelines packages (it a little bit messy), remove old not used code anymore and place in descriptive packages
     70 * Remove JPA dependencies
     71   * Many-to-many in JPA are not working properly with Labels, for example ov.setTarget_Name("x"). In JDBCMapper this is solved, but know not where and how we could best do this for JPA. This set by label should also be put into generated test.
     72 * Update CSV readers to be multi threaded?
     73 * In (production) environment it's not a bad idea to put the java executable in the Oracle VM that part of the database.
     74 * Last but not least, Test if data is loaded correctly (Test from Anco).
     75 * The views that are generated on top of pheno model has a bug on null values and casting