Sursa: Sapp Nelson (2017)
Baze de date, seturi de date și formate de date
1. Dezvoltarea strategiilor de căutare folosind logica booleană, căutarea fațetată și alte tehnici potrivite disciplinei pentru a identifica și accesa seturi de date relevante într-un anumit scop specific.
2. Cursanții identifică standardul sau formatele de date preferate pentru propriile discipline științifice și selectează formate de date potrivite pentru o anumită sarcină.
3. Cursanții identifică formatele de date proprietare relevante pentru disciplinele științifice proprii, articulează potențialele probleme legate de folosirea formatelor de date proprietare și selectează formate alternative atunci cănd este nevoie.
4. Cursanții înțeleg faptul că seturile de date sunt grupate după tematică sau după caracteristicile comune, cum ar fi locul de proveniență, faptul că tehnologia care găzduiește aceste grupuri se numește depozite și că pot fi folosite pentru a accesa seturi de date relevante pentru un subiect de cercetare de interes.
Descoperirea și achiziționarea datelor
5. Înțelegerea seturilor de date de autoritate, calitatea setului de date așa cum este indicat de metadatele și documentația existentă, precum și alți factori critici așa cum sunt determinați de scopul și investigația cercetării atunci când sunt selectate datele în scopul reutilizării.
6. Descărcarea de seturi de date în format tabelar (.csv, .tsv, .tab) și evaluarea critică a conținutului tabelului cu scopul de a recombina datele relevante într-un noi tabel.
7. Identificarea surselor ( organizații și agenții ), care pot produce date relevante unui anumit scop.
Managementul datelor și a organizației
8. Explică ciclul de viață al comunicării științifice și faptul că datele sunt produse în timpul fazelor incipiente ale ciclului de viață al comunicării științifice.
9. Explică conceptul de plan de management al datelor, părțile sale componente, precum și utilizarea sa ca document organizațional al eforturilor de cercetare.
10. Folosește o rubrică pentru identificarea credibilității bazelor de date pe care le descoperă online pentru a verifica actualitatea, relevanța, autoritatea, acuratețea și scopul.
Asigurarea calității
11. Afirmă faptul că erorile în lucrul cu datele pot fi prevenite prin menționarea unităților de măsurare, câmpurile de date care trebuie capturate și formatele pentru datele capturate anterior debutului capturii de date în sine.
12. Afirmă faptul că datele corupte pot rezulta din anumite interacțiuni, incluzând eroarea umană, crearea fișierelor pe computer sau problemelor de transformare.
Conversia datelor și interoperabilitatea
13. Transformarea datelor dintr-un format în altul ca parte a fluxului de lucru.
14. Salvează fișierele în formate de bază.
15. Recunoaște diferențele dintre formatele proprietare și cele non-proprietare și înțelege de ce folosirea formatelor non-proprietare este cea mai bună alegere dacă doresc acces la acestea în 5-10 ani.
Metadate
16. Înțelege faptul că metadatele descriu contextul în care un set de date a fost creat și răspunde la întrebările Cine, Ce, Când, Unde și De Ce atașate acelui set de date.
17. Definesc conceptul unui standard și recunosc faptul că standardele guvernează obiectele fizice, procesele și metodologiile și implicit faptul că metadatele sunt o metodologie guvernată de standarde.
18. Recunoaște câmpurile de bază care apar frecvent în înregistrările de metadate.
19. Discută conceptul de ontologii pentru aplicații la nivel de disciplină așa cum este fizica, științele pământului, dezvoltare curriculum-ului, etc.
Gestionarea datelor și reutilizarea
20. Recunoaște faptul că reproducerea științifică necesită reutilizarea datelor științifice.
21. Înțelege costurile asociate cu reproducerea și accesul la întreaga informație.
22. Recunoaște faptul că Planurile de Management a Datelor ( DMPs ) sunt artefacte ce descriu proiecte și practici de cercetare din propria disciplină și să examineze planuri de management pentru a învăța despre culturile acelor discipline.
Culturi ale practicii
23. Recunoașterea seturilor de date ca parte a cunoașterii domeniului și deprinderea de a găsi și utiliza seturile de date ale articolelor din revistele și monografiile științifice ca parte a disciplinei proprii.
24. Definește conceptul de standard și recunoaște că standardele guvernează obiectele fizice, procesele și metodologiile și faptul că metadatele sunt o metodologie guvernată de standarde.
Prezervarea datelor
25. Înțelege faptul că prezervarea întregii informații are un cost atașat.
26. Integrează backup-urile și Lots Of Copies Keeps Stuff Safe (LOCKSS) pentru a prezerva fișierele personale.
27. Recunoaște că unele informații sunt mai valoroase decât altele necesitând un efort suplimentar de prezervare.
Analiza datelor
28. Aplică metode analitice oportunităților de cercetare aplicată cum ar fi burse de cercetare, internship-uri sau experiențe de cercetare.
29. Aplică instrumente de gestionare a fluxurilor în timpul oportunităților de cercetare, internship-uri sau a experiențelor de cercetare.
Vizualizarea datelor
30. Lucrul cu instrumente de vizualizare în timpul oportunităților de cercetare aplicată cum ar fi burse de cercetare, internship-uri sau experiențe de cercetare.
31. Consideră o varietate de tipuri de vizualizare, ia notă de cele care sunt utilizate frecvent în propria disciplină și le recunoaște după format sau înfățișare.
32. Recunoaște ambiguitatea și reprezentarea datelor în vizualizările construite de alții și poate argumenta cum se naște ambiguitatea.
Etica incluzând citarea datelor
33. Identificarea datelor ca proprietate intelectuală a unei persoane sau o entitate similară articolelor, cărților sau muzică.
34. Citarea datelor la fel ca în cazul articolelor, cărților sau oricare altă resursă în compilarea unei noi opere de cercetare.
35. Afirmă că datele care includ informații despre persoane necesită o atenție și o investigare deosebită în cercetare și managementul datelor.
36. Găsește mențiunile de natură etică pentru instituțiile unei discipline și le investighează pentru a găsi informațiile privind managementul datelor sau cele care privesc operarea.