Type provider for the UniProt knowledge base
Type provider pro Uniprot knowledge base
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/200864Identifikátory
SIS: 275450
Kolekce
- Kvalifikační práce [11978]
Autor
Vedoucí práce
Oponent práce
Hoksza, David
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Programování a vývoj software
Katedra / ústav / klinika
Katedra distribuovaných a spolehlivých systémů
Datum obhajoby
20. 6. 2025
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Velmi dobře
Klíčová slova (česky)
type providers|uniprot|bioinformaticsKlíčová slova (anglicky)
type providers|uniprot|bioinformaticsUniProt knowledge base je široce užívána, odborně zpracovaná databáze proteinů. K databázi UniProt lze přistupovat programově pomocí klientů v jazycích, jako jsou Java a Python, ale chybí jí vhodné staticky typované rozhraní pro programování zaměřené na průzkum dat. Tato práce představuje doménově specifický type provider v jazyce F#, který integruje schéma UniProt do typového systému a umožňuje validaci při kompilaci a automatické doplňování kódu pro intuitivní průzkum dat. Abstrahováním rozhraní REST API UniProt do fluentního, typově bezpečného rozhraní klade prezentované řešení důraz na doménovou sémantiku. Podporuje efektivní průzkum proteinových záznamů prostřed- nictvím načítání dat na vyžádání. Type provider zjednodušuje přístup pro výzkumné pracovníky a kombinuje statické typování s interaktivním průzkumem s cílem urychlit objevování dat v oblasti bioinformatiky.
The UniProt knowledge base is an essential, expertly curated protein database. UniProt can be accessed programmatically using clients in langauges such as Java and Python, but it lacks a suitable statically-typed interface for exploratory programming. This thesis presents a domain-specific F# type provider that integrates UniProt's schema into the type system, enabling compile-time validation and auto-completion for intuitive data exploration. By abstracting UniProt's REST API into a fluent, type-safe inter- face, the solution reduces boilerplate and emphasises domain semantics. It supports effi- cient exploration of protein entries through on-demand data fetching. The type provider simplifies access for researchers, combining static typing with interactive exploration to accelerate data-driven discovery in the field of bioinformatics.
