Genomas yra visos genetinės medžiagos, esančios viename organizme, rinkinys. Kadangi šios genetinės medžiagos seka ir struktūra lemia visą biologinį gyvenimą, mokslininkams labai įdomu išsiaiškinti, kam jie skirti. Genomų duomenų bazė yra kryžminė informacijos apie vieną ar daugiau organizmų rinkinys, todėl vienas mokslininkas gali peržiūrėti visą turimą genetinę informaciją, kad padėtų jam atlikti tyrimus.
Genomai yra labai sudėtingi ir juose yra milijardai bazių informacijos sekoje. Todėl kompiuterizuotos duomenų bazės yra vienintelis praktiškas būdas sutvarkyti detales vienoje vietoje. Paprastai jos yra prieinamos kaip internetinės mokslinių tyrimų duomenų bazės. Palyginti nauja mokslo sritis, vadinama bioinformatika, atsirado siekiant tobulinti biologinių duomenų interpretavimo kompiuterinėmis sistemomis būdą.
Genomų duomenų bazėse yra organizmo genų seka, jei žinoma visa seka. Kitu atveju jame gali būti dalinių sekų. Pavyzdžiui, buvo sekvenuoti žmogaus, pelės ir Drosophila musės genomai. Kai žinoma genomo seka, genetikai gali nustatyti tam tikrus genomo genus. Kiekvienas genas yra vieno konkretaus ląstelės produkto instrukcijų lapas.
Jei genas turi mutaciją, jo seka skiriasi nuo įprasto funkcinio geno. Mutacijos gali būti naudingos ir sukurti naudingų savybių mutavusiam organizmui. Jie taip pat negali turėti įtakos produktui arba gali pakenkti normaliam organizmo darbui. Pavyzdžiui, daugelis sveikatos sutrikimų atsiranda dėl tam tikro geno mutacijų.
Mutacijos taip pat gali būti naudojamos apskaičiuojant, kiek tam tikra rūšis yra glaudžiai susijusi su kita, nes laikui bėgant susikaupia daugiau mutacijų. Asmenys taip pat gali skirtis pagal genomo seką, ypač todėl, kad didelės genomo dalys nėra genai ir nekoduoja jokio esminio ląstelės produkto. Genomo duomenų bazėje saugoma seka iš organizmo, kuris yra nurodytas kaip standartas, tačiau bus daug nedidelių skirtumų tarp savavališkai pasirinkto standarto ir kitų rūšies individų.
Nepaisant daugybės skirtumų, genai yra atpažįstami pagal sekas. Jei genetikai žino, ką konkretus genas veikia viename organizme, tai genas su panašia seka kitame gyvūne greičiausiai atlieka tą pačią funkciją. Genetikai gali naudoti genomo duomenų bazę, kad nustatytų geną, kurį jie tiria, arba išsiaiškintų, ką genas veikia.
Kiekvienoje genomo duomenų bazėje galima ieškoti. Paprastai mokslininkai gali ieškoti duomenų bazėje vienu iš kelių skirtingų būdų. Paprastai jis arba ji gali įvesti geno seką, kurią jis ar ji sekvenavo. Tada duomenų bazė suranda vieną ar daugiau panašių sekų palyginimui.
Paprastesnis duomenų bazės paieškos būdas apima geno raktinio žodžio, pvz., geno pavadinimo, paiešką. Tokios institucijos kaip JAV nacionalinė biotechnologinės informacijos institucija (NCBI) gali suteikti sekoms skirtingus nuorodos numerius, o genetikas taip pat gali ieškoti genomo duomenų bazėje naudodamas vieną iš šių identifikatorių. Jis arba ji taip pat gali susiaurinti rezultatus naudodamas daugiau paieškos parametrų. Kryžminė informacija yra daugumos genomo duomenų bazių ypatybė, o vienos sekos rezultatas taip pat suteiks duomenų bazės vartotojui naudingų nuorodų, skirtų daugiau genetinės informacijos. Daugelis duomenų bazių pateikia ne tik informaciją apie konkrečią seką, bet ir vizualiai atvaizduoja seką ir svarbias tos srities ypatybes.
Skirtingi organizmai gali turėti specifines genomo duomenų bazes, tačiau kai kuriose didesnėse duomenų bazėse yra daugiau nei viena rūšis. Įvairios institucijos kontroliuoja skirtingas turimas duomenų bazes, todėl visos duomenų bazės gali naudoti skirtingus formatus ir paieškos galimybes. Kai kurie šių institucijų pavyzdžiai yra NCBI, Europos bioinformatikos institutas ar net atskiri universitetai.