Genomo surinkimas reiškia daugelio mažų genetinės sekos gabalėlių paėmimą ir jų sujungimą į vientisą visumą, vaizduojančią visą organizmo genomą. Tai yra pagrindinis bioinformatikos srities dėmesys, todėl šiuo tikslu egzistuoja įvairūs genomo projektai. Genomo surinkimas buvo naudojamas norint pradėti analizuoti daugelio rūšių, įskaitant žmones, augalus, gyvūnus ir bakterijas, genomus.
Organizmo genų analizė yra ilgas procesas, o genomo surinkimas yra vienas iš pirmųjų žingsnių. Daugelis kitų analizės metodų yra pagrįsti sėkmingu surinkimu, o genų identifikavimas negali progresuoti be jo. Netgi prieš genų suradimą sėkmingas genomo surinkimas vis tiek gali sukurti daug naudingos informacijos vėlesnei analizei, įskaitant genomo dydį, struktūrą ir bendrą sudėtį.
Genomo surinkimo procesas yra tarsi dėlionės sudėjimas be paveikslėlio ar naudingų formų. Susidūrus su pirmaisiais genomo fragmentais, vadinamais neapdorotais skaitymais, retai būna kokių nors nuorodų, kur konkretus gabalas patenka ar net kaip jis orientuotas. Kiekvienas gabalas yra koduojamas panašiai su keturiomis DNR bazėmis, sutrumpintomis A, C, G ir T. Genomas gali būti suspaustas į vieną didelę chromosomą arba padalintas į daugybę. Taip pat nėra garantijos, kad kai kurie neapdoroti skaitymai nėra tos pačios genomo srities dublikatai, o tai reikštų, kad yra mažiau unikalios informacijos, nei atrodo iš pirmo žvilgsnio.
Bendros žinios apie genomo struktūrą yra neįkainojamos pradedant surinkimo procesą. Nors skirtingų rūšių genomai labai skiriasi, yra tam tikrų taisyklių, kurių laikosi konkretūs genomo tipai, ir jas galima taikyti sujungiant kitą to paties tipo genomą. Pavyzdžiui, jei tam tikros rūšies organizmas visada turi tam tikrą modelį šalia, kur randami genai, galima pagrįstai manyti, kad renkant kitą į jį panašų organizmą būtų galima pagrįstai manyti, kad tokio modelio radimas signalizuotų šalia esantį geną. Didesniu mastu daugelis bakterijų genomų turi vieną žiedinę chromosomą, todėl būtų tikslinga numatyti, kad visi neapdoroti naujų bakterijų rodmenys kažkaip tilptų vienoje chromosomoje. Tokiu būdu pritaikius bendrąsias genetines žinias, tyrėjas gali pradėti suprasti potencialiai šimtus tūkstančių duomenų.
Yra daug kitų metodų, kurie gali būti naudojami genomo surinkimui, įskaitant skaičiavimo prognozes ir rankinius palyginimus. Nepriklausomai nuo metodo, genomo surinkimas yra didelis darbas, kuris dažnai užima daug laiko ir yra sudėtingas. Kadangi tai yra daugelio būsimų organizmo genetinių analizių pagrindas, yra mažai vietos klaidoms.