Atvirojo kodo duomenų gavyba gali būti susijusi su keliais skirtingais dalykais, tačiau paprastai tai rodo arba atvirojo kodo programinės įrangos naudojimą duomenų gavybai, arba duomenų gavybos naudojimą siekiant geriau suprasti atvirojo kodo programas. Atvirojo kodo programinės įrangos naudojimas duomenų gavybai nėra labai neįprastas, nes yra daugybė galingų ir patikimų atvirojo kodo programų, kurios gali būti naudojamos norint išgauti ir tvarkyti informaciją iš didelių neapdorotų duomenų kiekių. Atvirojo kodo duomenų gavyba taip pat gali apimti duomenų gavybos programinės įrangos naudojimą atvirojo kodo programose, siekiant geriau suprasti kodą, naudojamą kuriant šias programas.
Sąvoka „atvirasis šaltinis“ atvirojo kodo duomenų gavyboje reiškia programinę įrangą, kuri yra sukurta ir išleista pagal tam tikrą bendrojo naudojimo arba viešąją licenciją. Šios licencijos gali skirtis priklausomai nuo programinės įrangos kūrimo būdo ir kūrėjų pageidavimų. Tačiau apskritai tokios licencijos leidžia kitiems naudoti, modifikuoti ir platinti pagal licenciją išleistą programinę įrangą bet kokiu būdu, kaip jie mano esant tinkama.
Todėl atvirojo kodo duomenų gavyba gali apimti atvirojo kodo programinės įrangos naudojimą siekiant įvairių duomenų gavybos tikslų ir praktikos. Duomenų gavyba gali būti susijusi su daugybe skirtingų metodų, tačiau apskritai kalbama apie programinės įrangos naudojimą norint „atsijoti“ didelius duomenų kiekius, kad būtų gauta svarbi ar naudinga informacija. Įmonė gali naudoti duomenų gavybos metodus duomenims, kuriuos įmonė pateikia apie tam tikro laikotarpio pardavimo duomenis, kad patobulintų tuos neapdorotus duomenis į informaciją, kuri būtų naudingesnė ir lengviau suprantama.
Atvirojo kodo duomenų gavybos programinės įrangos naudojimas yra gana įprastas dėl daugybės atvirojo kodo programų, kurios yra gana veiksmingos duomenų gavybai. Tačiau šias programas reikia naudoti atsakingai, nes kai kuriose srityse gali būti įstatymai, reglamentuojantys, kaip galima išgauti ir naudoti duomenis. Viena įmonė galėtų naudoti atvirojo kodo duomenų gavybos programas, kad gautų informaciją iš duomenų, kurie priklauso kitai įmonei. Tai gali pažeisti duomenų nuosavybės teises ir komercines paslaptis, kurios yra teisiškai saugomos daugelyje sričių.
Atvirojo kodo duomenų gavyba taip pat gali būti susijusi su duomenų gavybos programinės įrangos naudojimu informacijai apie kitą programą gauti. Duomenų gavybos metodai gali būti naudojami norint rasti šaltinio kodą ir kitą informaciją apie programą, o tai gali sukelti teisinius pažeidimus, kai tai atliekama naudojant komercinę programinę įrangą. Kadangi atvirojo kodo programos paprastai kuriamos pagal bendrą viešąją licenciją, tokios programinės įrangos duomenų gavyba gali būti atliekama teisėtai. Tokiu būdu gautus duomenis ir informaciją programišiai gali panaudoti mokydamiesi iš atvirojo kodo programinės įrangos kūrimo ir spręsdami kitų programų problemas.