Datamining is gericht zoeken in bestaande grote gegevensverzamelingen naar zinvolle patronen of trends. Datamining kan nieuwe hypothesen of nieuwe ideeën opleveren voor het diagnosticeren, voorkomen of behandelen van ziekten. Het kan bijvoorbeeld leiden tot voorspellingen voor individuele responsen op geneesmiddelen of helpen met het ontwerpen van totaal nieuwe geneesmiddelen. De farmaceutische industrie maakt gebruik van geavanceerde computergestuurde dataminingtechnieken in een poging informatie te extraheren uit grote hoeveelheden beschikbare chemische, biologische en klinische gegevens. Gegevens kunnen worden geëxtraheerd uit gegevensverzamelingen van klinische onderzoeken, gegevens uit biobanken of elke andere gegevensverzameling die toegankelijk is – bijvoorbeeld gegevensverzamelingen van openbare researchorganisaties of verzekeringsmaatschappijen.
Datamining (gegevensdelving, datadelving) is het gericht zoeken naar (statistische) verbanden tussen verschillende gegevensverzamelingen met als doel profielen op te stellen voor wetenschappelijk, journalistiek of commercieel gebruik. Zo'n verzameling gegevens kan gevormd worden door gebeurtenissen in een praktijksituatie te registreren (aankoopgedrag van consumenten, symptomen bij patiënten, et cetera) of door de resultaten van eerder uitgevoerde wetenschappelijke onderzoeken met elkaar te vergelijken en te herinterpreteren.
De naam komt voort uit de overeenkomsten tussen het zoeken naar statistische verbanden en het graven (mining) naar iets waardevols in een grote berg gegevens (big data). Datamining helpt bedrijven en wetenschappers de essentiële informatie te selecteren. Er kan een model mee gecreëerd worden dat het gedrag van mensen of systemen kan voorspellen.