Data is vs. data are

Je ziet in het Engels dat het woord data soms als enkelvoud behan­deld wordt, en soms als meer­voud. Is een van de twee cor­rect en de andere fout? Kun­nen ze alle­bei? En zo ja, wat is dan het ver­schil? We zoeken het uit!

Waar hebben we het over?

Bij veel zelf­s­tandig naam­wo­or­den is de keuze tussen een werk­wo­ord in het meer­voud of enkelvoud heel helder. Maar in som­mige gevallen ligt het wat sub­tiel­er.

Betekenis en gebruik

  • Data is in het Lati­jn het meer­voud van datum, dat “gegeven” betekent in de zin van een gegeven feit, cijfer, aan­name of uit­gangspunt. Dit gebruik bestaat al vanaf de 17e eeuw in het Engels, maar is buiten tech­nis­che of weten­schap­pelijke tek­sten in onbruik aan het rak­en.
  • In het mod­erne Engels ver­wi­jst data vooral naar een verza­mel­ing gegevens of infor­matie – met name dig­i­tale infor­matie in een com­put­er­sys­teem.

In deze laat­ste beteke­nis kom je data zow­el tegen als mass noun (die het col­lec­tief benadrukt en het werk­wo­ord in het enkelvoud kri­jgt) én als count noun (die de samen­stel­lende onderde­len benadrukt en het werk­wo­ord in het meer­voud kri­jgt). Bei­de gelden als accept­abel in de stan­daard­taal.

Hoe werkt dit in de prak­tijk?

  • Als je kiest voor enkelvoud pre­sen­teer je alle feit­en en cijfers samen als één geheel (mass noun). Je com­bi­neert data dan met bepalin­gen zoals this, much en lit­tle; en met het voor­naam­wo­ord it.
    → hier gedraagt data zich zoals wis­dom en infor­ma­tion
  • Als je kiest voor meer­voud pre­sen­teer je de feit­en en cijfers juist als een groep losse een­heden (count noun). Je com­bi­neert data dan met bepalin­gen zoals these, many en a few; en met voor­naam­wo­or­den als they en them.
    → hier gedraagt data zich zoals scis­sors en earn­ings

Voorbeelden

Hier is data het meer­voud van datum:

  • These arche­o­log­i­cal find­ings are impor­tant data that sug­gest a new his­tor­i­cal per­spec­tive.

Hier is data een mass noun:

  • All of the researcher’s data was lost in the fire. It con­sists of hand­writ­ten notes and can­not be recov­ered.
  • Much of the data in their sys­tems is not encrypt­ed. This data presents a secu­ri­ty risk.

En hier is data een count noun:

  • The patient’s med­ical data have been shared with a drug com­pa­ny. They con­tain many con­fi­den­tial details about her health.
  • Many of the data on John’s lap­top were copied to a thumb dri­ve. But even these data have been cor­rupt­ed by the virus.

Even opletten

Je doet er goed aan om bin­nen één tekst te kiezen voor de ene of de andere vorm en die dan con­se­quent te gebruiken. Probeer dus niet om door een afwis­sel­ing van meer­voud en enkelvoud sub­tiele betekenisver­schillen te accentueren.

Weetje

Er zijn maar lief­st drie ver­schil­lende uit­sprak­en voor data in omloop in het Engels. Ik probeer ze fonetisch te benaderen:

  1. DAY-ta (de eerste a lijkt op die in late)
  2. DEH-ta (de eerste a lijkt op die in at)
  3. DAH-ta (de eerste a lijkt op die in far)

De eerste uit­spraak is het meest gebruike­lijk. De tweede staat op de tweede plaats en komt meer voor in het Amerikaans-Engels dan in het Brits-Engels. De derde is het minst gebruike­lijk.

Wat vind jij?