Flere ledende medisinske forskningsinstitusjoner i Nord-Amerika og Europa har begynt å fravike tradisjonelle etiske vurderinger for studier som benytter AI-genererte syntetiske pasientdata. Dette skjer med begrunnelse om at slike data ikke utgjør reelle pasientopplysninger og derfor ikke faller inn under definisjonen av forskning på mennesker.
Washington University School of Medicine var blant de første til å adoptere denne tilnærmingen i 2020. De argumenterer for at syntetiske datasett ikke utgjør forskning på mennesker under den føderale Common Rule, siden dataene ikke inneholder reelle eller sporbare pasientopplysninger. Dette har ført til raskere forskningsprosesser og enklere deling av data mellom forskningsinstitusjoner.
Lignende praksis er observert ved Children's Hospital of Eastern Ontario og Ottawa Hospital i Canada, samt IRCCS Humanitas Research Hospital i Italia. Disse institusjonene har også unnlatt etiske vurderinger etter juridiske analyser som konkluderer med at AI-genererte syntetiske data kanskje ikke utgjør personlige helseopplysninger.
Imidlertid uttrykker bioetikkeksperter og forskere bekymring over denne utviklingen. De påpeker at syntetiske data kan videreføre skjevheter som finnes i de opprinnelige treningssettene, noe som potensielt kan forsterke helseforskjeller for underrepresenterte grupper. Studier har vist at populære syntetiske datasett, som de avledet fra MIMIC-III, viser betydelig rasemessig skjevhet, med overrepresentasjon av visse etniske grupper og underrepresentasjon av andre.
Videre er det en vedvarende risiko for re-identifikasjon gjennom avanserte teknikker, noe som utfordrer antakelsene om syntetiske datas anonymitet. Det regulatoriske landskapet er fortsatt uklart, uten enighet om hvorvidt opprettelse og bruk av syntetiske data krever etisk tilsyn. FDA har begynt å utforske bruken av syntetiske data i utviklingen av medisinsk utstyr, men har ennå ikke utstedt definitive retningslinjer. Samtidig fortsetter europeiske regulatorer under GDPR-rammeverket å debattere hvorvidt syntetiske datasett virkelig unngår personvernreguleringer.
Denne utviklingen representerer en grunnleggende spenning mellom ønsket om å akselerere medisinsk innovasjon og behovet for å opprettholde strengt etisk tilsyn. Selv om syntetiske data tilbyr reelle fordeler for personvernbevarende forskning, kan den nåværende tilnærmingen med generelle unntak være for tidlig. En mer nyansert ramme som anerkjenner de unike risikoene ved syntetiske data, samtidig som den forenkler passende tilsynsmekanismer, synes nødvendig for å balansere innovasjon med pasientbeskyttelse og forskningsintegritet.