Tilfeldig kontrollert test - Randomized controlled trial

Flytdiagram over fire faser (registrering, tildeling, intervensjon, oppfølging og dataanalyse) av en parallell randomisert studie av to grupper (i en kontrollert studie fungerer en av intervensjonene som kontroll), modifisert fra CONSORT (Consolidated Standards) av rapporteringsforsøk) 2010 -erklæring

En randomisert kontrollert studie (eller randomisert kontrollforsøk ; RCT ) er en form for vitenskapelig eksperiment som brukes til å kontrollere faktorer som ikke er under direkte eksperimentell kontroll. Eksempler på RCT er kliniske studier som sammenligner effekten av legemidler, kirurgiske teknikker, medisinsk utstyr , diagnostiske prosedyrer eller andre medisinske behandlinger.

Deltakere som registrerer seg for RCT -er, skiller seg fra hverandre på kjente og ukjente måter som kan påvirke studieresultatene, og som likevel ikke kan kontrolleres direkte. Ved å tilfeldig fordele deltakere blant sammenlignede behandlinger, muliggjør en RCT statistisk kontroll over disse påvirkningene. Forutsatt at den er godt designet, gjennomført på riktig måte og registrerer nok deltakere, kan en RCT oppnå tilstrekkelig kontroll over disse forvirrende faktorene for å levere en nyttig sammenligning av behandlingene som er undersøkt.

Definisjon og eksempler

En RCT i klinisk forskning sammenligner vanligvis en foreslått ny behandling med en eksisterende standard for omsorg ; disse betegnes deretter som henholdsvis 'eksperimentelle' og 'kontroll' behandlinger. Når ingen slik allment akseptert behandling er tilgjengelig, kan det brukes placebo i kontrollgruppen slik at deltakerne blir blindet for behandlingstildelingene. Dette blendende prinsippet er ideelt sett også utvidet så mye som mulig til andre parter, inkludert forskere, teknikere, dataanalytikere og evaluerere. Effektiv blinding isolerer eksperimentelt de fysiologiske effektene av behandlinger fra forskjellige psykologiske kilder til skjevhet .

Tilfeldigheten i tildelingen av deltakere til behandlinger reduserer seleksjonsskjevhet og fordelingsskjevhet, og balanserer både kjente og ukjente prognostiske faktorer ved tildeling av behandlinger. Blinding reduserer andre former for eksperimentator og subjektiske fordommer .

En godt blindet RCT regnes som gullstandarden for kliniske studier. Blindede RCT brukes ofte for å teste effekten av medisinske inngrep og kan i tillegg gi informasjon om bivirkninger, for eksempel legemiddelreaksjoner . En randomisert kontrollert studie kan gi overbevisende bevis for at studiebehandlingen forårsaker en effekt på menneskers helse.

Begrepene "RCT" og " randomisert studie " brukes noen ganger synonymt, men det siste uttrykket utelater omtale av kontroller og kan derfor beskrive studier som sammenligner flere behandlingsgrupper med hverandre i fravær av en kontrollgruppe. På samme måte utvides initialismen noen ganger som " randomisert klinisk studie " eller " randomisert sammenligningsforsøk ", noe som fører til tvetydighet i den vitenskapelige litteraturen . Ikke alle RCT er randomiserte kontrollerte studier (og noen av dem kan aldri være det, som i tilfeller der kontroller ville være upraktiske eller uetiske å bruke). Begrepet randomisert kontrollert klinisk studie er et alternativt begrep som brukes i klinisk forskning; RCT er imidlertid også ansatt i andre forskningsområder, inkludert mange av samfunnsvitenskapene .

Historie

Den første rapporterte kliniske studien ble utført av James Lind i 1747 for å identifisere behandling for skjørbuk . Det første blinde eksperimentet ble utført av den franske kongelige kommisjon for dyremagnetisme i 1784 for å undersøke påstandene om mesmerisme . Et tidlig essay for å blende forskere kom fra Claude Bernard i siste halvdel av 1800 -tallet. Bernard anbefalte at observatøren av et eksperiment ikke skulle ha kunnskap om hypotesen som ble testet. Dette forslaget kontrasterte sterkt med den utbredte opplysningstiden -en holdning om at vitenskapelig observasjon bare kan være objektivt gyldig når den utføres av en velutdannet, informert forsker. Den første studien som ble registrert for å ha en blindet forsker, ble utført i 1907 av WHR Rivers og HN Webber for å undersøke effekten av koffein.

Randomiserte eksperimenter dukket først opp i psykologi , der de ble introdusert av Charles Sanders Peirce og Joseph Jastrow på 1880 -tallet, og i utdanningen .

På begynnelsen av 1900 -tallet dukket det opp randomiserte eksperimenter i landbruket, på grunn av Jerzy Neyman og Ronald A. Fisher . Fishers eksperimentelle forskning og forfatterskapene hans populariserte randomiserte eksperimenter.

Den første publiserte randomiserte kontrollerte studien i medisin dukket opp i 1948 papir med tittelen " streptomycin behandling av lungetuberkulose ", som beskrev en Medical Research Council etterforskning. En av forfatterne av dette papiret var Austin Bradford Hill , som blir kreditert for å ha unnfanget den moderne RCT.

Forsøkets design ble ytterligere påvirket av de store ISIS- forsøkene på hjerteinfarktbehandlinger som ble utført på 1980-tallet.

På slutten av 1900 -tallet ble RCT anerkjent som standardmetode for "rasjonell terapi" i medisin. Fra 2004 var mer enn 150 000 RCT -er i Cochrane -biblioteket . For å forbedre rapporteringen av RCT i medisinsk litteratur publiserte en internasjonal gruppe forskere og redaktører Consolidated Standards of Reporting Trials (CONSORT) -erklæringer i 1996, 2001 og 2010, og disse har blitt allment akseptert. Randomisering er prosessen med å tildele forsøkspersoner til behandlings- eller kontrollgrupper ved å bruke et sjanselement til å bestemme oppgavene for å redusere skjevheten.

Etikk

Selv om prinsippet om klinisk equipoise ("ekte usikkerhet innen det medisinske ekspertsamfunnet ... om den foretrukne behandlingen") som er vanlig for kliniske studier har blitt brukt på RCT, har etikken til RCT -er spesielle hensyn. For det første har det blitt hevdet at equipoise i seg selv er utilstrekkelig til å rettferdiggjøre RCT. For en annen kan "kollektiv equipoise" komme i konflikt med mangel på personlig equipoise (f.eks. En personlig tro på at et inngrep er effektivt). Til slutt randomiserer Zelens design , som har blitt brukt for noen RCT, emner før de gir informert samtykke, noe som kan være etisk for RCTer for screening og utvalgte terapier, men sannsynligvis er uetisk "for de fleste terapeutiske forsøk."

Selv om fagene nesten alltid gir informert samtykke til deres deltakelse i en RCT, har studier siden 1982 dokumentert at RCT -fag kan tro at de vil få behandling som er best for dem personlig; det vil si at de ikke forstår forskjellen mellom forskning og behandling. Ytterligere forskning er nødvendig for å bestemme forekomsten av og måter å løse denne " terapeutiske misforståelsen " på.

RCT -metodevariasjonene kan også skape kulturelle effekter som ikke er godt forstått. For eksempel kan pasienter med dødelig sykdom delta i forsøk i håp om å bli helbredet, selv om behandlinger neppe vil lykkes.

Prøve registrering

I 2004 kunngjorde International Committee of Medical Journal Editors (ICMJE) at alle forsøk som starter påmelding etter 1. juli 2005, må registreres før behandling for publisering i en av komiteens 12 medlemsblader. Imidlertid kan prøveregistrering fortsatt skje sent eller ikke i det hele tatt. Medisinske tidsskrifter har vært trege med å tilpasse retningslinjer som krever obligatorisk registrering av kliniske studier som en forutsetning for publisering.

Klassifiseringer

Etter studiedesign

En måte å klassifisere RCT på er ved studiedesign . Fra de fleste til minst vanlige i helsetjenestelitteraturen er hovedkategoriene av RCT -studiedesign:

  • Parallell-gruppe -hver deltaker blir tilfeldig tilordnet en gruppe, og alle deltakerne i gruppen mottar (eller mottar ikke) en intervensjon.
  • Crossover - over tid mottar (eller mottar ikke) hver deltaker en intervensjon i en tilfeldig sekvens.
  • Klynge -eksisterende grupper av deltakere (f.eks. Landsbyer, skoler) blir tilfeldig valgt for å motta (eller ikke motta) en intervensjon.
  • Factorial -hver deltaker blir tilfeldig tildelt en gruppe som mottar en bestemt kombinasjon av intervensjoner eller ikke-intervensjoner (f.eks. Gruppe 1 mottar vitamin X og vitamin Y, gruppe 2 mottar vitamin X og placebo Y, gruppe 3 mottar placebo X og vitamin Y , og gruppe 4 får placebo X og placebo Y).

En analyse av de 616 RCT-ene som ble indeksert i PubMed i løpet av desember 2006 fant at 78% var parallelle gruppetester, 16% var crossover, 2% var split-body, 2% var cluster og 2% var factorial.

Etter utfall av interesse (effekt vs. effektivitet)

RCT kan klassifiseres som "forklarende" eller "pragmatisk". Forklarende RCT tester effekt i en forskningsmiljø med høyt utvalgte deltakere og under sterkt kontrollerte forhold. I kontrast tester pragmatiske RCT (pRCT) effektivitet i daglig praksis med relativt uvalgte deltakere og under fleksible forhold; på denne måten kan pragmatiske RCT -er "informere beslutninger om praksis."

Etter hypotese (overlegenhet vs. ikke -underlegenhet mot ekvivalens)

En annen klassifisering av RCT kategoriserer dem som "overlegenhetsforsøk", "ikke -mindreverdighetsforsøk" og "ekvivalensforsøk", som er forskjellige i metodikk og rapportering. De fleste RCT er overlegenhetsforsøk, der en intervensjon antas å være overlegen en annen på en statistisk signifikant måte. Noen RCT er noninferioritetsforsøk "for å avgjøre om en ny behandling ikke er verre enn en referansebehandling." Andre RCT er ekvivalensforsøk der hypotesen er at to inngrep ikke kan skilles fra hverandre.

Randomisering

Fordelene med riktig randomisering i RCT inkluderer:

  • "Det eliminerer skjevhet i behandlingsoppgaven," spesielt seleksjonsskjevhet og forvirring .
  • "Det letter blinding (maskering) av identiteten til behandlinger fra etterforskere, deltakere og vurderere."
  • "Det tillater bruk av sannsynlighetsteori for å uttrykke sannsynligheten for at forskjeller i utfall mellom behandlingsgrupper bare indikerer tilfeldigheter."

Det er to prosesser involvert i randomisering av pasienter til forskjellige intervensjoner. Først er det å velge en randomiseringsprosedyre for å generere en uforutsigbar rekke av tildelinger; Dette kan være en enkel tilfeldig tildeling av pasienter til noen av gruppene med like sannsynlighet, kan være "begrenset" eller være "adaptiv". Et annet og mer praktisk problem er fordeling av skjuling , som refererer til de strenge forhåndsreglene som er tatt for å sikre at pasientgruppens oppgave ikke blir avslørt før de definitivt tildeles dem til sine respektive grupper. Ikke-tilfeldige "systematiske" metoder for gruppetildeling, for eksempel vekslende emner mellom den ene gruppen og den andre, kan forårsake "ubegrensede forurensningsmuligheter" og kan forårsake brudd på allokering.

Imidlertid har empiriske bevis på at tilstrekkelig randomisering endrer utfall i forhold til utilstrekkelig randomisering vært vanskelig å oppdage.

Prosedyrer

Behandlingsfordelingen er ønsket andel pasienter i hver behandlingsarm.

En ideell randomiseringsprosedyre ville oppnå følgende mål:

  • Maksimer statistisk kraft , spesielt i undergruppeanalyser . Vanligvis maksimerer like store størrelser statistisk kraft, men ulik gruppestørrelse kan imidlertid være kraftigere for noen analyser (f.eks. Flere sammenligninger av placebo versus flere doser ved bruk av Dunnetts prosedyre), og er noen ganger ønsket av ikke-analytiske årsaker (f.eks. Kan pasienter være mer motivert for å melde deg på hvis det er større sjanse for å få testbehandlingen, eller tilsynsmyndigheter kan kreve et minimum antall pasienter utsatt for behandling).
  • Minimer valgskjevheten . Dette kan skje hvis etterforskere bevisst eller ubevisst fortrinnsvis kan registrere pasienter mellom behandlingsarmene. En god randomiseringsprosedyre vil være uforutsigbar slik at etterforskere ikke kan gjette neste forsøks gruppeoppgave basert på tidligere behandlingsoppgaver. Risikoen for seleksjonsskjevhet er høyest når tidligere behandlingsoppgaver er kjent (som i blindede studier) eller kan gjettes (kanskje hvis et stoff har særegne bivirkninger).
  • Minimer tildelingsskjevhet (eller forvirring ). Dette kan oppstå når kovariater som påvirker utfallet ikke er likt fordelt mellom behandlingsgrupper, og behandlingseffekten forveksles med effekten av kovariatene (dvs. en "utilsiktet skjevhet"). Hvis randomiseringsprosedyren forårsaker ubalanse i kovariater relatert til utfallet på tvers av grupper, kan estimater av effekt være forutinntatt hvis de ikke justeres for kovariatene (som kan være umålte og derfor umulige å justere for).

Imidlertid oppfyller ingen enkelt randomiseringsprosedyre disse målene under alle omstendigheter, så forskere må velge en prosedyre for en gitt studie basert på fordeler og ulemper.

Enkel

Dette er en vanlig og intuitiv prosedyre, som ligner på "gjentatt rettferdig myntkasting." Også kjent som "fullstendig" eller "ubegrenset" randomisering, og er robust mot både seleksjon og tilfeldige skjevheter. Den største ulempen er imidlertid muligheten for ubalanserte gruppestørrelser i små RCT -er. Det anbefales derfor bare for RCT -er med over 200 fag.

Begrenset

For å balansere gruppestørrelser i mindre RCT -er, anbefales en form for "begrenset" randomisering . De viktigste typene begrenset randomisering som brukes i RCT er:

  • Permutert blokk-randomisering eller blokkert randomisering : en "blokkstørrelse" og "tildelingsforhold" (antall emner i en gruppe versus den andre gruppen) er spesifisert, og emner tildeles tilfeldig innenfor hver blokk. For eksempel vil en blokkstørrelse på 6 og et fordelingsforhold på 2: 1 føre til tilfeldig tildeling av 4 fag til den ene gruppen og 2 til den andre. Denne typen randomisering kan kombineres med " stratifisert randomisering ", for eksempel sentralt i en multisenterstudie , for å "sikre god balanse mellom deltakeregenskaper i hver gruppe." Et spesielt tilfelle av randomisert blokk-randomisering er tilfeldig tildeling , der hele prøven blir behandlet som en blokk. Den største ulempen med permutert blokk-randomisering er at selv om blokkstørrelsene er store og tilfeldig varierte, kan prosedyren føre til seleksjonsskjevhet. En annen ulempe er at "riktig" analyse av data fra permuterte-blokk-randomiserte RCT krever lagdeling med blokker.
  • Adaptive randomized-randomiseringsmetoder (hvorav urn randomisering er den mest kjente typen): I disse relativt uvanlige metodene reduseres sannsynligheten for å bli tildelt en gruppe hvis gruppen er overrepresentert og øker hvis gruppen er underrepresentert. Metodene antas å være mindre påvirket av seleksjonsskjevhet enn permutert blokk-randomisering.

Adaptiv

Minst to typer "adaptive" randomiseringsprosedyrer har blitt brukt i RCT, men mye sjeldnere enn enkel eller begrenset randomisering:

  • Kovariat-adaptiv randomisering , hvorav én type er minimering : Sannsynligheten for å bli tildelt en gruppe varierer for å minimere "kovariat ubalanse." Minimering er rapportert å ha "støttespillere og motstandere" fordi bare det første fagets gruppeoppgave virkelig er valgt tilfeldig, eliminerer metoden ikke nødvendigvis skjevhet på ukjente faktorer.
  • Respons-adaptiv randomisering , også kjent som resultat-adaptiv randomisering : Sannsynligheten for å bli tildelt en gruppe øker hvis responsene fra de tidligere pasientene i gruppen var gunstige. Selv om det er blitt argumentert for at denne tilnærmingen er mer etisk enn andre typer randomisering når sannsynligheten for at en behandling er effektiv eller ineffektiv øker i løpet av en RCT, har etikere ennå ikke studert tilnærmingen i detalj.

Tildeling av skjul

"Tildeling av skjul" (definert som "prosedyren for å beskytte randomiseringsprosessen slik at behandlingen som skal tildeles ikke er kjent før pasienten går inn i studien") er viktig i RCT. I praksis synes kliniske forskere i RCT ofte å være upartiske. Det florerer historier om at etterforskere holder forseglede konvolutter til lys eller ransaker kontorer for å bestemme gruppeoppgaver for å diktere tildelingen av deres neste pasient. Slike praksiser introduserer seleksjonsskjevhet og confounders (som begge bør minimeres ved randomisering), noe som muligens kan forvride resultatene av studien. Tilstrekkelig fordeling av tildeling bør beseire pasienter og etterforskere fra å oppdage behandlingstildeling når en studie er i gang og etter at studien er avsluttet. Behandlingsrelaterte bivirkninger eller bivirkninger kan være spesifikke nok til å avsløre allokering til etterforskere eller pasienter og derved introdusere skjevhet eller påvirke eventuelle subjektive parametere som er samlet av etterforskere eller forespurt fra fagpersoner.

Noen standardmetoder for å sikre tildelingskjulning inkluderer sekvensielt nummererte, ugjennomsiktige, forseglede konvolutter (SNOSE); sekvensielt nummererte beholdere; apotek kontrollert randomisering; og sentral randomisering. Det anbefales at tildelingsskjulingsmetoder inkluderes i en RCTs protokoll , og at tildelingsskjulingsmetodene bør rapporteres i detalj i en publisering av et RCTs resultater; Imidlertid bestemte en studie fra 2005 at de fleste RCT -er har uklar fordeling av tildeling i protokollene, i publikasjonene eller begge deler. På den annen side konkluderte en studie fra 2008 med 146 metaanalyser med at resultatene av RCT-er med utilstrekkelig eller uklar fordeling av tildeling hadde en tendens til å være partisk mot gunstige effekter bare hvis RCT-resultatene var subjektive i motsetning til objektive .

Prøvestørrelse

Antall behandlingsenheter (fag eller grupper av individer) tildelt kontroll- og behandlingsgrupper påvirker påliteligheten til en RCT. Hvis effekten av behandlingen er liten, kan antallet behandlingsenheter i hver gruppe være utilstrekkelig for å avvise nullhypotesen i den respektive statistiske testen . Unnlatelse av å avvise nullhypotesen vil innebære at behandlingen ikke viser noen statistisk signifikant effekt på de behandlede i en gitt test . Men ettersom prøvestørrelsen øker, kan den samme RCT være i stand til å påvise en signifikant effekt av behandlingen, selv om denne effekten er liten.

Blindende

En RCT kan bli blindet , (også kalt "maskert") av "prosedyrer som forhindrer deltakere, omsorgspersoner eller resultatvurderere i å vite hvilken intervensjon som ble mottatt." I motsetning til allokering, er blinding noen ganger upassende eller umulig å utføre i en RCT; for eksempel hvis en RCT innebærer en behandling der aktiv deltakelse av pasienten er nødvendig (f.eks. fysioterapi ), kan deltakerne ikke bli blindet for intervensjonen.

Tradisjonelt har blindede RCT blitt klassifisert som "enkeltblinde", "dobbeltblinde" eller "trippelblinde"; Imidlertid viste to studier i 2001 og 2006 at disse begrepene har forskjellige betydninger for forskjellige mennesker. CONSORT-erklæringen fra 2010 spesifiserer at forfattere og redaktører ikke skal bruke begrepene "enkeltblind", "dobbeltblind" og "trippelblind"; i stedet bør rapporter om blindet RCT diskutere "Hvis det er gjort, hvem ble blindet etter oppdrag til intervensjoner (for eksempel deltakere, omsorgsleverandører, de som vurderer utfall) og hvordan."

RCT uten blinding blir referert til som "blindet", "åpent" eller (hvis intervensjonen er en medisin) " åpen etikett ". I 2008 konkluderte en studie med at resultatene av ublindede RCT hadde en tendens til å være forutinntatt mot gunstige effekter bare hvis RCT -resultatene var subjektive i motsetning til objektive; for eksempel, i en RCT av behandlinger for multippel sklerose , følte ublindede nevrologer (men ikke de blinde nevrologene) at behandlingene var fordelaktige. I pragmatiske RCT -er, selv om deltakerne og leverandørene ofte er blinde, er det "fortsatt ønskelig og ofte mulig å blinde assessoren eller skaffe en objektiv datakilde for evaluering av utfall."

Analyse av data

Typer statistiske metoder som brukes i RCT -er, avhenger av egenskapene til dataene og inkluderer:

Uavhengig av de statistiske metodene som brukes, inkluderer viktige hensyn ved analysen av RCT -data:

  • Om en RCT bør stoppes tidlig på grunn av foreløpige resultater. For eksempel kan RCT stoppes tidlig hvis en intervensjon gir "større enn forventet nytte eller skade", eller hvis "etterforskere finner bevis for ingen viktig forskjell mellom eksperimentelle og kontrollintervensjoner."
  • I hvilken grad gruppene kan analyseres nøyaktig slik de eksisterte ved randomisering (dvs. om det brukes en såkalt " intention-to-treat analyse "). En "ren" intensjon-til-behandling-analyse er "bare mulig når fullstendige resultatdata er tilgjengelig" for alle randomiserte fag; Når noen utfallsdata mangler, inkluderer alternativer å analysere bare tilfeller med kjente utfall og bruke tilregnede data. Likevel, jo mer som analyser kan inkludere alle deltakerne i gruppene de ble randomisert til, desto mindre skjevhet vil en RCT bli utsatt for.
  • Hvorvidt undergruppeanalyse skal utføres. Disse er "ofte motløse" fordi flere sammenligninger kan gi falske positive funn som ikke kan bekreftes av andre studier.

Rapportering av resultater

Den CONSORT 2010 erklæringen er "en evidensbasert, minimum sett med anbefalinger for rapportering av randomiserte kontrollerte studier." CONSORT 2010-sjekklisten inneholder 25 elementer (mange med underelementer) med fokus på "individuelt randomiserte, to grupper, parallelle forsøk" som er den vanligste typen RCT.

For andre RCT -studiedesigner har " CONSORT extensions " blitt publisert, noen eksempler er:

  • Erklæring fra Consort 2010: Utvidelse til klynge randomiserte forsøk
  • Erklæring fra Consort 2010: Ikke-farmakologiske behandlingstiltak

Relativ betydning og observasjonsstudier

To studier publisert i The New England Journal of Medicine i 2000 fant at observasjonsstudier og RCT samlet ga lignende resultater. Forfatterne av funnene i 2000 satte spørsmålstegn ved troen på at "observasjonsstudier ikke bør brukes for å definere bevisbasert medisinsk behandling", og at RCT-resultatene er "bevis på høyeste karakter." En studie fra 2001 publisert i Journal of the American Medical Association konkluderte imidlertid med at "uoverensstemmelser utover tilfeldigheter forekommer, og forskjeller i estimert omfang av behandlingseffekt er svært vanlige" mellom observasjonsstudier og RCT.

To andre resonnementer stiller spørsmål ved RCTs bidrag til vitenskapelig kunnskap utover andre typer studier:

  • Hvis studiedesign er rangert etter potensialet for nye funn, vil anekdotiske bevis være øverst på listen, etterfulgt av observasjonsstudier, etterfulgt av RCT.
  • RCT kan være unødvendig for behandlinger som har dramatiske og raske effekter i forhold til det forventede stabile eller gradvis verre naturlige forløpet av tilstanden som behandles. Et eksempel er kombinasjons kjemoterapi inkludert cisplatin for metastatisk testikkelkreft , som økte helbredelsesgraden fra 5% til 60% i en ikke-randomisert studie fra 1977.

Tolkning av statistiske resultater

Som alle statistiske metoder er RCT underlagt både type I ("falsk positiv") og type II ("falsk negativ") statistiske feil . Når det gjelder type I -feil, vil en typisk RCT bruke 0,05 (dvs. 1 av 20) som sannsynlighet for at RCT feilaktig vil finne to like effektive behandlinger som er vesentlig forskjellige. Når det gjelder type II-feil, til tross for publiseringen av et papir fra 1978 som bemerket at utvalgsstørrelsene til mange "negative" RCT-er var for små til å gjøre endelige konklusjoner om de negative resultatene, hadde en betydelig andel av RCT-er fremdeles hatt unøyaktige eller ufullstendige rapporter fra 2005-2006. utvalgsstørrelsesberegninger.

Fagfellevurdering

Faglig vurdering av resultater er en viktig del av den vitenskapelige metoden . Granskere undersøker studieresultatene for potensielle problemer med design som kan føre til upålitelige resultater (for eksempel ved å lage en systematisk skjevhet ), evaluere studien i sammenheng med relaterte studier og andre bevis, og vurdere om studien med rimelighet kan anses å ha bevist sine konklusjoner. For å understreke behovet for fagfellevurdering og faren for over-generalisering av konklusjoner, utførte to medisinske forskere i Boston-området en randomisert kontrollert studie der de tilfeldigvis tildelte 23 fall frivillig en fallskjerm eller en tom ryggsekk som hoppet fra enten en biplan eller en helikopter. Studien var i stand til å rapportere nøyaktig at fallskjerm ikke klarte å redusere skader sammenlignet med tomme ryggsekker. Den viktigste konteksten som begrenset den generelle anvendeligheten av denne konklusjonen var at flyet sto parkert på bakken, og deltakerne hadde bare hoppet omtrent to fot.

Fordeler

RCT anses å være den mest pålitelige formen for vitenskapelig bevis i hierarkiet av bevis som påvirker helsepolitikk og praksis fordi RCT reduserer falsk årsakssammenheng og skjevhet. Resultatene av RCT-er kan kombineres i systematiske oversikter som i økende grad brukes i utførelse av bevisbasert praksis . Noen eksempler på at vitenskapelige organisasjoner vurderer RCT eller systematiske anmeldelser av RCT for å være bevis av høyeste kvalitet som er tilgjengelig:

Bemerkelsesverdige RCT -er med uventede resultater som bidro til endringer i klinisk praksis inkluderer:

  • Etter godkjenning fra Food and Drug Administration , kom de antiarytmiske midlene flecainide og encainide på markedet i henholdsvis 1986 og 1987. De ikke-randomiserte studiene om stoffene ble karakterisert som "glødende", og salget deres økte til totalt 165 000 resepter per måned i begynnelsen av 1989. I det året konkluderte imidlertid en foreløpig rapport fra en RCT med at de to legemidlene økt dødelighet. Salget av stoffene gikk deretter ned.
  • Før 2002, basert på observasjonsstudier, var det rutine for leger å foreskrive hormonbehandling for postmenopausale kvinner for å forhindre hjerteinfarkt . I 2002 og 2004, derimot, publiserte RCT fra Women's Health Initiative hevdet at kvinner som tok hormonbehandling med østrogen pluss progestin hadde en høyere frekvens av hjerteinfarkt enn kvinner på placebo, og at hormonerstatningsterapi som kun var østrogen forårsaket ingen reduksjon i forekomsten av koronar hjertesykdom. Mulige forklaringer på avviket mellom observasjonsstudiene og RCT -ene innebar forskjeller i metodikk, i hormonregimene som ble brukt og i populasjonene som ble undersøkt. Bruken av hormonbehandling erstatter etter publisering av RCT.

Ulemper

Mange artikler diskuterer ulempene med RCT. Blant de mest nevnte ulempene er:

Tid og kostnader

RCT -er kan være dyre; en studie fant 28 fase III RCT -er finansiert av National Institute of Neurological Disorders and Stroke før 2000 med en total kostnad på 335 millioner dollar, til en gjennomsnittlig kostnad på 12 millioner dollar per RCT. Likevel kan avkastningen på investeringen av RCT-er være høy, ved at den samme studien anslått at de 28 RCT-ene produserte en "nettogevinst for samfunnet ved 10-år" på 46 ganger kostnaden for prøveprogrammet, basert på evaluering av en kvalitet- justert levetid som lik rådende gjennomsnitt per bruttonasjonalprodukt per innbygger .

Utførelsen av en RCT tar flere år før den blir publisert; data er derfor begrenset fra det medisinske samfunnet i lange år og kan være av mindre relevans på tidspunktet for publisering.

Det er kostbart å opprettholde RCT -er i årene eller tiårene som ville være ideelle for å evaluere noen inngrep.

Intervensjoner for å forhindre hendelser som forekommer sjelden (f.eks. Plutselig spedbarnsdødssyndrom ) og uvanlige bivirkninger (f.eks. En sjelden bivirkning av et stoff) vil kreve RCT med ekstremt store prøvestørrelser og kan derfor best vurderes av observasjonsstudier .

På grunn av kostnadene ved å kjøre RCT, inspiserer disse vanligvis bare en variabel eller svært få variabler, noe som sjelden gjenspeiler hele bildet av en komplisert medisinsk situasjon; mens saksrapporten for eksempel kan detaljere mange aspekter av pasientens medisinske situasjon (f.eks. pasienthistorie , fysisk undersøkelse , diagnose , psykososiale aspekter, oppfølging).

Interessekonflikter farer

En studie fra 2011 gjort for å avsløre mulige interessekonflikter i underliggende forskningsstudier som ble brukt til medisinske metaanalyser, gjennomgikk 29 metaanalyser og fant at interessekonflikter i studiene som lå til grunn for metaanalysene sjelden ble avslørt. De 29 metaanalysene inkluderte 11 fra allmennmedisinsk tidsskrifter; 15 fra spesialmedisinsk tidsskrifter, og 3 fra Cochrane Database of Systematic Reviews. De 29 metaanalysene gjennomgikk totalt 509 randomiserte kontrollerte studier (RCT). Av disse rapporterte 318 RCT -er finansieringskilder med 219 (69%) næring finansiert. 132 av de 509 RCT -ene rapporterte forfattere om interessekonflikter, med 91 studier (69%) som avslørte bransjens økonomiske bånd med en eller flere forfattere. Informasjonen ble imidlertid sjelden reflektert i metaanalysene. Bare to (7%) rapporterte RCT-finansieringskilder og ingen rapporterte RCT-forfatter-industri-bånd. Forfatterne konkluderte med "uten anerkjennelse av COI på grunn av finansiering fra industrien eller forfatterindustriens økonomiske bånd fra RCT-er inkludert i metaanalyser, lesernes forståelse og vurdering av bevisene fra metaanalysen kan bli kompromittert."

Noen RCT -er er helt eller delvis finansiert av helsebransjen (f.eks. Farmasøytisk industri ) i motsetning til myndigheter, ideelle organisasjoner eller andre kilder. En systematisk gjennomgang publisert i 2003 fant fire artikler fra 1986–2002 som sammenligner bransjesponserte og ikke-industri-sponsede RCT-er, og i alle artiklene var det en sammenheng mellom bransjesponsorat og positivt studieresultat. En studie fra 2004 av RCT-er fra 1999–2001 som ble publisert i ledende medisinske og kirurgiske tidsskrifter, bestemte at industrifinansierte RCT-er "er mer sannsynlig å være assosiert med statistisk signifikante pro-industri-funn." Disse resultatene har blitt reflektert i studier ved kirurgi, der selv om finansiering fra bransjen ikke påvirket graden av seponering, var det imidlertid forbundet med lavere odds for publisering for fullførte forsøk. En mulig årsak til de pro-industrielle resultatene i bransjefinansierte publiserte RCT er publikasjonsskjevhet . Andre forfattere har sitert de forskjellige målene med akademisk forskning og industri sponset forskning som bidrar til forskjellen. Kommersielle sponsorer kan være mer fokusert på å utføre studier av legemidler som allerede har vist løfte i tidlige stadier, og på å replikere tidligere positive resultater for å oppfylle forskriftskrav for legemiddelgodkjenning.

Etikk

Hvis det utvikles en forstyrrende innovasjon innen medisinsk teknologi, kan det være vanskelig å teste dette etisk i en RCT hvis det blir "åpenbart" at kontrollpersonene har dårligere utfall - enten på grunn av annen foregående testing, eller i den innledende fasen av RCT seg selv. Etisk kan det være nødvendig å avbryte RCT for tidlig, og det er ikke mulig å få etisk godkjenning (og pasientavtale) for å holde innovasjonen tilbake fra kontrollgruppen i fremtiden.

Historiske kontrollforsøk (HCT) utnytter dataene fra tidligere RCT for å redusere utvalgsstørrelsen; Imidlertid er disse tilnærmingene kontroversielle i det vitenskapelige samfunnet og må håndteres med forsiktighet.

I samfunnsvitenskap

På grunn av den siste fremveksten av RCT i samfunnsvitenskap, er bruk av RCT i samfunnsvitenskap et omstridt tema. Noen forfattere med medisinsk eller helsebakgrunn har hevdet at eksisterende forskning innen en rekke samfunnsvitenskapelige disipliner mangler stringens, og bør forbedres ved større bruk av randomiserte kontrollforsøk.

Transportvitenskap

Forskere innen transportvitenskap hevder at offentlige utgifter til programmer som skolereiseplaner ikke kunne begrunnes med mindre deres effekt er demonstrert av randomiserte kontrollerte studier. Graham-Rowe og kolleger gjennomgikk 77 evalueringer av transportintervensjoner som finnes i litteraturen, og kategoriserte dem i 5 "kvalitetsnivåer". De konkluderte med at de fleste studiene var av lav kvalitet og tok til orde for bruk av randomiserte kontrollerte studier hvor det er mulig i fremtidig transportforskning.

Dr. Steve Melia tok problem med disse konklusjonene og argumenterte for at påstander om fordelene med RCT, for å fastslå årsakssammenheng og unngå forspenning, har blitt overdrevet. Han foreslo følgende åtte kriterier for bruk av RCT i sammenhenger der intervensjoner må endre menneskelig atferd for å være effektive:

Intervensjonen:

  1. Har ikke blitt brukt på alle medlemmer av en unik gruppe mennesker (f.eks. Befolkningen i et helt land, alle ansatte i en unik organisasjon etc.)
  2. Brukes i en kontekst eller setting som ligner den som gjelder for kontrollgruppen
  3. Kan isoleres fra andre aktiviteter - og formålet med studien er å vurdere denne isolerte effekten
  4. Har en kort tidsramme mellom implementering og modning av effektene

Og årsaksmekanismene:

  1. Er enten kjent for forskerne, ellers kan alle mulige alternativer testes
  2. Ikke involver betydelige tilbakemeldingsmekanismer mellom intervensjonsgruppen og eksterne miljøer
  3. Ha et stabilt og forutsigbart forhold til eksogene faktorer
  4. Ville opptre på samme måte hvis kontrollgruppen og intervensjonsgruppen ble reversert

Kriminologi

En anmeldelse fra 2005 fant 83 randomiserte eksperimenter innen kriminologi publisert i 1982–2004, mot bare 35 publiserte i 1957–1981. Forfatterne klassifiserte studiene de fant i fem kategorier: "politiarbeid", "forebygging", "korreksjoner", "domstol" og "fellesskap". Hollin (2008) fokuserte bare på krenkende atferdsprogrammer, og hevdet at RCT kan være vanskelig å implementere (f.eks. Hvis en RCT krevde "avsetting av setninger som tilfeldig ville tilordne lovbrytere til programmer") og derfor at eksperimenter med kvasi-eksperimentell design fremdeles er nødvendig .

utdanning

RCT har blitt brukt for å evaluere en rekke utdanningsintervensjoner. Mellom 1980 og 2016 har over 1000 rapporter om RCT blitt publisert. For eksempel randomiserte en 2009 -studie 260 grunnskolelærers klasserom til å motta eller ikke motta et program for atferdsscreening, intervensjon i klasserommet og foreldretrening, og deretter målt atferdenes og akademiske prestasjonene til elevene. En annen studie fra 2009 randomiserte klasserom for 678 førsteklasses barn til å motta et klasseromsentrert intervensjon, en foreldresentrert intervensjon eller ingen intervensjon, og fulgte deretter deres akademiske utfall gjennom 19 år.

Kritikk

En gjennomgang i 2018 av de 10 mest siterte randomiserte kontrollerte studiene påpekte dårlig fordeling av bakgrunnsegenskaper, vanskeligheter med å blende, og diskuterte andre forutsetninger og skjevheter i randomiserte kontrollerte studier. Disse inkluderer "unik tidsperiodevurdering", "bakgrunnsegenskapene forblir konstant antagelse", "begrensning av gjennomsnittlig behandlingseffekt", "enkel behandling på individnivåbegrensning", "alle forutsetninger er fullt ut oppfylt forutsetning", "kvantitativ variabel begrensning" og "bare placebo eller begrenset behandling kun med konvensjonell behandling".

Se også

Referanser

Eksterne linker