COMPARTIR | IMPRIMIR | CORREU ELECTRÒNIC
"Els atacs contra mi, francament, són atacs contra mi ciència.” ~ Anthony Fauci, 9 de juny de 2021 (MSNBC).
absurd.
D'una banda, el doctor Fauci no ha informat amb precisió sobre qüestions científiques durant la pandèmia de la Covid-19. D'altra banda, la dialèctica essencial de la ciència és discutir, qüestionar, debatre. Sense debat, la ciència no és més que propaganda.
Tanmateix, es pot preguntar, com ha estat possible presentar material tècnic al públic nord-americà, si no al públic internacional, durant gairebé tres anys i aconseguir una comprensió general que els temes eren "científics", quan en realitat no ho eren. ? Afirmo que el que s'ha donat a aquests públics a través dels mitjans tradicionals al llarg de la pandèmia ha estat en gran mesura versemblança, però no ciència, i que tant el públic nord-americà i internacional, com la majoria dels metges i els mateixos científics, no poden dir-ho. la diferència. Tanmateix, la diferència és fonamental i profunda.
La ciència comença amb teories, hipòtesis, que tenen ramificacions empíriques examinables. No obstant això, aquestes teories no són ciència; ells motivar ciència. La ciència es produeix quan els individus fan experiments o fan observacions que afecten a les implicacions o ramificacions de les teories. Aquestes troballes tendeixen a donar suport o refutar les teories, que després es modifiquen o actualitzen per ajustar-se a les noves observacions o es descarten si les proves convincents mostren que no descriuen la naturalesa. Després es repeteix el cicle. ciència és la realització de treballs empírics o observacionals per obtenir proves que confirmin o refuten teories.
En general, les teories solen ser afirmacions plausibles que descriuen alguna cosa específica sobre com funciona la natura. La plausibilitat està a l'ull de l'espectador, ja que allò que és plausible per a un expert tècnic pot no ser plausible per a una persona profana. Per exemple —potser simplificat excessivament— l'heliocentrisme no era plausible abans que Nicolau Copèrnic publicés la seva teoria el 1543, i no va ser especialment plausible després durant molt de temps, fins que Johannes Kepler va comprendre que les mesures astronòmiques fetes per Tycho Brahe suggerien perfeccionar les òrbites circulars de Copèrnic a el·lipses. , així com que les regles matemàtiques semblaven governar els moviments planetaris al llarg d'aquestes el·lipses, però les raons d'aquestes regles matemàtiques, fins i tot si fossin bones descripcions dels moviments, no eren plausibles fins que Isaac Newton el 1687 va plantejar l'existència d'una gravitació universal. força entre masses, juntament amb una llei de distància quadrada inversa i proporcional a la massa que governa la magnitud de l'atracció gravitatòria, i va observar nombrosos fenòmens quantitatius consistents amb aquesta teoria i que la recolzen.
Per a nosaltres avui, difícilment pensem en la plausibilitat de les òrbites heliocèntriques el·líptiques del sistema solar, perquè les dades d'observació que abasten 335 anys han estat molt coherents amb aquesta teoria. Però podríem rebutjar pensar que és plausible que la llum viatgi simultàniament com a partícules i ones, i que fer mesures sobre la llum, el que fem com a observadors, determini si veiem el comportament de les partícules o el comportament de les ones, i podem optar per observar les partícules. o ones, però no totes dues alhora. La natura no és necessàriament plausible.
Però, de totes maneres, les teories plausibles són fàcils de creure, i aquest és el problema. Això és el que hem estat alimentats durant gairebé tres anys de la pandèmia de la Covid-19. De fet, però, durant molt més temps hem estat alimentats de plausibilitat en lloc de ciència.
Cargo-Cult Science
Els xarlatans que pretenien doblegar culleres amb la ment o que pretenien estudiar la "percepció extrasensorial" no confirmable i irreplicable eren molt populars als anys seixanta i setanta. Les estranyes creences sobre allò que la "ciència" podria establir van assolir un nivell tal que el Premi Nobel de Física Richard Feynman va pronunciar el discurs de graduació de Caltech de 1960 (Feynman, 1970) lamentant aquestes creences irracionals. Els seus comentaris no anaven adreçats al públic en general, sinó als estudiants graduats de Caltech, molts dels quals estaven destinats a convertir-se en científics acadèmics.
En el seu discurs, Feynman va descriure com els habitants del mar del Sud, després de la Segona Guerra Mundial, van imitar els soldats nord-americans estacionats allà durant la guerra que havien guiat l'aterratge d'avions de subministraments. Els residents de l'illa, utilitzant materials locals, van reproduir la forma i els comportaments del que havien presenciat dels GI nord-americans, però no van arribar subministraments.
En el nostre context, el punt de Feynman seria que fins que una teoria no tingui evidències empíriques objectives que la relacionen, segueix sent només una teoria per molt plausible que sembli a tothom que l'entretingui. Els illencs trobaven a faltar el fet crucial que no entenien com funcionava el sistema de subministrament, malgrat com de plausible era per a ells la seva reproducció. Feynman es va sentir obligat a advertir els estudiants de Caltech graduats de la diferència entre plausibilitat i ciència, cosa que suggereix que aquesta diferència no es va aprendre adequadament a les seves educacions de l'Institut. No es va ensenyar explícitament quan aquest autor era un estudiant allà en aquells anys, però d'alguna manera, s'esperava que ho haguéssim après "per osmosi".
Medicina basada en l'evidència
Potser no hi ha una farsa de plausibilitat més gran avui que "medicina basada en l'evidència” (EBM). Aquest terme va ser encunyat per Gordon Guyatt l'any 1990, després que el seu primer intent, "Medicina científica", no va aconseguir l'acceptació l'any anterior. Com a epidemiòleg universitari l'any 1991, em va insultar la arrogancia i la ignorància en l'ús d'aquest terme, EBM, com si l'evidència mèdica fos d'alguna manera "no científica" fins que es va proclamar una nova disciplina amb noves regles d'evidència. No estava sol en la crítica de l'EBM (Sackett et al., 1996), tot i que bona part d'aquesta resposta negativa sembla haver estat basada en la pèrdua de control narratiu més que en una revisió objectiva del que la investigació mèdica havia aconseguit realment sense "EBM".
El coneixement mèdic occidental s'ha acumulat durant milers d'anys. A la Bíblia hebrea (Èxode 21:19), "Quan dues parts es barallen i l'una colpeja l'altra... la víctima serà curada completament" [la meva traducció], la qual cosa implica que existien persones que tenien coneixements mèdics i que un cert grau de eficàcia inherent. Hipòcrates, al segle V-IV aC, va suggerir que el desenvolupament de la malaltia podria no ser aleatori sinó relacionat amb l'exposició del medi ambient o amb determinats comportaments. En aquella època, hi havia molts dels que avui considerem contraexemples de la bona pràctica mèdica. No obstant això, va ser un començament, pensar en proves racionals per al coneixement mèdic.
James Lind (1716-1794) va defensar la protecció de l'escorbut mitjançant el consum de cítrics. Aquest tractament era conegut pels antics, i en particular havia estat recomanat anteriorment pel cirurgià militar anglès John Woodall (1570-1643), però Woodall va ser ignorat. Lind obté el crèdit perquè el 1747 va dur a terme un petit però reeixit assaig controlat i no aleatori de taronges i llimones enfront d'altres substàncies entre 12 pacients amb escorbut.
Durant la dècada de 1800, l'ús de la verola bovina per part d'Edward Jenner com a vacuna contra la verola es va elaborar cultivant en altres animals i es va posar en ús general en brots, de manera que en el moment del cas del Tribunal Suprem de 1905 de Jacobson contra Massachusetts, el jutge en cap podria afirmar que les autoritats mèdiques van acordar que la vacunació contra la verola era un procediment acceptat comunament. Les revistes mèdiques van començar a publicar-se regularment també a la dècada de 1800. Per exemple, el Llanceta va començar a publicar-se l'any 1824. El coneixement mèdic creixent va començar a ser compartit i debatut de manera més general i àmplia.
Avancem ràpidament fins als anys 1900. El 1914-15, Joseph Goldberger (1915) va dur a terme un assaig d'intervenció dietètica no aleatòria que va concloure que la pel·lagra era causada per la manca de niacina dietètica. A la dècada de 1920 es van desenvolupar vacunes contra la diftèria, la tos ferina, la tuberculosi i el tètanus. Es va extreure insulina. Es van desenvolupar vitamines, inclosa la vitamina D per prevenir el raquitisme. A la dècada de 1930 es van començar a crear i utilitzar amb eficàcia els antibiòtics. A la dècada de 1940 es va desenvolupar l'acetaminofè, igual que les quimioteràpies, i es van començar a utilitzar estrògens conjugats per tractar els sofocos de la menopausa. Els nous medicaments, vacunes i dispositius mèdics efectius van créixer exponencialment en nombre als anys 1950 i 1960. Tot sense EBM.
El 1996, responent a les crítiques a EBM, David Sackett et al. (1996) va intentar explicar els seus principis generals. Sackett va afirmar que l'EBM va seguir de "Els bons metges utilitzen tant l'experiència clínica individual com la millor evidència externa disponible". Aquesta és una implicació de plausibilitat anodina, però els dos components són bàsicament incorrectes o almenys enganyosos. En formular aquesta definició en termes del que haurien de fer els metges individuals, Sackett va donar a entendre que els professionals individuals haurien d'utilitzar les seves pròpies observacions i experiència clíniques. Tanmateix, és probable que la representativitat general de l'evidència de l'experiència clínica d'un individu sigui feble. Igual que altres formes d'evidència, l'evidència clínica s'ha de recollir, revisar i analitzar sistemàticament, per formar una síntesi de raonament clínic, que després proporcionaria el component clínic de l'evidència mèdica científica.
Un fracàs més gran del raonament probatori és l'afirmació de Sackett que s'ha d'utilitzar "la millor evidència externa disponible" en lloc de tots proves externes vàlides. Els judicis sobre el que constitueix la "millor" evidència són altament subjectius i no necessàriament donen resultats globals que siguin quantitativament els més precisos i precisos (Hartling et al., 2013; Bae, 2016). En formular els seus ara canònics "aspectes" del raonament causal probacional, Sir Austin Bradford Hill (1965) no va incloure cap aspecte del que constituiria la "millor" evidència, ni va suggerir que els estudis haurien de ser mesurats o categoritzats per a la "qualitat de l'estudi". ” ni tan sols que alguns tipus de dissenys d'estudi puguin ser intrínsecament millors que altres. En el Manual de referència sobre evidència científica, Margaret Berger (2011) afirma explícitament, “... molts dels organismes científics més respectats i prestigiosos (com l'Agència Internacional per a la Investigació del Càncer (IARC), l'Institut de Medicina, el Consell Nacional d'Investigació i l'Institut Nacional per a Ciències de la Salut Ambiental) consideri tota l'evidència científica rellevant disponible, presa en conjunt, per determinar quina conclusió o hipòtesi sobre una afirmació causal és millor recolzada pel conjunt d'evidències. Aquest és exactament l'enfocament de Hill; els seus aspectes del raonament causal s'han utilitzat molt àmpliament durant més de 50 anys per raonar des de l'observació fins a la causalitat, tant en ciència com en dret. Que l'EBM es basa en la "millor" evidència de la selecció subjectiva de cireres és un mètode plausible però no científic.
Amb el pas del temps, l'enfocament de l'EBM per considerar selectivament les "millors" evidències sembla que s'hagi "reduït", primer col·locant els assaigs controlats aleatoris (ECA) a la part superior d'una piràmide de tots els dissenys d'estudi com el suposat disseny "estàndard d'or". i més tard, com l'únic tipus d'estudi afirmat que es pot confiar per obtenir estimacions imparcials dels efectes. Totes les altres formes d'evidència empírica són "potencialment esbiaixades" i, per tant, no són fiables. Aquesta és una presumpció de plausibilitat com mostraré a continuació.
Però és tan plausible que s'ensenya habitualment a l'educació mèdica moderna, de manera que la majoria dels metges només tenen en compte l'evidència de l'ECA i descarten totes les altres formes d'evidència empírica. És tan plausible que aquest autor hagi tingut una batalla verbal a l'aire amb un comentarista de televisió sense educació mèdica que no va proporcionar cap prova més que versemblant (Whelan, 2020): No és "només obvi" que si aleatoritzeu els subjectes, qualsevol les diferències han de ser causades pel tractament i no es pot confiar en cap altre tipus d'estudis? Òbviament, sí; veritat, no.
Qui es beneficia d'un enfocament únic i obsessiu en l'evidència de l'ECA? Els ECA són molt cars de dur a terme si han de ser vàlids epidemiològicament i estadísticament adequats. Poden costar milions o desenes de milions de dòlars, cosa que limiten el seu atractiu en gran mesura a les empreses que promocionen productes mèdics que poden generar beneficis substancialment més grans que aquests costos. Històricament, el control farmacèutic i la manipulació de l'evidència de RCT en el procés de regulació van proporcionar un enorme impuls en la capacitat d'impulsar els productes mitjançant l'aprovació reguladora al mercat, i la motivació per fer-ho encara continua avui.
Aquest problema va ser reconegut pel Congrés, que va aprovar la Llei de Modernització de l'Administració de Medicaments i Aliments de 1997 (FDAMA) que va establir l'any 2000 la ClinicalTrials.gov lloc web per al registre de tots els assaigs clínics realitzats sota aplicacions de fàrmacs nous en investigació per examinar l'eficàcia de fàrmacs experimentals per a pacients amb afeccions greus o que amenacen la vida (National Library of Medicine, 2021). Per motius relacionats que impliquen conflictes d'interessos en assaigs clínics, el lloc web de ProPublica "Dollars for Docs" (Tigas et al., 2019) que cobreix els pagaments de les empreses farmacèutiques als metges durant els anys 2009-2018 i el lloc web d'OpenPayments (Centres for Medicare & Medicaid Services). , 2022) que cobreixen els pagaments del 2013 al 2021 es van establir i es van fer cercar públicament. Aquests sistemes d'informació es van crear perquè la "plausibilitat" que l'aleatorització fa automàticament que els resultats de l'estudi siguin precisos i imparcials es va reconèixer com a insuficient per fer front a les trampes de la investigació i als motius de conflicte d'interessos inadequats dels investigadors.
Tot i que aquests intents de reformar o limitar la corrupció de la investigació mèdica han ajudat, la tergiversació de l'evidència sota el pretext d'EBM persisteix. Un dels pitjors exemples va ser un article publicat al New England Journal of Medicine 13 de febrer de 2020, a l'inici de la pandèmia de la Covid-19, titulada "La màgia de l'aleatorització versus el mite de l'evidència del món real", per quatre estadístics mèdics britànics coneguts que tenen vincles substancials amb empreses farmacèutiques (Collins et al. ., 2020). Probablement es va escriure el gener del 2020, abans que la majoria de la gent sabés que la pandèmia s'acostava. Aquest article afirma que l'aleatorització crea automàticament estudis forts i que tots els estudis no aleatoris són escombraries probatòries. En el moment de llegir-lo, vaig sentir que era una regla contra tota la meva disciplina, l'epidemiologia. De seguida em vaig ofendre, però més tard vaig comprendre els greus conflictes d'interessos dels autors. El fet de representar que només les proves d'ECA molt inassequibles són adequades per a les aprovacions reguladores proporciona una eina per a les empreses farmacèutiques per protegir els seus productes de patents costosos i altament rendibles contra la competència mitjançant medicaments genèrics aprovats fora d'etiqueta efectius i econòmics els fabricants dels quals no podrien permetre's a gran escala. ECA.
l'aleatorització
Aleshores, quin és el defecte de l'aleatorització al qual he estat al·ludint, que requereix un examen més profund per entendre la validesa relativa dels estudis RCT en comparació amb altres dissenys d'estudis? El problema rau en la comprensió confondre. La confusió és una circumstància epidemiològica en què una relació entre una exposició i un resultat no es deu a l'exposició, sinó a un tercer factor (el factor de confusió), almenys en part. El factor de confusió s'associa d'alguna manera amb l'exposició, però no és el resultat de l'exposició.
En aquests casos, la relació aparent exposició-resultat es deu realment a la relació de confusió-resultat. Per exemple, un estudi sobre el consum d'alcohol i el risc de càncer podria estar potencialment confós per l'historial de tabaquisme que es correlaciona amb el consum d'alcohol (i no és causat pel consum d'alcohol), però que realment està impulsant l'augment del risc de càncer. Una simple anàlisi del risc d'alcohol i càncer, ignorant el tabaquisme, mostraria una relació. Tanmateix, un cop controlat o ajustat l'efecte del tabaquisme, la relació de l'alcohol amb el risc de càncer disminuiria o desapareixeria.
L'objectiu de l'aleatorització, d'equilibrar-ho tot entre els grups de tractament i control, és eliminar possibles confusions. Hi ha alguna altra manera d'eliminar possibles confusions? Sí: mesurar els factors en qüestió i ajustar-los o controlar-los en anàlisis estadístiques. Per tant, és evident que l'aleatorització té exactament un possible benefici no disponible per als estudis no aleatoris: el control de unfactors de confusió mesurats. Si les relacions biològiques, mèdiques o epidemiològiques s'entenen de manera incompleta sobre un resultat d'interès, llavors no es poden mesurar tots els factors rellevants, i alguns d'aquests factors no mesurats encara podrien confondre una associació d'interès.
Així, l'aleatorització, en teoria, elimina la possible confusió per factors no mesurats com a explicació d'una associació observada. Aquest és l'argument de la plausibilitat. La pregunta, però, es refereix a com funciona l'aleatorització a la realitat i qui ha de ser equilibrat exactament per l'aleatorització. Els assaigs clínics apliquen l'aleatorització a tots els subjectes participants per determinar les assignacions dels grups de tractament. Si en l'esdeveniment de resultats de l'estudi els individus formen un subconjunt de l'estudi total, llavors aquestes persones de resultats també s'han d'equilibrar en els seus possibles factors de confusió. Per exemple, si totes les morts del grup de tractament són homes i totes les del grup placebo són dones, és probable que el gènere confongui l'efecte del tractament.
El problema és que els estudis RCT essencialment mai demostren explícitament una aleatorització adequada dels seus subjectes de resultats, i el que pretenen mostrar de l'aleatorització per als seus grups de tractament totals gairebé sempre és científicament irrellevant. Aquest problema probablement sorgeix perquè els individus que duen a terme estudis RCT, i els revisors i editors de revistes que consideren els seus articles, no entenen prou els principis epidemiològics.
A la majoria de publicacions de l'ECA, els investigadors proporcionen una taula descriptiva inicial superficial dels grups de tractament i placebo (com a columnes), enfront de diversos factors mesurats (com a files). És a dir, les distribucions percentuals dels subjectes amb tractament i placebo per gènere, grup d'edat, raça/ètnia, etc. La tercera columna d'aquestes taules sol ser l'estadística de valor p per a la diferència de freqüència entre els subjectes amb tractament i placebo en cada factor mesurat. En termes generals, aquesta estadística estima la probabilitat que una diferència de freqüència entre els subjectes amb tractament i placebo tan gran pugui haver-se produït per casualitat. Atès que als subjectes se'ls va assignar els seus grups de tractament completament per casualitat, l'examen estadístic del procés d'atzar d'aleatorització és tautològic i irrellevant. Que en alguns ECA, alguns factors puguin semblar més extrems del que permetria l'atzar sota l'aleatorització és només perquè s'han examinat diversos factors a les files per trobar diferències distributives i, en aquestes circumstàncies, s'ha d'invocar el control estadístic de comparacions múltiples.
El que es necessita a la tercera columna de la taula descriptiva RCT no és el valor p, sinó una mesura de la magnitud de la confusió del factor de fila particular. La confusió no es mesura per com s'ha produït, sinó per com de dolenta és. Segons la meva experiència com a epidemiòleg de carrera, la millor mesura única de confusió és el canvi percentual en la magnitud de la relació tractament-resultat amb vs sense ajustament per al factor de confusió. Així, per exemple, si amb l'ajust per gènere, el tractament redueix la mortalitat en un 25% (risc relatiu = 0.75), però sense ajustament la redueix en un 50%, aleshores la magnitud de la confusió per gènere seria (0.75 – 0.50)/0.75 = 33. %. Els epidemiòlegs generalment consideren un canvi de més del 10% amb aquest ajust per implicar que hi ha confusió i s'ha de controlar.
Com he observat, la majoria de les publicacions d'ECA no proporcionen la magnitud de les estimacions confuses per als seus grups de tractament globals, i mai per als seus subjectes de resultats. Per tant, no és possible dir que els subjectes de resultats s'han aleatoritzat adequadament per a tots els factors indicats a la taula descriptiva del treball. Però el possible defecte fatal dels estudis RCT, el que no els pot fer millors que els estudis no aleatoris i, en alguns casos, pitjors, és que l'aleatorització només funciona quan s'han aleatoritzat un gran nombre de subjectes (Deaton i Cartwright, 2018), i això s'aplica específicament a els temes de resultats, no només a l'estudi total.
Penseu en tirar una moneda deu vegades. Pot sortir almenys set caps i tres cues, o viceversa, fàcilment per casualitat (34%). Tanmateix, la magnitud d'aquesta diferència, 7/3 = 2.33, és potencialment bastant gran en termes de possibles confusions. D'altra banda, l'aparició de la mateixa magnitud de 2.33 a partir de 70 o més caps de 100 voltes seria rara, p=.000078. Perquè l'aleatorització funcioni, cal que hi hagi un nombre considerable d'esdeveniments de resultat tant en el grup de tractament com en el de placebo, per exemple 50 o més a cada grup. Aquest és el defecte principal potencial tàcit dels estudis de RCT que fa que el seu argument de plausibilitat sigui inútil, perquè els estudis de RCT generalment estan dissenyats per tenir prou poder estadístic per trobar la significació estadística del seu resultat primari si el tractament funciona tal com es va predir, però no està dissenyat per tenir un resultat suficient. subjectes per reduir el potencial de confusió a menys del 10% diuen.
Un exemple important d'aquest problema es pot veure en el primer resultat d'eficàcia de l'ECA publicat per a la vacuna Pfizer BNT162b2 mRNA Covid-19 (Polack et al., 2020). Aquest estudi es va considerar prou gran (43,548 participants aleatoritzats) i prou important (Covid-19) que, a causa de la seva presumpta plausibilitat de l'ECA, va assegurar la publicació al "prestigiós" New England Journal of Medicine. El resultat principal de l'estudi va ser l'aparició de Covid-19 amb aparició almenys set dies després de la segona dosi de la vacuna o la injecció de placebo. Tanmateix, tot i que va observar 162 casos entre els subjectes placebo, suficients per a una bona aleatorització, només va trobar vuit casos entre els subjectes de la vacuna, ni tan sols prou perquè l'aleatorització hagi fet res per controlar la confusió.
A partir de l'experiència epidemiològica general, un risc relatiu estimat tan gran (aproximadament 162/8 = 20) seria poc probable que es degui completament a confusió, però la precisió del risc relatiu o la seva efectivitat implicada ((20 – 1)/20 = 95 %) està en dubte. Que s'hagi observat que aquesta vacuna en ús no era tan eficaç per reduir el risc d'infecció no és sorprenent donada la debilitat del resultat de l'estudi a causa de la mida de la mostra inadequada per assegurar que l'aleatorització funcionés per als subjectes de resultat tant en el grup de tractament com en el de placebo.
Aquesta "immersió a les males herbes" de l'epidemiologia il·lustra per què un estudi d'ECA amb menys de, per exemple, 50 subjectes de resultats en tots i cadascun dels grups de tractament de l'assaig té poca o cap pretensió per evitar possibles confusions per factors no mesurats. Però també fa evident per què pot ser aquest judici pitjor que un assaig controlat no aleatori de la mateixa exposició i resultat. En assaigs no aleatoris, els investigadors saben que molts factors poden, com a possibles factors de confusió, influir en l'ocurrència del resultat, de manera que mesuren tot allò que consideren rellevant, per després ajustar i controlar aquests factors en les anàlisis estadístiques.
Tanmateix, en els ECA, els investigadors pensen habitualment que l'aleatorització ha tingut èxit i, per tant, realitzen anàlisis estadístiques no ajustades, proporcionant resultats potencialment confusos. Quan veieu que els ECA desfilen com a estudis "grans" a causa de les seves desenes de milers de participants, mireu més enllà d'això, al nombre d'esdeveniments de resultat primari en els braços de tractament de l'assaig. Els assaigs amb un nombre reduït d'esdeveniments de resultat primari són inútils i no s'han de publicar, i molt menys confiar-hi per consideracions de salut pública o polítiques.
Evidència empírica
Després de llegir tot l'anterior, podríeu pensar que aquests arguments sobre assaigs aleatoris i no aleatoris són molt plausibles, però què passa amb l'evidència empírica que els doni suport? Per això, la Cochrane Library Database of Systematic Reviews va fer una anàlisi molt exhaustiva (Anglemyer et al., 2014). Aquest estudi va cercar de manera exhaustiva set bases de dades de publicacions electròniques durant el període des de gener de 1990 fins a desembre de 2013, per identificar tots els documents de revisió sistemàtica que comparaven "estimacions quantitatives de la mida de l'efecte que mesuraven l'eficàcia o l'efectivitat de les intervencions provades en assaigs [aleatoritzats] amb els provats en estudis observacionals. ” En efecte, una metaanàlisi de metaanàlisis, l'anàlisi va incloure molts milers de comparacions d'estudis individuals resumides en 14 articles de revisió.
Conclusió: una mitjana de només un 8% de diferència (límits de confiança del 95%, del -4% al 22%, no estadísticament significatiu) entre els ECA i els resultats dels seus assajos no aleatoris corresponents. En resum, aquest cos de coneixement, tant l'empíric com el basat en principis epidemiològics, demostra que, en contra de l'anomenada "plausibilitat", els assaigs aleatoris no tenen una classificació automàtica com a estàndard d'or d'evidència mèdica o com a única forma acceptable de evidència mèdica i que cada estudi s'ha d'examinar de manera crítica i objectiva per determinar els seus propis punts forts i febles, i quant són importants aquests punts forts i febles per a les conclusions extretes.
Altres plausibilitats
Durant la pandèmia de la Covid-19, s'han utilitzat nombroses altres afirmacions d'evidència científica per justificar les polítiques de salut pública, fins i tot per a la mateixa declaració de l'emergència pandèmica. A la base de molts d'ells hi ha el principi plausible però fal·laç que l'objectiu de la gestió de la pandèmia de salut pública és minimitzar el nombre de persones infectades pel virus SARS-CoV-2.
Aquesta política pot semblar òbvia, però és incorrecta com a política general. El que cal minimitzar són les conseqüències perjudicials de la pandèmia. Si la infecció provoca símptomes desagradables o molestos per a la majoria de les persones, però sense problemes greus o a llarg termini, com és generalment el cas del SARS-CoV-2, especialment a l'era d'Omicron, no hi hauria cap benefici tangible de la salut pública general. intervencions i limitacions que infringeixin els drets naturals o econòmics d'aquestes persones i que causin danys en si mateixes.
Les societats occidentals, inclosos els Estats Units, prenen onades anuals d'infecció respiratòria amb calma sense declarar emergències pandèmiques, tot i que produeixen milions d'individus infectats cada any, perquè les conseqüències de la infecció es consideren generalment menors des del punt de vista mèdic, fins i tot permeten unes desenes de milers de morts. anualment.
Durant els primers mesos de la pandèmia de la Covid-19 es va establir que el risc de mortalitat per infecció variava més de 1,000 vegades al llarg de la franja d'edat, i que les persones sense condicions de salut cròniques com ara diabetis, obesitat, malalties del cor, malalties renals, antecedents de càncer, etc., tenien un risc insignificant de mortalitat i un risc molt baix d'hospitalització. En aquell moment, era senzill definir categories d'individus d'alt risc que, de mitjana, es beneficiaran de les intervencions de salut pública, enfront d'individus de baix risc que resistirien amb èxit la infecció sense problemes apreciables o a llarg termini. Per tant, un esquema de gestió de pandèmia obsessiu i únic que no distingia les categories de risc va ser poc raonable i opressiu des del principi.
En conseqüència, les mesures promogudes per plausibilitat per reduir la transmissió de la infecció, encara que fossin efectives per a aquest propòsit, no han servit per a una bona gestió de la pandèmia. Tanmateix, aquestes mesures mai es van justificar per evidència científica en primer lloc. La regla de distanciament social de sis peus va ser una barreja arbitrària dels CDC (Dangor, 2021). Les reclamacions de beneficis per portar màscares facials poques vegades han distingit el benefici potencial per a l'usuari, per a qui aquest desgast seria una opció personal si accepta o no un risc més teòric, dels beneficis per als espectadors, l'anomenat "control de fonts", en què el públic les consideracions de salut poden aplicar-se correctament. Els estudis de control de fonts basats en màscares de virus respiratoris, on els estudis no tenen defectes mortals, no han demostrat cap benefici apreciable per reduir la transmissió d'infeccions (Alexander, 2021; Alexander, 2022; Burns, 2022).
Els confinaments generals de població mai s'han utilitzat als països occidentals i no tenen cap evidència d'efecte per fer res més que posposar l'inevitable (Meunier, 2020), tal com deixen clar les dades de població d'Austràlia (Worldometer, 2022). En la discussió definitiva de les mesures de salut pública per al control de la grip pandèmica (Inglesby et al., 2006), afirmen els autors, "No hi ha observacions històriques ni estudis científics que donin suport al confinament per quarantena de grups de persones possiblement infectades durant períodes prolongats per tal de frenar la propagació de la grip. Un grup de redacció de l'Organització Mundial de la Salut (OMS), després de revisar la literatura i tenir en compte l'experiència internacional contemporània, va concloure que "l'aïllament forçat i la quarantena són ineficaços i poc pràctics". … Les conseqüències negatives de la quarantena a gran escala són tan extremes (confinament forçat de persones malaltes amb el pou; restricció total del moviment de grans poblacions; dificultat per aconseguir subministraments crítics, medicaments i aliments a les persones dins de la zona de quarantena) que aquesta mitigació mesura s'hauria d'eliminar d'una consideració seriosa".
Sobre les restriccions de viatge, Inglesby et al. (2006) apunten: "Les restriccions de viatge, com ara tancar aeroports i controlar els viatgers a les fronteres, han estat històricament ineficaces. El grup de redacció de l'Organització Mundial de la Salut va concloure que "la detecció i la quarantena dels viatgers que entraven a les fronteres internacionals no van retardar substancialment la introducció del virus en pandèmies passades... i probablement serà encara menys efectiu a l'era moderna". Sobre el tancament d'escoles (Inglesby et al., 2006): “En epidèmies de grip anteriors, l'impacte del tancament d'escoles sobre les taxes de malaltia ha estat mixt. Un estudi d'Israel va informar d'una disminució de les infeccions respiratòries després d'una vaga de professors de dues setmanes, però la disminució només va ser evident durant un sol dia. D'altra banda, quan les escoles van tancar per vacances d'hivern durant la pandèmia de 2 a Chicago, "es van desenvolupar més casos de grip entre els alumnes... que quan les escoles estaven en sessió".
Aquesta discussió deixa clar que aquestes accions que suposadament interfereixen amb la transmissió del virus sobre la base d'arguments de plausibilitat per a la seva eficàcia han estat equivocades per gestionar la pandèmia i no estan justificades per l'evidència científica d'efectivitat per reduir la propagació. La seva promoció a gran escala ha demostrat el fracàs de les polítiques de salut pública en l'era de la Covid-19.
Plausibilitat vs mala ciència
Es podria argumentar que diverses polítiques de salut pública, així com la informació posada a disposició del públic en general, no s'han recolzat en la plausibilitat sinó en la ciència dolenta o fatalment defectuosa, posant-se com a ciència real. Per exemple, a la seva revista interna, no revisada per parells, Informes setmanals de morbiditat i mortalitat, CDC ha publicat una sèrie d'anàlisis de l'eficàcia de la vacuna. Aquests informes descriuen estudis transversals però els analitzaven com si fossin estudis de casos i controls, utilitzant sistemàticament paràmetres estimats d'odds ratio en lloc de riscos relatius per calcular l'eficàcia de la vacuna. Quan els resultats de l'estudi són poc freqüents, per exemple, menys del 10% dels subjectes de l'estudi, les probabilitats poden aproximar-se als riscos relatius, però en cas contrari, les probabilitats solen ser sobreestimades. Tanmateix, en estudis transversals, els riscos relatius es poden calcular directament i es poden ajustar per possibles factors de confusió mitjançant regressió de risc relatiu (Wacholder, 1986), de manera similar a l'ús de la regressió logística en estudis de casos i controls.
Un exemple representatiu és un estudi de l'eficàcia de les vacunes de la tercera dosi de Covid-19 (Tenforde et al., 2022). En aquest estudi, "... la xarxa IVY va inscriure 4,094 adults de ≥ 18 anys" i després de les exclusions de subjectes rellevants, "es van incloure 2,952 pacients hospitalitzats (1,385 pacients amb casos i 1,567 controls no COVID-19)." Els estudis transversals —per disseny— identifiquen el nombre total de subjectes, mentre que el nombre de casos i controls, exposats i no exposats, es produeixen fora de la intervenció de l'investigador, és a dir, per qualsevol dels processos naturals subjacents als mecanismes mèdics, biològics i epidemiològics examinats. En seleccionar un nombre total de subjectes, Tenforde et al. L'estudi és per definició un disseny transversal. Aquest estudi va informar d'una efectivitat de la vacuna del 82% entre pacients sense condicions immunodepressives. Aquesta estimació reflecteix una relació de probabilitats ajustada d'1 - 0.82 = 0.18. Tanmateix, la fracció de pacients de casos entre els vacunats va ser del 31% i entre els no vacunats va ser del 70%, cap dels quals és prou infreqüent per permetre l'ús de l'aproximació de la relació de probabilitats per calcular l'efectivitat de la vacuna. Segons les xifres de l'informe de l'estudi a la taula 3, calculo un risc relatiu no ajustat de 0.45 i un risc relatiu aproximadament ajustat de 0.43, donant la veritable efectivitat de la vacuna d'1 - 0.43 = 57%, que és substancialment diferent i molt pitjor que el 82% presentat al paper.
En un context diferent, després de publicar un article de revisió resum sobre l'ús de la hidroxicloroquina (HCQ) per al tractament ambulatori precoç de la Covid-19 (Risch, 2020), es van publicar diversos articles d'assaigs clínics per intentar demostrar que l'HCQ és ineficaç. . La primera d'aquestes anomenades "refutacions" es va dur a terme en pacients hospitalitzats, la malaltia dels quals és gairebé completament diferent en fisiopatologia i tractament que la malaltia ambulatòria precoç (Park et al., 2020). Els resultats importants que havia abordat a la meva revisió, els riscos d'hospitalització i mortalitat, es van distreure en aquests treballs centrant-se en resultats subjectius i menors, com ara la durada de la positivitat de la prova viral o la durada de l'estada hospitalària.
Posteriorment, es van començar a publicar ECA d'ús ambulatori d'HCQ. Un típic és el de Caleb Skipper et al. (2020). L'objectiu principal d'aquest assaig va ser un canvi en la gravetat global dels símptomes autoinformats durant 14 dies. Aquest punt final subjectiu va tenir poca importància pandèmica, sobretot tenint en compte que els subjectes dels estudis d'aquest grup d'investigació eren moderadament capaços de saber si estaven en els braços HCQ o placebo de l'assaig (Rajasingham et al., 2021) i, per tant, l'autoestima. els resultats informats no eren tan encegats als braços de la medicació. A partir de les seves anàlisis estadístiques, els autors van concloure adequadament que "la hidroxicloroquina no va reduir substancialment la gravetat dels símptomes en pacients ambulatoris amb COVID-19 precoç i lleu". Tanmateix, els mitjans generals van informar que aquest estudi demostrava que "la hidroxicloroquina no funciona". Per exemple, Jen Christensen (2020) a CNN Salut va declarar sobre aquest estudi: "El fàrmac antipalúdic hidroxicloroquina no va beneficiar els pacients no hospitalitzats amb símptomes lleus de Covid-19 que van ser tractats a principis de la seva infecció, segons un estudi publicat dijous a la revista mèdica. Annals of Internal Medicine".
Però, de fet, l'estudi Skipper sí que va informar sobre els dos resultats d'importància, els riscos d'hospitalització i la mortalitat: amb placebo, 10 hospitalitzacions i 1 mort; amb HCQ, 4 hospitalitzacions i 1 mort. Aquestes xifres mostren un risc d'hospitalització reduït un 60% que, tot i que no és estadísticament significatiu (p = 0.11), és totalment coherent amb tots els altres estudis de risc d'hospitalització per a l'ús d'HCQ en pacients ambulatoris (Risch, 2021). No obstant això, aquest petit nombre d'esdeveniments de resultat no és prou suficient perquè l'aleatorització hagi equilibrat cap factor, i l'estudi és essencialment inútil sobre aquesta base. Però encara es va interpretar malament a la literatura laica com a mostra que l'HCQ no proporciona cap benefici en l'ús ambulatori.
Conclusions
Durant la pandèmia de la Covid-19 s'han produït molts altres casos de plausibles científics plausibles o de mala ciència. Com es va veure amb els articles de Surgisphere retractats, les revistes mèdiques publiquen de manera rutinària i acrítica aquestes ximpleries sempre que les conclusions s'alinein amb les polítiques governamentals. Aquest cos de fals coneixement ha estat promulgat als nivells més alts, per NSC, FDA, CDC, NIH, OMS, Wellcome Trust, AMA, juntes d'especialitats mèdiques, agències de salut pública estatals i locals, empreses farmacèutiques multinacionals i altres organitzacions d'arreu del món. que han infringit les seves responsabilitats davant el públic o han optat deliberadament per no entendre la ciència falsa.
El Senat dels Estats Units va votar recentment, per tercera vegada, posar fi a l'estat d'emergència de la Covid-19, però el president Biden va declarar que vetaria la mesura per "por" de repetir-se. números de cas. Els meus col·legues i jo vam argumentar fa gairebé un any que l'emergència pandèmica s'havia acabat (Risch et al., 2022), però la confiança espúrea en el recompte de casos per justificar la supressió dels drets humans sota la cobertura d'"emergència" continua sense parar.
La censura massiva dels mitjans tradicionals i de bona part de les xarxes socials ha bloquejat la majoria de debats públics sobre aquesta ciència dolenta i falsa. La censura és l'eina de l'indefendable, ja que la ciència vàlida es defensa de manera inherent. Fins que el públic no comenci a entendre la diferència entre plausibilitat i ciència i el gran esforç que ha estat l'esforç per produir en massa un "producte" científic que s'assembla a ciència però no ho és, el procés continuarà i els líders que busquen poder autoritari continuaran confiant-hi. per una justificació falsa.
referències
Alexander, PE (2021 de desembre de 20). Més de 150 estudis comparatius i articles sobre la ineficàcia i els danys de la màscara. Institut Brownstone. https://brownstone.org/articles/more-than-150-comparative-studies-and-articles-on-mask-ineffectiveness-and-harms/
Alexander, PE (2022, 3 de juny). CDC es nega a publicar la correcció al seu estudi de màscara. Institut Brownstone. https://brownstone.org/articles/cdc-refuses-to-post-the-fix-to-its-mask-study/
Anglemyer, A., Horvath, HT, Bero, L. (2014). Resultats sanitaris avaluats amb dissenys d'estudis observacionals en comparació amb els avaluats en assaigs aleatoris (Revisió). Base de dades Cochrane de revisions sistemàtiques, 4, article MR000034. https://doi.org/10.1002/14651858.MR000034.pub2
Bae, J.-M. (2016). Un suggeriment per a l'avaluació de la qualitat en les revisions sistemàtiques d'estudis observacionals en epidemiologia nutricional. Epidemiologia i Salut, 38, article e2016014. https://doi.org/10.4178/epih.e2016014
Berger, MA (2011). L'admissibilitat del testimoni pericial. Al National Research Council, Comitè per al desenvolupament de la tercera edició del Manual de referència sobre l'evidència científica, Manual de referència sobre evidència científica, Tercera edició (pàgs. 11-36). Premsa de les Acadèmies Nacionals. https://nap.nationalacademies.org/catalog/13163/reference-manual-on-scientific-evidence-third-edition
Burns, E. (2022, 10 de novembre). Un altre dia, un altre terrible estudi de màscares. Mirem sota el capó de la nova peça de ciència de baixa qualitat sobre màscares. Subpila. https://emilyburns.substack.com/p/another-day-another-terrible-mask
Centres de serveis de Medicare i Medicaid. (juny de 2022). Cerca Pagaments oberts. Departament de Salut i Serveis Humans dels EUA, Centres de Serveis de Medicare i Medicaid. https://openpaymentsdata.cms.gov/
Christensen, J. (2020, 16 de juliol). La hidroxicloroquina tampoc ajuda els pacients amb Covid-19 que no estan hospitalitzats, segons un nou estudi. CNN Salut. https://www.cnn.com/2020/07/16/health/hydroxychloroquine-doesnt-work-hospitalized-patients/
Collins, R., Bowman, L., Landray, M. i Peto, R. (2020). La màgia de l'aleatorització versus el mite de l'evidència del món real. New England Journal of Medicine, 382 (7), 674-678. https://www.nejm.org/doi/10.1056/NEJMsb1901642
Dangor, G. (2021, 19 de setembre). La regla de distanciament social de sis peus de CDC era "arbitrària", diu l'excomissari de la FDA. Forbes. https://www.forbes.com/sites/graisondangor/2021/09/19/cdcs-six-foot-social-distancing-rule-was-arbitrary-says-former-fda-commissioner/
Deaton, A. i Cartwright, N. (2018). Comprensió i malentès dels assaigs controlats aleatoris. Ciències Socials i Medicina, 210, 2 21-. https://doi.org/10.1016/j.socscimed.2017.12.005
Feynman, RP (1974). Ciència de culte a la càrrega. Enginyeria i Ciència, 37 (7), 10-13. https://resolver.caltech.edu/CaltechES:37.7.CargoCult
Goldberger, J., Waring, CH i Willets, DG (1915). La prevenció de la pel·lagra: una prova de dieta entre els interns institucionals. Informes de salut pública, 30 (43), 3117-3131. https://www.jstor.org/stable/4572932
Hartling, L., Milne, A., Hamm, MP, Vandermeer, B., Ansari, M., Tsertsvadze, A., Dryden, DM (2013). La prova de l'escala d'Ottawa de Newcastle va mostrar una baixa fiabilitat entre els revisors individuals. Journal of Clinical Epidemiology, 66, 982 993-. https://doi.org/10.1016/j.jclinepi.2013.03.003
Hill, AB (1965). Medi ambient i malaltia: associació o causalitat. Actes de la Royal Society of Medicine, 58 (5), 295-300. https://doi.org/10.1177/003591576505800503
Inglesby, TV, Nuzzo, JB, O'Toole, T., Henderson, DA (2006). Mesures de mitigació de malalties en el control de la grip pandèmica. Bioseguretat i bioterrorisme: estratègia, pràctica i ciència de biodefensa, 4(4):366-375. https://doi.org/10.1089/bsp.2006.4.366
Meunier, T. (2020, 1 de maig). Les polítiques de bloqueig total als països d'Europa occidental no tenen impactes evidents sobre l'epidèmia de COVID-19. medRxiv. https://doi.org/10.1101/2020.04.24.20078717
MSNBC. (2021, 9 de juny). Fauci respon als atacs dels republicans [Vídeo]. YouTube. https://www.youtube.com/watch?v=z-tfZr8Iv0s
Biblioteca Nacional de Medicina (2021, maig). ClinicalTrials.gov. Història, polítiques i lleis. Departament de Salut i Serveis Humans dels EUA, Instituts Nacionals de Salut, Biblioteca Nacional de Medicina. https://clinicaltrials.gov/ct2/about-site/history
Park, JJH, Decloedt, EH, Rayner, CR, Cotton, M., Mills, EJ (2020). Assajos clínics d'etapes de la malaltia en COVID 19: complicats i sovint malinterpretats. Lancet Global Health, 8(10), e1249-e1250. https://doi.org/10.1016/S2214-109X(20)30365-X
Polack, FP, Thomas, SJ, Kitchin, N., Absalon, J., Gurtman, A., Lockhart, S., Perez, JL, Pérez Marc, G., Moreira, ED, Zerbini, C., Bailey, R. ., Swanson, KA, Roychoudhury, S., Koury, K., Li, P., Kalina, WV, Cooper, D., Frenck, RW, Jr., Hammitt, LL, ..., Gruber, WC (2020). Seguretat i eficàcia de la vacuna d'ARNm BNT162b2 Covid-19. New England Journal of Medicine, 383 (27), 2603-2615. https://www.nejm.org/doi/full/10.1056/nejmoa2034577
Rajasingham, R., Bangdiwala, AS, Nicol, MR, Skipper, CP, Pastick, KA, Axelrod, ML, Pullen, MF, Nascene, AA, Williams, DA, Engen, NW, Okafor, EC, Rini, BI, Mayer , IA, McDonald, EG, Lee, TC, Li P., MacKenzie, LJ, Balko, JM, Dunlop, SJ, …, Lofgren, SM (2021). La hidroxicloroquina com a profilaxi preexposició per a la malaltia del coronavirus 2019 (COVID-19) en treballadors sanitaris: un assaig aleatoritzat. Malalties infeccioses clíniques, 72(11), e835-e843. https://doi.org/10.1093/cid/ciaa1571
Risch, HA (2020). Tractament ambulatori precoç de pacients simptomàtics i d'alt risc amb COVID-19 que s'haurien d'intensificar immediatament com a clau per a la crisi pandèmica. American Journal of Epidemiology, 189 (11), 1218-1226. https://doi.org/10.1093/aje/kwaa093
Risch, HA (2021, 17 de juny). Hidroxicloroquina en el tractament precoç de pacients ambulatoris de COVID-19 d'alt risc: evidència d'eficàcia i seguretat. EarlyCovidCare.org, https://earlycovidcare.org/wp-content/uploads/2021/09/Evidence-Brief-Risch-v6.pdf
Risch, H., Bhattacharya, J., Alexander, PE (2022 de gener de 23). L'emergència s'ha d'acabar, ara. Institut Brownstone. https://brownstone.org/articles/the-emergency-must-be-ended-now/
Sackett, DL, Rosenberg, WMC, Gray, JAM, Haynes, RB i Richardson, WS (1996). Medicina basada en l'evidència: què és i què no. BMJ, 312, article 71. https://doi.org/10.1136/bmj.312.7023.71
Skipper, CP, Pastick, KA, Engen, NW, Bangdiwala, AS, Abassi, M., Lofgren, SM, Williams, DA, Okafor, EC, Pullen, MF, Nicol, MR, Nascene, AA, Hullsiek, KH, Cheng , MP, Luke, D., Lother, SA, MacKenzie, LJ, Drobot, G., Kelly, LE, Schwartz, IS, ..., Boulware, DR (2020). Hidroxicloroquina en adults no hospitalitzats amb COVID-19 precoç: un assaig aleatoritzat. Annals of Internal Medicine, 173 (8), 623-631. https://doi.org/10.7326/M20-4207
Tenforde, MW, Patel, MM, Gaglani, M., Ginde, AA, Douin, DJ, Talbot, HK, Casey, JD, Mohr, NM, Zepeski, A., McNeal, T., Ghamande, S., Gibbs, KW, Files, DC, Hager, DN, Shehu, A., Prekker, ME, Erickson, HL, Gong, MN, Mohamed, A., …, Self, WH (2022). Morbidity and Mortality Weekly Report, 71(4), 118-124. https://www.cdc.gov/mmwr/volumes/71/wr/mm7104a2.htm
Tigas, M., Jones, RG, Ornstein, C. i Groeger, L. (2019, 17 d'octubre). Dòlars per a Docs. Com van arribar els dòlars de la indústria als vostres metges. ProPublica. https://projects.propublica.org/docdollars/
Wacholder, S. (1986). Regressió binomial en GLIM: estimació de ràtios de risc i diferències de risc. American Journal of Epidemiology, 123 (1), 174-184. https://doi.org/10.1093/oxfordjournals.aje.a114212
Whelan, R. (2020, 3 d'agost). 2020-08-03 - CNN COVID amb entrevista Harvey Risch, epidemiòleg de Yale [Vídeo]. YouTube. https://www.youtube.com/watch?v=gGO6Ke81bUQ
Monòmetre. (2022, 15 de novembre). Total de casos de coronavirus a Austràlia. Monòmetre. https://www.worldometers.info/coronavirus/country/australia/
-
Harvey Risch, acadèmic sènior de l'Institut Brownstone, és metge i professor emèrit d'epidemiologia a la Yale School of Public Health i a la Yale School of Medicine. Els seus principals interessos de recerca són l'etiologia del càncer, la prevenció i el diagnòstic precoç, i els mètodes epidemiològics.
Veure totes les publicacions