Publicación Científica biomedica [1 ed.] 9788480864619

379 57 3MB

Spanish Pages 394 Year 2010

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Microbiologia Biomedica

439 97 115MB Read more

Manual De Redaccion Cientifica

817 95 6MB Read more

La Logica De La Investigacion Cientifica

603 105 24MB Read more

Difusion Y Divulgacion Cientifica En Internet

309 106 4MB Read more

Metodos de investigacion cientifica y epidemiologica

booksmedicos.org

1,352 47 4MB Read more

El Arte De La Investigacion Cientifica

585 167 734KB Read more

Manual De Metodologia De La Investigacion Cientifica

910 169 2MB Read more

El Capitalismo Y La Economia Cientifica

503 77 992KB Read more

Nuevos Fundamentos En La Investigacion Cientifica

862 122 1MB Read more

Manual De MVU - Software Libre para Publicacion Web

377 122 3MB Read more

Publicación Científica biomedica [1 ed.]
9788480864619

Author / Uploaded
J. Jiménez Villa
J.M Argimnon Pallas
A. Martin Zurro
M. Vilardell Tarrés

Categories
Medicine
Epidemiology

Commentary
KDUR

Table of contents :
COVER
Página xii
1- La Literatura cientifica biomedica
2 Preparativos para la redadción de un manuscrito
...........

Citation preview

1 6 # - * $ " $ * Î / $ * & / 5 Ê ' * $ " #*0.c%*$" $ w N P F T D S J C J S Z Q V C M J D B S VOBSUrDVMPEFJOWFTUJHBDJwO

++JNnOF[7JMMB +."SHJNPO1BMMhT ".BSUrO;VSSP .7JMBSEFMM5BSSnT

© 2010 Elsevier España, S.L. Travessera de Gràcia, 17-21 – 08021 Barcelona, España Fotocopiar es un delito (Art. 270 C.P.) Para que existan libros es necesario el trabajo de un importante colectivo (autores, traductores, dibujantes, correctores, impresores, editores...). El principal beneficiario de ese esfuerzo es el lector que aprovecha su contenido. Quien fotocopia un libro, en las circunstancias previstas por la ley, delinque y contribuye a la «no» existencia de nuevas ediciones. Además, a corto plazo, encarece el precio de las ya existentes. Este libro está legalmente protegido por los derechos de propiedad intelectual. Cualquier uso fuera de los límites establecidos por la legislación vigente, sin el consentimiento del editor, es ilegal. Esto se aplica en particular a la reproducción, fotocopia, traducción, grabación o cualquier otro sistema de recuperación de almacenaje de información. ISBN: 978-84-8086-461-9 Depósito Legal: NA. 661 - 2010 Composición y compaginación: Fotocomposición A. Parras Impreso en España por GraphyCems Imágenes de cubierta: © iStockphoto: Zianlob / Yvan Dubé / RPhotos

Advertencia La medicina es un área en constante evolución. Aunque deben seguirse unas precauciones de seguridad estándar, a medida que aumenten nuestros conocimientos gracias a la investigación básica y clínica habrá que introducir cambios en los tratamientos y en los fármacos. En consecuencia, se recomienda a los lectores que analicen los últimos datos aportados por los fabricantes sobre cada fármaco para comprobar la dosis recomendada, la vía y duración de la administración y las contraindicaciones. Es responsabilidad ineludible del médico determinar las dosis y el tratamiento más indicado para cada paciente, en función de su experiencia y del conocimiento de cada caso concreto. Ni los editores ni los directores asumen responsabilidad alguna por los daños que pudieran generarse a personas o propiedades como consecuencia del contenido de esta obra. El editor

"VUPSFT María Francisca Abad García Coordinadora del proyecto RODERIC Departamento de Historia de la Ciencia y Documentación Facultad de Medicina de Valencia Valencia

Rafael Aleixandre Benavent Científico Titular del CSIC Instituto de Historia de la Ciencia y Documentación López Piñero Consejo Superior de Investigaciones Científicas Valencia

Facultad de Medicina Universitat Internacional de Catalunya

Douglas G. Altman Director Centre for Statistics in Medicine Oxford Reino Unido

Josep M. Argimon Pallàs

Grupo de Investigación en Servicios Sanitarios Institut Municipal d’Investigació Mèdica (IMIM-Hospital del Mar) CIBER en Epidemiología y Salud Pública (CIBERESP), España

Doctor en Medicina y Cirugía Universitat Autònoma de Barcelona Especialista en Medicina Preventiva y Salud Pública Master of Science en Atención Sanitaria Basada en la Evidencia Universidad de Oxford Master en Epidemilogía y Planificación Sanitaria Universidad del País de Gales Servei Català de Salut Barcelona

Pablo Alonso Coello

Xavier Bonfill Cosp

Médico Especialista en Medicina de Familia y Comunitaria Investigador Centro Cochrane Iberoamericano Hospital de la Santa Creu i Sant Pau CIBER de Epidemiología y Salud Pública (CIBERESP) Profesor Colaborador

Centro Cochrane Iberoamericano Servei d’Epidemiologia Clínica i Salut Pública Hospital de la Santa Creu i Sant Pau Universitat Autònoma de Barcelona CIBER en Epidemiología Clínica y Salud Pública (CIBERESP), Barcelona

Jordi Alonso Caballero

9

Xavier Bosch Aparici

Jordi Cortés Martínez

Consultor Servicio de Medicina Interna Hospital Clínic Profesor Asociado de Medicina Universitat de Barcelona Barcelona

Investigador Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya (UPC) Barcelona

Esteve Fernández Muñoz Marion K. Campbell Director Health Services Research Unit University of Aberdeen Reino Unido

Francesc Cardellach López Catedrático de Medicina Facultad de Medicina Universitat de Barcelona Consultor Sénior Servicio de Medicina Interna Hospital Clínic Secretario General de Medicina Clínica Barcelona

Genís Carrasco Gómez Coordinador de Calidad Hospital de Barcelona Barcelona Editor de Revista de Calidad Asistencial

Unidad de Investigación y Control del Tabaquismo Institut Català d’Oncologia-IDIBELL Departamento de Ciencias Clínicas Campus de Bellvitge Facultad de Medicina Universitat de Barcelona Director de Gaceta Sanitaria

Francisco García Río Servicio de Neumología Hospital Universitario La Paz Universidad Autónoma de Madrid

Javier P. Gisbert Profesor Asociado Universidad Autónoma de Madrid Médico Adjunto Servicio de Aparato Digestivo Hospital Universitario de la Princesa Madrid Centro de Investigación Biomédica en Red de Enfermedades Hepáticas y Digestivas (CIBEREHD)

Erik Cobo Valeri Profesor Titular Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya (UPC) Barcelona

José Antonio González Alastrué Profesor Titular Departament d’Estadística i Investigació Operativa Universitat Politècnica de Catalunya (UPC) Barcelona

Albert Cobos Carbó Profesor de Bioestadística Departament de Salut Pública Facultad de Medicina Universitat de Barcelona Barcelona

Carlos González Guitián Servizo Galego de Saúde (SERGAS) Coordinador de la Biblioteca Virtual del Sistema Sanitario Público de Galicia Hospital Universitario A Coruña

9*

John Hoey Professor of Medicine Queen’s University Kingston, Ontario Canadá

Josep Jiménez Villa Doctor en Medicina y Cirugía Universitat de Barcelona Profesor Asociado Universitat Autònoma de Barcelona Secretario de Redacción de Atención Primaria División de Evaluación de Servicios Servei Català de Salut Barcelona

Presidente del Patronato del Instituto de Investigación en Atención Primaria (IDIAP Jordi Gol) Codirector del Plan de Innovación de Atención Primaria y Salud Comunitaria del Departamento de Salud de la Generalitat de Catalunya

Luis Martínez Martínez Jefe de Servicio Servicio de Microbiología Hospital Universitario Marqués de Valdecilla Santander

Ana Marušic´ Lluís Jover Armengol Profesor Titular Universitat de Barcelona Departament de Salut Pública Barcelona

Susana Lorenzo Martínez Jefe de Unidad de Análisis de la Información y Calidad Hospital Universitario Fundación Alcorcón Alcorcón, Madrid

Editora Jefe de Croatian Medical Journal

David Moher Scientific Director Chalmers Research Group, Children’s Hospital of Eastern Ontario Research Institute Department of Epidemiology and Community Medicine University of Ottawa Ontario Canadá

Álvaro Pascual Hernández Amando Martín Zurro Doctor en Medicina Especialista en Medicina Familiar y Comunitaria y Medicina Interna Director de la Cátedra de Docencia e Investigación en Medicina de Familia (Universitat Autònoma de Barcelona, 2001-2007) Editor de Atención Primaria Director del Programa FMC Coordinador General del Programa de Medicina Familiar y Comunitaria de Catalunya (1995-2008) Presidente del Organismo de Coordinación Estatal del Programa de Actividades Preventivas y de Promoción de la Salud (PAPPS-semFYC)

Director de la Unidad de Microbiología Clínica Hospital Universitario Virgen Macarena Catedrático de Microbiología Departamento de Microbiología Facultad de Medicina Sevilla

Josep M. Piqué Badia Consultor Sénior Servicio de Gastroenterología Institut de Malalties Digestives Hospital Clínic Centro de Investigación Biomédica en Red de Enfermedades Hepáticas y Digestivas (CIBEREHD) Barcelona

9**

Marta Pulido Mestre Editora médica independiente Asesora en Edición y Publicaciones Biomédicas, Servicios Científicotécnicos, Institut Municipal d’Investigació Médica (IMIMHospital del Mar) Barcelona

Josep M. Ribera Santasusana Profesor Titular de Medicina Facultad de Medicina Universitat Autònoma de Barcelona Jefe del Servicio de Hematología Clínica Institut Català d’Oncologia Hospital Universitari Germans Trias i Pujol Badalona Secretario General de Medicina Clínica Barcelona

Centre for Statistics in Medicine Oxford Reino Unido

Ivan Solà Arnau Investigador Coordinador del Área de Documentación Centro Cochrane Iberoamericano Hospital de la Santa Creu i Sant Pau Barcelona

Gerard Urrútia Cuchi Centro Cochrane Iberoamericano Servei d’Epidemiologia Clínica i Salut Pública Hospital de la Santa Creu i Sant Pau CIBER de Epidemiología Clínica y Salud Pública (CIBERESP) Barcelona

David Rigau Comas Médico Especialista en Farmacología Clínica Investigador Centro Cochrane Iberoamericano Hospital de la Santa Creu i Sant Pau Barcelona

Kenneth F. Schulz Vice President of Quantitative Sciences Family Health International, Durham UNC School of Medicine, Chapel Hill North Carolina Estados Unidos

Iveta Simera Senior Project Manager (EQUATOR Network)

José M. Valderas Martínez National Primary Care Research and Development Centre y NIHR School for Primary Care Research Williamson Building University of Manchester Manchester Reino Unido CIBER de Epidemiología y Salud Pública (CIBERESP), España

Miquel Vilardell Tarrés Catedrático de Medicina Universitat Autònoma de Barcelona Jefe de Servicio de Medicina Interna Hospital Universitari Vall d’Hebron Barcelona

1" 35 & 1SFGBDJP La adecuada difusión de los resultados de las investigaciones científicas es imprescindible tanto para el progreso de la medicina como para la mejora de la atención a los pacientes. Actualmente, el mecanismo más importante para transmitir esta información es la publicación de las investigaciones en forma de artículos científicos en revistas biomédicas. A pesar de la indudable importancia de las publicaciones científicas en la difusión y desarrollo de la medicina, e incluso en la promoción profesional, no existe un texto de referencia en lengua castellana sobre el tema. De aquí surgió la idea de elaborar un libro en español que recogiera en un único volumen los principales aspectos relacionados con la publicación de un artículo científico, desde los preparativos para la redacción de un manuscrito hasta su publicación y difusión. El libro se ha concebido en 3 partes. La primera de ellas está dedicada a la elaboración del manuscrito. Aparte de explicar la estructura ya clásica de un artículo y las bases del estilo científico, teniendo en cuenta que el análisis estadístico y la presentación de resultados están adquiriendo una importancia creciente, hemos creído oportuno reconocer su relevancia dedicándoles dos capítulos. Por otro lado, cada vez es más evidente que el inglés se está convirtiendo en la lengua franca de la ciencia, y es necesario que los investigadores cuya lengua materna es el español conozcan las claves para escribir en inglés e interactuar con los traductores para conseguir una más amplia y clara difusión de su mensaje. En los últimos años han ido apareciendo diversas iniciativas encaminadas a mejorar el contenido de las publicaciones y asegurar que los lectores puedan evaluarlas críticamente y aplicar adecuadamente sus resultados. La segunda parte del libro presenta las directrices sobre la información que deben contener los artículos en función de los estudios que presentan, desde un ensayo clínico aleatorio a una revisión sistemática. Precisamente, un ejemplo del dinamismo de las iniciativas en este campo es que, mientras se elaboraba este libro, la directriz dedicada a las revisiones sistemáticas, conocida como QUOROM,

9*7

estaba siendo revisada y, durante la fase de producción, ha sido publicada la nueva versión, denominada ahora PRISMA. Para que un artículo se publique, no basta con que sus contenidos sean válidos y su redacción correcta, sino que es necesario escoger la revista adecuada para el mensaje que se desea difundir, cumplir los requisitos internacionalmente reconocidos para el envío de los manuscritos y conocer los entresijos del proceso editorial. La tercera parte del libro se dedica a estos aspectos, e incluye dos capítulos dedicados específicamente a los aspectos éticos relacionados con la autoría, la mala conducta y los conflictos de intereses. Dado el importante desarrollo que está alcanzando la bibliometría y su creciente utilización como método de evaluación de la actividad científica, se ha incluido un capítulo sobre el tema. Como consecuencia del gran desarrollo de las tecnologías de la información y la comunicación, el mundo de las publicaciones está cambiando radicalmente. En la actualidad, prácticamente todas las revistas disponen de una versión electrónica, y en los últimos años está apareciendo un número creciente de publicaciones que sólo se editan en versión digital, a la par que aparecen nuevos formatos de revista que van incorporando las potencialidades que ofrecen las nuevas tecnologías. El último capítulo aborda estos cambios y señala algunas de las nuevas perspectivas. No queremos finalizar esta presentación sin reconocer el trabajo de muchas personas que han dedicado grandes esfuerzos a mejorar la calidad de la publicación médica en España. Entre ellas, queremos hacer mención especial de la Dra. Marta Pulido, pionera en este campo en nuestro país. Como consecuencia del trabajo de todas estas personas, y del de todos los profesionales que se dedican a la investigación, podemos afirmar que las publicaciones médicas españolas gozan de un merecido prestigio. Por último, los editores desean agradecer al Sr. Joan Juan su inestimable ayuda en la concepción del libro y en la definición de parte de sus contenidos. Deseamos que el libro sea útil a todos los lectores. Los editores Barcelona, febrero de 2010

-BMJUFSBUVSBDJFOUrGJDB CJPNnEJDB

© Elsevier. Fotocopiar sin autorización es un delito.

+."SHJNPO ++JNnOF[ ".BSUrO;VSSPZ.7JMBSEFMM

Investigar significa aplicar el método científico para buscar respuestas a las preguntas planteadas. La investigación biomédica es necesaria para el progreso de la medicina, ya que proporciona las pruebas en que basar la práctica clínica y mejorar la calidad de la atención que se presta a los pacientes, obteniendo información sobre la utilidad y eficacia de los procedimientos diagnósticos, terapéuticos y preventivos, así como sobre la etiología, la fisiopatología y los factores de riesgo de las enfermedades y problemas de salud. La investigación supone también un valor añadido tanto para los profesionales (prestigio profesional y social, estímulo intelectual, sentimiento de pertenencia a una élite, etc.) y los pacientes (beneficios derivados de los resultados de las investigaciones, mayor calidad de la atención, aumento de la eficacia de las intervenciones, incremento de la supervivencia y la calidad de vida, etc.), como para la comunidad y el propio sistema sanitario, al mejorar la situación de salud de la población y hacer un uso más eficiente de los recursos. Sin embargo, para poder alcanzar estas finalidades, no basta haber realizado un estudio con el rigor metodológico suficiente, sino que además sus resultados deben ser adecuadamente comunicados. Una investigación no puede considerarse finalizada hasta que no se hayan difundido sus resultados entre la comunidad científica, por lo que la publicación no debe entenderse como un subproducto del trabajo que se está haciendo, sino como el producto final de la actividad científica. Actualmente, la publicación de artículos científicos en las revistas biomédicas es el principal mecanismo que usan los investigadores para dar a conocer a la comunidad científica los estudios que realizan y, por ello, es el medio más importante de difusión de los nuevos progresos de la medicina y de actualización de conocimientos de los profesionales.

"16/5&4)*45Î3*$04 Actualmente, publicar los resultados de una investigación en una revista y leer los informes de los estudios realizados por otros son actividades habituales de

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

cualquier científico. Sin embargo, en realidad son prácticas relativamente recientes. Puede considerarse que la historia de la publicación científica empieza en el Renacimiento, cuando la invención de la imprenta permitió la impresión y la publicación de libros. En aquella época, los científicos publicaban su trabajo en latín, que era la lingua franca. La historia de la publicación de las revistas médicas se inicia en la segunda mitad del siglo XVII, cuando diversos factores como la fundación de nuevas universidades, la aparición de sociedades científicas médicas, la difusión de los descubrimientos en publicaciones periódicas y el cambio del latín por las lenguas vernáculas contribuyeron al progreso de la medicina y facilitaron la difusión del conocimiento médico1,2. Así, fue en el año 1665 cuando aparecieron las primeras revistas científicas, la francesa Journal des Sçavans y la británica Philosophical Transactions of the Royal Society, que publicaban los debates que se producían en el seno de las primeras sociedades científicas. Antes de su aparición, la comunicación científica se realizaba principalmente por medio de la correspondencia privada. El libro no era adecuado para difundir los resultados de los nuevos experimentos u observaciones porque era necesario esperar a tener un volumen de resultados suficiente para justificar su elaboración, por lo que muchos descubrimientos se publicaban en forma de folletos o panfletos. Por ejemplo, los descubrimientos de William Harvey sobre la circulación de la sangre se publicaron en 1628 en forma de un folleto de 72 páginas1. A diferencia de las revistas científicas modernas, aquellas primeras publicaciones incluían muchas noticias e informaciones de diverso tipo, pero no solían contener muchos artículos con la descripción de experimentos originales. El cambio se produce cuando aparecen revistas especializadas en áreas científicas concretas, como la física, la química, la biología, la agricultura y, obviamente, la medicina. Así, la primera revista médica general que se conoce es Nouvelles découvertes sur toutes les parties de la médecine, publicada en París de 1679 a 1681 en francés. En Inglaterra, la primera revista dedicada exclusivamente a la medicina fue Medicina Curiosa, que apareció en 1684 y que, a pesar su título en latín, se publicaba en inglés. A finales del siglo XVIII, las revistas ya habían reemplazado a los libros como vehículo de publicación de los trabajos originales, aunque inicialmente los médicos preferían publicar sus resultados y observaciones en revistas científicas generales, de forma que hasta principios del siglo XIX no se establecieron las revistas biomédicas de alta calidad de forma permanente. Algunas de las publicaciones actuales más prestigiosas tienen sus orígenes en aquellos años. Así, The New England Journal of Medicine (NEJM) se inicia en 1812, The Lancet en 1823 y British Medical Journal (BMJ) en 1857, cuando se crea la British Medical Association, aunque tenía predecesores con diferentes nombres desde 1828 (Midland Medical and Surgical Reporter). En España, las revistas científicas aparecieron más tarde que en otros países europeos. En 1736 aparece Varias disertaciones médicas, theórico-prácticas, anatómico-chirurgicas y chymicopharmacéuticas, enunciadas y públicamente defendidas en la Real Sociedad de Sevilla, que en 1766 dio origen a la revista Memorias

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ "

académicas de la Real Sociedad de Medicina y demás ciencias de Sevilla. Aunque la edición científica española siguió una línea ascendente hasta 1809, volvió a decaer durante buena parte del siglo XIX, y no es hasta el último tercio del mismo en que se recupera parcialmente. Durante el siglo XX se produjo una gran expansión hacia las revistas dedicadas a una especialidad, y posteriormente a una subespecialidad. A partir de la década de 1950, el aumento del número de revistas se hizo exponencial, especialmente en Estados Unidos. El aumento de la preponderancia de la literatura médica americana tuvo, como efecto adicional, que el inglés se convirtiera en el principal idioma de la publicación médica. Desde entonces, el número de revistas y publicaciones ha seguido creciendo exponencialmente, y hoy en día se estima que se publican más de 20.000 revistas médicas y más de 2 millones anuales de artículos. Esto ha obligado a desarrollar sistemas para la indexación de los artículos y para facilitar su localización, en forma de bibliotecas y bases de datos, y más recientemente otros servicios de síntesis y sinopsis de los resultados de las investigaciones para facilitar su incorporación al proceso de toma de decisiones en la práctica clínica (fig. 1-1). El valor de un artículo no reside solamente en su contenido, sino que es importante que el mensaje llegue al lector de forma nítida y completa. Los primeros artículos se publicaron en un formato que hoy denominaríamos des-

Impacto en la práctica clínica Investigación INVESTIGADORES

Elaboración del manuscrito AUTORES

Síntesis y sinopsis REVISIONES SISTEMÁTICAS REVISTAS SECUNDARIAS

Selección de artículos (peer review) EDITORES ASESORES

Utilización

© Elsevier. Fotocopiar sin autorización es un delito.

LECTORES

Archivo e indexación BASES DE DATOS BIBLIOTECAS Publicación y difusión EMPRESA EDITORIAL

Figura 1-1. El ciclo de la publicación científica.

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

criptivo, presentando los hechos en una secuencia simplemente cronológica, que todavía se utiliza en la actualidad, por ejemplo, en algunas cartas al director. En la segunda mitad del siglo XIX, la ciencia desarrolló métodos cada vez más sofisticados, de manera que la metodología adquirió una importancia creciente. La descripción detallada de los experimentos permitió que pudieran ser replicados por otros investigadores, de manera que el principio de reproducibilidad de los experimentos se convirtió en un aspecto fundamental para el progreso de la ciencia. Esta descripción de los métodos empezó a realizarse en una sección específica de los artículos, lo que supuso el embrión del formato más estructurado que utilizamos actualmente, conocido por el acrónimo IMRD (Introducción, Métodos, Resultados, Discusión). Este formato fue adoptado por la mayor parte de las revistas ya en la segunda mitad del siglo XX, a medida que el volumen creciente de artículos aumentó la presión sobre las revistas, ya que, por su simplicidad y lógica, ayudaba a los autores a organizar y redactar sus trabajos, a los editores y sus asesores a evaluarlos, y a los lectores a leerlos3. En 1978, un grupo de directores de algunas de las revistas biomédicas más importantes publicadas en inglés se reunieron en Vancouver para uniformar los requisitos técnicos para los manuscritos que debían ser enviados a sus revistas. Estos requisitos, incluidos los modelos para las referencias bibliográficas desarrollados por la National Library of Medicine, fueron publicados a principios de 1979. El grupo de Vancouver acabó convirtiéndose en el Comité Internacional de Editores de Revistas Médicas (International Committee of Medical Journal Editors, ICMJE). A través de los años, el grupo ha ido revisando estos requisitos y actualmente la mayor parte de las revistas biomédicas los han adoptado. En 1993, un grupo de expertos se reunieron en Ottawa con la finalidad de desarrollar una escala para la evaluación de las publicaciones de los ensayos clínicos aleatorizados (ECA), pero, tras constatar la dificultad de la tarea dado que muchos de los elementos relevantes no eran comunicados habitualmente por los autores, decidieron elaborar unas recomendaciones para mejorar la publicación de los ECA, que fueron denominadas SORT (Standardized Reporting of Trials). Simultáneamente, otro grupo de expertos (Asilomar Working Group on Recommendations for Reporting of Clinical Trials in the Biomedical Literature), reunido en California, elaboró una lista de recomendaciones con una finalidad similar. En 1996 se reunieron en Chicago representantes de ambos grupos para elaborar unas recomendaciones comunes que recogieran los mejores elementos de cada una de las listas anteriores, y así apareció la declaración CONSORT (Consolidated Standards of Reporting Trials), publicada ese mismo año, una versión revisada de la cual fue publicada en 2001. Paralelamente, se han elaborado directrices para la publicación de otros tipos de estudios. Todas estas iniciativas tienen como finalidad mejorar la calidad de las publicaciones de artículos originales y asegurar que contienen la información necesaria para permitir su adecuada evaluación crítica. En la página web de la iniciativa EQUATOR (www.equator-network.org) pueden encontrarse estas recomendaciones, así como otros muchos recursos útiles relacionados con las publicaciones científicas.

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ "

© Elsevier. Fotocopiar sin autorización es un delito.

&-1"1&-%&-"43&7*45"4.c%*$"4 Los investigadores necesitan difundir y comunicar los resultados de los estudios que realizan, mientras que los profesionales sanitarios necesitan conocer los resultados de las nuevas investigaciones para estar al día y mantener actualizados sus conocimientos. Ambos intereses coinciden en las revistas biomédicas, de manera que éstas se han convertido en la principal fuente de información utilizada por los médicos posgraduados y el principal medio de comunicación de los resultados de las investigaciones. Sin embargo, algunos estudios han demostrado que los resultados de las investigaciones no se traducen, en la práctica clínica, de la forma más adecuada y con la suficiente rapidez. En un estudio ya clásico, Antman et al.4 demostraron que pueden transcurrir largos períodos de tiempo desde que se han publicado pruebas suficientes de la eficacia de una intervención hasta que ésta es utilizada de forma habitual en la práctica clínica, como ocurrió en el caso del tratamiento trombolítico en el infarto agudo de miocardio, en que este período de tiempo superó ampliamente los 10 años. Los motivos que explican esta demora son complejos, y van desde la variabilidad en la calidad de las investigaciones y las dificultades de los profesionales para evaluarlas, hasta la incapacidad para presentar la información relevante para la toma de decisiones que necesitan los profesionales en una forma adecuada y en el momento preciso. También observaron que algunos tratamientos, como ocurrió con la lidocaína, eran ampliamente utilizados, a pesar incluso de que los estudios que se habían publicado no hubieran demostrado que aportaran beneficios clínicos. Dado que las revistas son el principal puente entre medicina y ciencia, deberían publicar solamente estudios bien diseñados y ejecutados. Aunque es cierto que éstas han publicado algunos de los estudios que han contribuido decisivamente al progreso de la medicina, también lo es que no todo lo que se publica es oro. Precisamente, el procedimiento de revisión por pares (peer review) se desarrolló con la finalidad principal de evitar la publicación de estudios de baja calidad científica. Aunque se considera prácticamente un requisito imprescindible de una revista científica, este procedimiento cuenta con importantes debilidades y no siempre es capaz de garantizar la calidad científica de los estudios que se publican. De hecho, el sistema actual de difusión de los resultados de la investigación médica ha sido ampliamente criticado por la escasez de pruebas sobre su eficacia, e incluso algunos autores consideran que proporciona una visión distorsionada de la realidad de los datos científicos5. En un interesante estudio, Ioannidis6 observó que, de 49 estudios de investigación clínica publicados en revistas de elevado facor de impacto entre 1990 y 2003 y que habían recibido más de 1.000 citas, 7 (16%) habían sido refutados por estudios posteriores de mayor tamaño y/o mejor diseño, y otros 7 (16%) habían encontrado efectos de mayor magnitud que los estudios posteriores. Aunque estos problemas fueron más frecuentes en los estudios no experimentales, también se presentaron en relación con los ECA, especialmente con los de pequeño tamaño. En general, el papel de las revistas va más allá que la simple difusión de unos resultados científicos, y suelen tener una finalidad tanto informativa como formativa, contribuyendo a crear opinión y proporcionando un foro de debate para

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

la comunidad médica y científica. Para cumplir con estas finalidades, las revistas no solamente publican artículos originales, sino también revisiones que actualizan los conocimientos y los nuevos desarrollos, material educativo, noticias, cartas, etc., que en muchas ocasiones son incluso más leídos y consultados por los lectores que los propios originales. Además, las revistas han ido incorporando algunos elementos para hacer los artículos originales más fácilmente comprensibles para los lectores, dotándolos de una estructura concreta, incluyendo cuadros que facilitan la comprensión de los aspectos clave del estudio o que llaman la atención sobre las nuevas aportaciones que supone, etc. Además, de cara a hacer más atractiva la lectura, muchas revistas también incorporan elementos más periodísticos, como frases destacadas insertadas en el texto, secciones que resumen lo más destacado del número de la revista (como la de Medicina Clínica en breve), sistemas de alerta a través de correo electrónico, comunicados de prensa para que los medios de comunicación puedan difundir algunos de los hallazgos que van a publicarse, etc. Así pues, en las revistas confluyen medicina, ciencia y periodismo, y en ocasiones los valores de cada una de ellas pueden entrar en conflicto. Si prima el aspecto periodístico, se corre el riesgo de publicar estudios sin el rigor científico suficiente, simplemente porque se han obtenido unos resultados llamativos. Por el contrario, si se priorizan en exceso los aspectos científicos, pueden publicarse artículos que contienen una gran cantidad de información metodológica y estadística excesivamente detallada e incomprensible para la mayoría de lectores. De hecho, uno de los aspectos que distinguen las revistas médicas del resto de publicaciones científicas es que son leídas mayoritariamente por profesionales asistenciales, que no necesariamente se dedican a la investigación, y que, por tanto, desconocen buena parte de los métodos y la terminología científica.

6404%&-"-*5&3"563"$*&/5Ê'*$" La literatura biomédica se ha convertido en el principal mecanismo de formación continuada y de actualización de conocimientos de los profesionales sanitarios. Este hecho se ha visto reflejado en un incremento progresivo del número de revistas, que ha sido exponencial desde finales del siglo pasado, duplicándose cada 19 años de promedio. Pero el gran volumen que ha alcanzado la literatura circulante hace imposible que un profesional pueda estar al tanto de todo lo que se publica que pueda ser de su interés. Los profesionales sanitarios pueden utilizar la literatura científica simplemente para estar al día, como ayuda en la toma de decisiones ante una situación clínica concreta, o bien para revisar el estado de los conocimientos sobre un determinado tema.

7*(*-"/$*"0&45"3"-%Ê" Muchas veces, más que para leer minuciosamente un artículo concreto, un profesional simplemente trata de explorar un número determinado de revis-

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ "

tas (habitualmente, aquellas a las que está suscrito, de las que recibe el sumario por correo electrónico, o que llegan a su centro de trabajo) con la finalidad de estar al día de los desarrollos en algún campo concreto de las ciencias de la salud. A menudo, con este método únicamente se busca seleccionar algunos artículos que se pretende leer y valorar más detalladamente con posterioridad. Para ello, lo primero que suele hacerse es revisar el sumario, buscando en especial los artículos originales y de revisión que parezcan potencialmente interesantes o con una posible utilidad para la propia práctica. A continuación, se revisan los artículos seleccionados, valorando si son adecuados metodológicamente y realmente relevantes para la propia práctica clínica. Lo principal es decidir qué revistas se van a revisar regularmente. No se trata de limitarse a las revistas más importantes de una especialidad determinada, sino que es conveniente hojear también con regularidad revistas médicas generales de elevada circulación, ya que en ellas suelen publicarse los principales adelantos médicos, independientemente del ámbito del estudio, ya que sus autores buscan una mayor difusión del hallazgo. Dado que el enorme volumen de artículos que se publica actualmente hace muy difícil esta vigilancia, en los últimos años ha proliferado, al amparo del paradigma científico conocido como medicina basada en la evidencia (MBE), un nuevo tipo de revistas, denominadas secundarias, que seleccionan artículos publicados en revistas médicas primarias y los presentan en un formato de resumen estructurado, seguido de un comentario crítico, realizando un análisis de las posibles limitaciones metodológicas, la importancia clínica de los resultados y la posible aplicación a la práctica cotidiana. Esta selección de artículos se realiza aplicando un doble filtro metodológico (validez científica del estudio) y clínico (relevancia clínica de los resultados), de manera que menos del 2% de la literatura médica aparece en forma de resúmenes estructurados7. Estas revistas son, por tanto, de gran ayuda para los profesionales en su tarea de estar al día. Ejemplos conocidos de este tipo de revistas son ACP Journal Club y Evidence-Based Medicine, o el recurso de Internet Bandolier y su versión española Bandolera.

© Elsevier. Fotocopiar sin autorización es un delito.

3&40-6$*Î/%&13&(6/5"4$-Ê/*$"4 Si bien es útil la vigilancia que se consigue con la exploración con regularidad de un número determinado de revistas médicas buscando artículos de relevancia clínica y rigor científico, no basta para satisfacer las necesidades de información de un profesional sanitario en su práctica. En primer lugar, porque la vigilancia cubre un amplio espectro de temas, incluso aunque se trate de un ámbito especializado, por lo que no siempre puede hacerse con la suficiente profundidad. En segundo lugar, porque no existe una garantía de que se presentará un paciente con los problemas cubiertos por la vigilancia antes de que se haya olvidado el contenido del artículo. En tercer lugar, porque sería necesario buscar y revisar la información detallada antes de aplicarla en la práctica. Y, en cuarto lugar, porque incluso los mejores estudios publicados en muy

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

pocas ocasiones proporcionarán respuestas definitivas y serán lo suficientemente extensos para manejarse en una situación clínica determinada. Por ello, una parte del tiempo que se dedica a la lectura debe emplearse en un enfoque diferente: la búsqueda de respuestas a los problemas, tal como éstos se presentan en la práctica. En este enfoque se basa la MBE, término acuñado en la década de los años ochenta en la Facultad de Medicina de la Universidad McMaster en Canadá para denominar el proceso sistemático de búsqueda, evaluación y uso de los hallazgos de la investigación biomédica como base esencial para la toma de decisiones en la práctica clínica. Surgió, pues, como un medio para que los médicos afrontasen mejor los retos de la medicina actual, tales como la existencia de un ingente volumen de información científica en evolución continua, la exigencia de ofrecer la máxima calidad asistencial a sus pacientes y la limitación de recursos destinados a la atención sanitaria. La MBE puede aplicarse a cualquier tipo de situación en la práctica clínica, ya se trate de una intervención diagnóstica, terapéutica o preventiva, y consiste en: a) formular una pregunta concreta a partir del problema clínico objeto del análisis; b) realizar una búsqueda sistemática de la evidencia disponible en la literatura para identificar los trabajos relevantes; c) evaluar la evidencia científica analizando críticamente la validez y utilidad de los resultados descritos en dichos trabajos, y d) poner en práctica los hallazgos obtenidos8. La principal fuente de información son las revistas biomédicas, pero ésta suele ser calidad heterogénea y a menudo con errores metodológicos o de presentación que comprometen su interpretación. Por ello es fundamental la lectura crítica de un artículo, que implica la evaluación de la validez metodológica del estudio que presenta, la magnitud de sus resultados y su aplicabilidad a unos pacientes y contexto determinados. Así pues, la lectura crítica puede entenderse como la capacidad para verificar la validez y aplicabilidad de las evidencias publicadas con el fin de poder incorporarlas al cuidado de los pacientes y requiere no solamente que los informes de las investigaciones contengan toda la información necesaria, sino también que los profesionales estén capacitados para poder realizarlas adecuadamente, para lo que deben adquirir las destrezas y habilidades necesarias. Se han desarrollado diferentes guías para facilitar la valoración crítica de los diversos artículos según el objetivo del estudio que presentan9. La búsqueda de información biomédica es un aspecto clave de este proceso. En la mayoría de ocasiones, la estrategia más eficiente puede no ser la búsqueda de estudios individuales, sino la utilización de fuentes de información secundarias, que están evolucionando rápidamente al constatar la importancia de analizar, resumir e integrar toda la información disponible como requisito indispensable para su divulgación y aplicación7. Así, las fuentes de información pueden representarse jerárquicamente en una pirámide conocida como «5S» por las iniciales en inglés de los cinco tipos de recursos que la componen (Systems, Summaries, Synopses, Syntheses y Studies)10. En la base de la pirámide se situarían los artículos originales publicados en las revistas científicas (studies). Por encima de ellos se encontrarían las revisiones sistemáticas (syntheses) y, sobre ellas, los resúmenes estructurados y comentarios de estu-

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ "

dios publicados en revistas secundarias (synopses). Estos tres niveles de la pirámide generalmente sólo examinan y dan respuesta a un aspecto concreto de una enfermedad. Los dos niveles superiores ya examinan globalmente diversos aspectos, y corresponden a los libros y manuales basados en la evidencia (summaries) y los sistemas integrados (systems) que enlazan la mejor evidencia disponible con los datos clínicos existentes en los registros médicos informatizados. Cuando se requiere una respuesta rápida a una pregunta clínica, la búsqueda será tanto más eficiente cuanto más evolucionado sea el nivel en que se encuentra la información que se busca.

3&7*4*Î/4*45&.Ç5*$"%&-"&7*%&/$*" Por revisión sistemática (RS) se entiende la síntesis de la mejor evidencia disponible dirigida a responder una pregunta concreta realizada mediante una metodología explícita y rigurosa destinada a identificar, valorar críticamente y sintetizar los estudios más relevantes. Este abordaje suele llevarse a cabo por grupos de trabajo e instituciones, ya que suele requerir la colaboración de gran número de profesionales de diferentes campos de conocimiento. La presencia de las RS en la literatura médica se está incrementando con rapidez, y su utilidad y aceptación dependen en gran medida de la necesidad de sintetizar el gran volumen de información publicada. En este sentido, una iniciativa muy útil es la Colaboración Cochrane, organización internacional sin ánimo de lucro que intenta ayudar a tomar decisiones clínicas y sanitarias bien fundamentadas preparando, actualizando y promoviendo el acceso a revisiones sistemáticas sobre los efectos de la atención sanitaria. Estas revisiones se incluyen junto a otras bases de datos en la Cochrane Library.

© Elsevier. Fotocopiar sin autorización es un delito.

-04"$503&4%&-"$0.6/*$"$*Î/$*&/5Ê'*$" La difusión de los resultados de las investigaciones es indispensable para el progreso de las Ciencias de la Salud. En el proceso de la comunicación científica están implicados cuatro actores (fig. 1-2): los investigadores o autores de los manuscritos, los editores de las revistas, los asesores que revisan los trabajos y los lectores de los artículos que se publican. Los investigadores son responsables de la veracidad y originalidad de la información que presentan. No sólo deben haber diseñado y ejecutado los estudios con el rigor adecuado, sino que además tienen que redactar los informes con honestidad, sin manipular la información ni inventar datos para transmitir la sensación de que su trabajo es mejor de lo que realmente es, y haciendo constar la existencia de cualquier tipo de relación con empresas o instituciones que pudiera suponer un conflicto de intereses y comprometer la interpretación objetiva de los datos. Además, deben redactar los artículos con claridad y de la forma adecuada para que puedan ser evaluados y comprendidos por los lectores a los que van dirigidos, respetando las recomendaciones internacionales para la presentación de manuscritos a las revistas biomédicas.

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

Autores

Editores

Asesores

Lectores

Figura 1-2. Los actores de la comunicación científica.

Actualmente existe una gran presión sobre los investigadores para que publiquen artículos, claramente reflejada en la famosa frase «publicar o perecer» (publish or perish), dado que su prestigio y carrera académica se valoran en gran medida por la cantidad de artículos que firman y por el factor de impacto de las revistas en que los publican. Esto hace que en muchas ocasiones intenten, y a menudo consigan, publicar trabajos de escasa relevancia o que no suponen ninguna novedad en relación con lo ya conocido sobre el tema, simplemente para incrementar el número de sus publicaciones. Además, muchos autores eligen publicar sus trabajos en revistas de elevado prestigio (impacto), incluso aunque dichas revistas sean poco leídas en su propio país o por aquellos para los que serían más útiles los resultados. Así pues, en muchas ocasiones parece existir cierto conflicto entre lo que es mejor para la atención a los pacientes y lo que lo es para la carrera académica de los investigadores. Deberían desarrollarse nuevos métodos de valoración del impacto de la investigación, que tuvieran en cuenta también el impacto social y su repercusión sobre la práctica clínica. Por otro lado, los editores, los directores y el consejo de redacción de una revista deben contribuir a que los autores publiquen artículos de contenido y estilo correctos. La expansión que ha experimentado el número de revistas periódicas para dar cabida al ingente número de publicaciones ha supuesto un enorme esfuerzo para mantener la calidad, preservar la validez científica del texto impreso y proteger el derecho del lector a ser correctamente informado. Hoy en día se considera clave para garantizar la calidad de una revista que los trabajos que se reciben sean sometidos, antes de ser aceptados para su publicación, a un proceso de evaluación por expertos que no formen parte del consejo editorial (peer review). Los objetivos principales de este proceso de revisión por expertos son evitar la publicación de un trabajo de mala calidad científica, no original o que no contenga información relevante para los lectores de la revista, así como mejorar la redacción y presentación de los datos del artículo. Los revisores o asesores son responsables de evaluar el contenido científico del trabajo y sus méritos o defectos intrínsecos de forma imparcial, desde una postura de máxima neutralidad, y de acuerdo con los estándares de calidad reconocidos. Sin embargo,

© Elsevier. Fotocopiar sin autorización es un delito.

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ "

a pesar de los esfuerzos realizados, este procedimiento todavía es insuficiente para asegurar la calidad de todo lo que se publica. Una medida de la vitalidad de una revista es el número de trabajos que recibe, lo que es un reflejo de la popularidad e imagen que tiene entre los autores. Además, cuanto mayor es el número de trabajos que recibe, más selectiva puede ser al decidir cuáles de ellos son aceptados para su publicación. Por otro lado, otro criterio que los autores también tienen en cuenta a la hora de decidir a qué revista enviar su trabajo es la rapidez con que se toma la decisión sobre la aceptación o el rechazo. La finalidad de la comunicación científica en medicina no es simplemente la publicación de un estudio de investigación u otro tipo de artículo, sino la mejora de la atención sanitaria mediante la aplicación en la práctica clínica de los resultados de dichos estudios y de las recomendaciones que de ellos se derivan. El lector debe ser consciente de que no todos los resultados que se publican son válidos, que no todos los resultados válidos son relevantes, y que no todos los resultados válidos y relevantes son aplicables a su propia práctica clínica. Dado que la publicación de un artículo, incluso en las revistas más prestigiosas, no es garantía de la calidad de la investigación de la que informa, una de las habilidades más importantes que debería tener un profesional sanitario es la capacidad para analizar críticamente las contribuciones originales a la literatura médica, evaluando tanto la validez de las conclusiones de los autores como las limitaciones para la aplicación de estos resultados a sus propios pacientes. No se trata de evaluar a los autores, ni de comprobar si el artículo está escrito de forma literaria y hermosamente ilustrado, sino fundamentalmente de valorar los hechos de la investigación, evaluando tanto la validez como la relevancia y aplicabilidad de los artículos. La utilidad e interés de un artículo no están necesariamente correlacionados con el factor de impacto de la revista que lo publica. De hecho, las revistas médicas suelen ser ampliamente leídas por clínicos, la mayor parte de los cuales no suelen publicar trabajos, por lo que una revista con un amplio público puede tener mucho impacto real, ya que sus lectores incorporan los conocimientos a la práctica, pero este hecho no siempre repercute en el factor de impacto bibliométrico. De hecho, a diferencia de los autores, los lectores suelen buscar información que sea rápidamente utilizable y que se presente en una forma más o menos compacta, valorando más los trabajos con formato de revisión que las investigaciones originales.

-"16#-*$"$*Î/&-&$53Î/*$" El crecimiento exponencial de la literatura biomédica ha tenido un nuevo impulso con el desarrollo de las nuevas tecnologías de la información y la comunicación, que no sólo han facilitado enormemente el acceso a las revistas científicas, sino que también han dado paso a las revistas electrónicas y a nuevas formas de diseminación de las investigaciones. Así, en la década de los años noventa, a partir del desarrollo de la World Wide Web (www) y el Hipertext Markup Language (HTML), se inició un proceso acelerado de sustitución del

-BMJUFSBUVSBDJFOUrGJDBCJPNnEJDB

formato impreso por el medio electrónico que ha producido un incremento notable de la difusión del conocimiento, aunque en muchas ocasiones sin una estructura informática diseñada específicamente para este fin, con un impacto diferente en los distintos campos del saber (p. ej., mucho mayor en informática, física o matemáticas que en la biomedicina). Aunque las publicaciones electrónicas son expresión de un fenómeno de continuidad y cambio, mantienen elementos propios de las publicaciones impresas en lo que se refiere a presentación, estructura y organización de la información, y permiten que cumplan con sus funciones de manera más amplia y efectiva. Como comenta Richard Smith11, si se comparan los coches, los teléfonos o los ordenadores actuales con los de hace 20 años, se observan diferencias remarcables. Sin embargo, si comparamos nuestra revista médica favorita con la misma revista 20 años antes, probablemente las diferencias no sean importantes, e incluso a veces puede resultar difícil decir cuál es la antigua y cuál la actual. El tránsito hacia las publicaciones electrónicas, tengan o no como antecedente una publicación impresa, implica no sólo el cambio de portador y lenguaje, sino que las posibilidades que ofrecen las nuevas aplicaciones y la creatividad de sus productores deben conducir a diseñar nuevos productos. Además, se está produciendo otro cambio: la necesidad de responder a la sociedad, que finalmente es quien financia los programas de investigación, acerca de los resultados de los proyectos que se están desarrollando. Cuando la ciencia se hace, comunica y transmite en el ámbito académico y sólo se debe responder frente a los colegas, las formas de comunicación son precisas, normativas y limitadas a las publicaciones especializadas. Pero actualmente se supone que la información producida debe estar disponible para que la sociedad esté informada, lo que implica un cambio profundo frente a lo que estábamos acostumbrados. Estos cambios en la percepción y en la forma de hacer ciencia influyen profundamente en cómo se comunican los resultados, transformando la tradicional cadena lineal de comunicación de información en una red interactiva de transmisión de resultados, con reglas y normas propias que están cambiando de manera profunda las formas de transmitir, evaluar y acumular conocimiento. Por ello, aunque la mayor parte de las revistas disponen de una versión electrónica, todavía estamos en el inicio de la profunda transformación que supondrá sobre ellas la era de la información.

#*#-*0(3"'Ê" 1.

2. 3. 4.

Piqueras M. Aproximación histórica al mundo de la publicación científica. En: Mabrouki K, Bosch F, eds. Redacción científica en biomedicina: lo que hay que saber. Barcelona: Fundación Dr. Antonio Esteve; 2007. p. 1-13. Booth CC. The origin and growth of medical journals. Ann Intern Med. 1990;113:398402. Day RA. How to write and publish a scientific paper. 3.ª ed. Cambridge, Mass.: Cambridge University Press, 1989. Antman EM, Lau J, Kupelnick B, Mosteller F, Chalmers TC. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial infarction. JAMA. 1992;268:240-8.

- " - * 5 & 3 "5 6 3 " $ * & / 5 Ê ' * $ " # * 0 . c % * $ " 5. 6. 7. 8. 9. 10.

© Elsevier. Fotocopiar sin autorización es un delito.

11.

Young NS, Ioannidis JPA, Al-Ubaydli O. Why current publication practices may distort science. PLoS Med. 2008;5(10):e201. Ioannidis JPA. Contradicted and initially stronger effects in highly cited clinical research. JAMA. 2005;294:218-28. González de Dios J. Utilidad de las revistas secundarias. FMC. 2007;14:279-80. Sackett DL, Straus SE, Richardson WS, Rosenberg W, Haynes RB. Evidence-Based Medicine: how to practice and teach EBM. 2.ª ed. Londres: Churchill Livingstone; 2000. Guyatt G, Rennie D, eds. Users’ Guides to the Medical Literature: a manual for evidencebased clinical practice. Chicago: American Medical Association; 2002. Haynes RB. Of Studies, syntheses, synopses, sumaries, and systems: the «5S» evolution of information services for evidence-based healthcare decisions. EBM. 2006;11:162-4. Smith R. Reinventing the biomedical journal. J Neurosci. 2006;26:9837-8.

1SFQBSBUJWPTQBSB MBSFEBDDJwOEFVONBOVTDSJUP '(BSDrB3rP

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ La preparación y posterior publicación de un manuscrito supone la culminación de un proyecto de investigación. De hecho, por muy importante que sea un descubrimiento, no se considera definitivo hasta que se da a conocer al resto de la comunidad científica. En este sentido, la UNESCO establece que «la finalidad esencial de un artículo científico es comunicar los resultados de investigaciones, ideas y debates de una manera clara, concisa y fidedigna; la publicación es uno de los métodos inherentes al trabajo científico»1. La elaboración de un artículo científico tiene algo de proceso artesanal, en el que se perfeccionan las habilidades a medida que se ejercitan. En cierto modo, la mejor manera de aprender a escribir un artículo científico es haciéndolo y aceptando las críticas y consejos de los revisores. Sin embargo, no debe olvidarse que existe un estrecho nexo de conexión entre el artículo científico y el proyecto de investigación que lo origina. Resulta improbable que una investigación con importantes deficiencias metodológicas pueda dar lugar a un buen artículo. Pero una buena investigación puede no conducir a un buen artículo si no se conoce el modo adecuado de elaborarlo. No obstante, antes de comenzar la redacción propiamente dicha del texto que constituirá el artículo es aconsejable llevar a cabo una serie de preparativos, que facilitarán el proceso posterior y pueden, en gran medida, condicionar su éxito. En las siguientes páginas se revisarán los principales aspectos que conviene resolver antes de iniciar el proceso de redacción de un artículo científico.

1"40426&%&#&/4&(6*34&&/-"13&1"3"$*Î/ %&6/"35Ê$6-0$*&/5Ê'*$0 Antes de escribir un manuscrito, resulta muy recomendable plantearse algunas preguntas clave: ¿para qué escribo?, ¿qué tengo que decir?, ¿cómo lo voy a

&MBCPSBDJwOEFVONBOVTDSJUP

decir?, ¿qué información existe al respecto?, ¿vale la pena el artículo?, ¿se ha publicado antes?, ¿cuál es el formato adecuado?, ¿a quién va dirigido? y ¿a qué revista lo enviaré? En realidad, muchas de estas cuestiones afrontan aspectos esenciales del manuscrito que conviene definir cuanto antes. En general, el proceso de elaboración de un artículo se podría dividir en cuatro etapas (fig. 2-1)2,3: 1. Fase inicial. En esta fase es necesario comprender el «juego de la publicación» y decidir si se quiere jugar a él. Conviene tener presente que la publicación de un artículo científico no supone necesariamente una medida de la capacidad clínica o científica, de la inteligencia o de la valía de un médico. No obstante, existen algunas características convenientes en el buen escritor médico, como son la curiosidad, la capacidad de observación, la sencillez, la humildad, la prudencia y la persistencia. También resulta muy conveniente poseer capacidad crítica constructiva y analítica, así como capacidad de asombro, de búsqueda continua y de síntesis2. 2. Fase preliminar. Consiste en la definición del mensaje del artículo, de su idea principal. En la misma debe valorarse, en el contexto de la información disponible, el significado que tienen los resultados del estudio. Todo artículo científico debería plantear una pregunta y responder a ella. Para definir el mensaje del artículo, resulta imperativo hacer una revisión bibliográfica previa, que a veces puede llevar a la conclusión de que la pregunta formu-

Fase inicial

Fase preliminar

% " % $ %! $ % # !

Fase de preparación

% % % %

Fase de redacción

% !ivo % $

Envío del manuscrito

Figura 2-1. Esquema de las distintas fases en la preparación de un manuscrito.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

lada ya tiene respuesta y, por tanto, la publicación carece de interés o debería ser replanteada. También en esta etapa resulta importante decidir la información que hay que presentar en el manuscrito. Uno de los mayores problemas cuando se escribe radica en seleccionar, de toda la información disponible, la que es necesaria para el artículo y la que resulta completamente irrelevante para sus objetivos. Frente a la opción de buscar la mejor combinación posible del mayor número de datos con independencia de su pertinencia4, parece más recomendable seleccionar únicamente los datos que son necesarios para apoyar o responder a las preguntas del estudio5. 3. Fase de preparación. Una vez definida la idea esencial del artículo, resulta muy conveniente resolver otros aspectos antes de comenzar su escritura. La definición de la autoría puede evitar problemas posteriores y agilizar el proceso de revisión de los borradores. Se tiene que elegir la revista a la que se pretende enviar el artículo y definir el tipo de lectores a los que irá dirigido. Es necesario recopilar diverso material que debe estar disponible al iniciar la escritura, como la documentación del proyecto de investigación, la base de datos y el análisis estadístico, así como los permisos necesarios. La consulta de las normas editoriales de la revista seleccionada resulta recomendable antes de fijar la estructura del manuscrito, que consistirá en un esquema del texto, tablas y figuras6,7. El esquema debe tener coherencia, orden y brevedad; es decir, sólo incluirá información pertinente y la comunicará de la forma más sencilla posible. 4. Fase de redacción. En esta fase se escribe el primer borrador del manuscrito, que debe ser preciso y claro. El texto se debe leer y entender rápidamente. Para ello, resulta recomendable un lenguaje sencillo, con oraciones bien construidas y el desarrollo de un tema en cada párrafo siguiendo un orden lógico. Este primer borrador se someterá a la corrección de los coautores y se realizarán los borradores sucesivos que resulten necesarios hasta la obtención del manuscrito definitivo. Una vez obtenida la aprobación de éste de todos los autores, sólo queda remitirlo a la revista.

© Elsevier. Fotocopiar sin autorización es un delito.

10326c16#-*$"3 La escritura es una de las características distintivas de las diversas civilizaciones humanas y, como cualquier otro científico, el investigador médico necesita escribir para dejar constancia de sus logros. Sea cual sea el tipo de investigación realizada, ésta no se considera completa hasta que sus hallazgos han sido publicados. Además, un artículo puede ser el punto de partida para futuras opiniones, críticas, refutaciones y discusión por parte de otros profesionales. Aunque los investigadores médicos no necesitan ser fantásticos artesanos de las palabras, supone una gran ventaja que sepan escribir con claridad y eficiencia. En general, un investigador de éxito suele ser un buen comunicador, capaz de maximizar la transmisión de sus hallazgos. Esta tarea puede verse favorecida por diversos estímulos, como el placer, el reconocimiento, el reto, la difusión

&MBCPSBDJwOEFVONBOVTDSJUP

del saber o la labor docente. No obstante, cada profesional deberá encontrar sus propios motivos para escribir. Las razones para publicar en biomedicina pueden abarcar desde causas altruistas hasta beneficios curriculares, profesionales, institucionales y prácticos (tabla 2-1)8. Entre las motivaciones altruistas, se encuentran la satisfacción personal derivada de la creatividad de la escritura y el reto intelectual que ello supone, la pretensión de mejorar la atención de los pacientes o el deseo de avanzar en el conocimiento y de beneficiar a la humanidad. La incorporación de la valoración de las publicaciones científicas en los sistemas de acreditación y examen justifica los beneficios curriculares que se pueden obtener mediante la publicación médica. El cómputo de publicaciones de un autor suele ser uno de los elementos que hay que considerar en el acceso a algún puesto académico, la promoción interna u otros tipos de concursos y oposiciones. En algunos centros públicos se exige tener un número mínimo de publicaciones para optar a determinados puestos. Además, en los distintos tipos de carrera profesional implantados en el Sistema Nacional de Salud, la producción científica es uno de los elementos evaluados. Desde un punto de vista profesional, las publicaciones científicas contribuyen a incrementar el prestigio nacional e internacional del autor en un área determinada. De ello se pueden derivar invitaciones para la realización de ponencias a congresos o participación en cursos, ser designado consultor de agencias externas, miembro de paneles de expertos o comités asesores o revisor de algunas revistas. Una amplia y contrastada producción científica permite optar a otros puestos de carácter profesional en otros centros o países y lograr una mayor financiación pública o privada para los proyectos de investigación propios. Se asume que la realización de múltiples publicaciones en un campo determinado aumenta el conocimiento en dicha área e incrementa la capacitación para la formación de estudiantes, médicos en fase de especialización y posgraduados. Por último, no debe dejar de considerarse que existe un cierto efecto de retroalimentación en la producción científica, y los autores muy productivos ganan reconocimiento para sus futuras publicaciones. Los artículos científicos también originan beneficios institucionales, ya que son fuente de reconocimiento internacional para un grupo, departamento, centro sanitario o universidad. Con frecuencia, las publicaciones se emplean como Tabla 2-1. Razones y motivos para publicar t %JGVTJØOEFMDPOPDJNJFOUP t -BCPSEPDFOUFZNBUFSJBMQBSBFOTF×BO[B t 3FRVJTJUPEFVOBJOWFTUJHBDJØO t $PNVOJDBDJØOEFDBTPTPTJUVBDJPOFTEFSJFTHPQBSBMBTBMVE t 3FDPOPDJNJFOUPZFTUÓNVMPJOUFMFDUVBM t 3FTQBMEPQBSBFMDVSSÓDVMVNWÓUBF t 1SPUFDDJØOEFMPTEFSFDIPTEFBVUPS t $PNVOJDBSTFDPOPUSPTBVUPSFT t 3FUSPBMJNFOUBDJØO t 5SBTDFOEFODJB t 1MBDFS

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

una medida de la producción científica para decidir políticas regionales, nacionales o internacionales de investigación. Además, constituyen una fuente de ingresos y un elemento de reparto presupuestario para entidades sanitarias o académicas. Los motivos por los que a las instituciones sanitarias les interesa que sus profesionales investiguen y publiquen son diversos. Como parte de la misión, valores y visión estratégica del centro, las publicaciones contribuyen a su excelencia y forman parte de su contrato social. Pueden suponer un valor añadido para sus profesionales y contribuir a atraer a los mejores, además de mejorar la eficiencia en la utilización de los recursos y la calidad y eficacia de sus actuaciones. En definitiva, el ejercicio de la investigación mejora la actividad asistencial9. Volviendo a la perspectiva de un médico que considera empezar a publicar, no deben menospreciarse diversos beneficios prácticos que pueden derivarse de esta tarea. La redacción de manuscritos biomédicos contribuye a la adquisición y desarrollo de habilidades durante el proceso de escritura, tales como la familiarización con la realización de búsquedas bibliográficas, la disciplina en la recogida y análisis de datos o la sistematización en la elaboración y revisión de un artículo científico. Este proceso también favorece el aumento de la capacidad de autocrítica y proporciona elementos para efectuar una revisión más rigurosa de la literatura.

© Elsevier. Fotocopiar sin autorización es un delito.

%&$*%*326c4&7""16#-*$"3 El autor debe definir el mensaje de su artículo, esto es, plantear la pregunta a la que pretende responder y decidir la información que va a aportar en este sentido. Este proceso va unido a la valoración de si, en función de los datos bibliográficos existentes, su planteamiento resulta relevante y potencialmente interesante para su publicación. En general, este proceso suele resultar sencillo y muchas veces constituye el impulso inicial que lleva al autor a plantearse la publicación. No obstante, en proyectos de investigación complejos puede ser una de las primeras fuentes de controversia. En dichos casos es importante definir qué parte del proyecto va a ser publicado y delimitar los objetivos específicos de cada artículo. En este proceso resulta esencial evitar la publicación redundante, es decir, los artículos que se solapan o coinciden sustancialmente con algo ya publicado en una versión impresa o electrónica10. La mayoría de revistas no desean recibir artículos sobre trabajos que ya han sido expuestos en artículos previos o que estén contenidos en otro artículo enviado o aceptado para su publicación. Esto no afecta a la publicación de un artículo completo posterior a uno preliminar, como un resumen o un póster a un congreso o un trabajo presentado en una reunión científica10. Los comunicados de prensa de reuniones científicas tampoco se consideran infracciones de esta regla, aunque no deben contener dato adicional alguno ni reproducciones de las tablas o figuras del artículo10. Ante esta situación, el autor debería preparar una declaración para el editor de todos los trabajos enviados a publicar y de los artículos previos que pudieran ser considerados publicaciones redundantes o duplicadas. Como es obvio, cualquier trabajo

&MBCPSBDJwOEFVONBOVTDSJUP

previo del grupo de investigación sobre el mismo tema debería ser referenciado en el nuevo artículo.

%&'*/*3-""6503Ê" El Comité Internacional de Editores de Revistas Médicas (International Committee of Medical Journal Editors, ICMJE) establece que el reconocimiento de la autoría debería basarse en el cumplimiento de tres condiciones: a) realización de aportaciones relevantes a la idea y diseño del estudio, o a la recogida de datos, o al análisis e interpretación de los mismos; b) participación en la redacción del borrador del artículo o en su revisión crítica, y c) aprobación de la versión final del manuscrito10. La búsqueda de financiación, la recogida de datos o la supervisión general del grupo de investigación no justifican por sí solos la autoría. En esta fase también es recomendable establecer el orden de los autores y justificarlo según una decisión común de todos los coautores. Desde un punto de vista operativo, suele ser muy útil designar a uno o más autores como responsables de la integridad del artículo, desde su inicio hasta la publicación del mismo. Estos autores responsables no tienen por qué coincidir necesariamente con el autor designado para la correspondencia ante la revista. Para evitar desagradables problemas que pueden incidir negativamente en una relación de colaboración, no está de más fijar los criterios de autoría desde el inicio del proyecto de investigación. Incluso en aquellos casos en los que se prevea generar varios manuscritos a partir de un proyecto, se debe establecer qué investigadores van a participar como autores en cada uno de ellos. En la designación de autores resulta conveniente tener presentes las causas más habituales de autoría injustificada11. No es aceptable que los jefes de grupos impongan sistemáticamente su nombre en todos los manuscritos escritos por los miembros de su equipo, aunque hayan tenido una participación marginal en la investigación. Tampoco resulta correcto conceder la autoría a un investigador completamente novel, sin participación alguna en el proyecto, con objeto de recompensarlo o estimularlo. Son igualmente rechazables algunas prácticas como incluir en la lista de autores a un investigador de elevado prestigio que no ha participado en el estudio, con la esperanza de que su nombre aumente las probabilidades de aceptación del manuscrito, o establecer pactos virtuales entre grupos para compartir la autoría en todos los artículos que escriban sus integrantes, aunque no hayan intervenido en los mismos. No huelga recalcar que toda usurpación de la autoría es éticamente inaceptable, y quien comete este tipo de infracción debería hacerse acreedor, por lo menos, a una sanción moral de parte de sus colegas. Todos los colaboradores que no cumplan los criterios de autoría deberían aparecer en la sección de agradecimientos del manuscrito. Esto incluye a quienes sólo han proporcionado ayuda técnica, a los implicados en la obtención o tratamiento de datos que no alcancen la autoría, a los colaboradores en la traducción o revisión de la traducción del artículo y, en su caso, a investigadores ajenos al proyecto que hayan leído versiones previas del trabajo y formulado críticas o sugerencias para mejorar el original10. En algunas revistas se recomienda que

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

aquellas personas que hayan contribuido materialmente en el artículo y que no cumplan los criterios de autoría figuren en los agradecimientos como «investigadores clínicos» o «investigadores participantes», describiendo su contribución. En cualquiera de estos casos, se debe recoger la autorización por escrito de todos los colaboradores del estudio que aparecerán en los agradecimientos.

$Î.0&-&(*3-"3&7*45"1"3"&/7*"3 6/."/64$3*50 La revista a la que se remitirá el artículo debe escogerse cuanto antes, para que éste se ajuste desde un comienzo al estilo de la publicación. Aunque el sistema de elección de la revista no es un proceso completamente estructurado, resulta obvio que puede condicionar el éxito final del artículo. Para tomar esta decisión, los autores deben considerar diversos factores, como la visibilidad de la revista, la coincidencia entre los objetivos de la revista y el tema del artículo, el factor de impacto de la revista, la agilidad del proceso editorial, la calidad de las críticas constructivas remitidas por los revisores, la accesibilidad de la revista, los costes de publicación e, incluso, la institución que la avala (tabla 2-2)7,12. En ocasiones, las áreas lingüística, cultural y geográfica resultan ser factores limitantes por la dificultad del autor para publicar en otro idioma. Aunque la elección del idioma de redacción de un artículo es una decisión muy personal, en la que intervienen consideraciones tanto prácticas como emocionales, si el material que se ha de publicar se considera de importancia, indudablemente llegará a más científicos si se publica en inglés en una revista internacional. Si el artículo sólo tiene implicaciones locales, se podría considerar su publicación en español en una revista nacional. No obstante, tampoco debe

© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 2-2. Algunas consideraciones generales que se deben tener en cuenta FOMBFMFDDJØOEFMBSFWJTUBNÈTJEØOFBQBSBQVCMJDBSVOBSUÓDVMP t &MUFNBQSJODJQBMEFMBSUÓDVMPEFCFFODBKBSFOFMPCKFUJWPEFMBSFWJTUB {&TFMNBOVTDSJUPEFDJFODJBCÈTJDBPDMÓOJDB {4FUSBUBEFVOUFNBEFDBSBDUFSÓTUJDBTHFOFSBMFTPNVZFTQFDÓGJDBT $PJODJEFODJBFOMFDUPSFTUJQP t *OUFOUBSFOMBTNFKPSFTSFWJTUBTQPTJCMFTFOUÏSNJOPTEFWJTJCJMJEBEZDBMJEBE {&TFMQSFTUJHJPEFMBSFWJTUBTVGJDJFOUFQBSBMPTBVUPSFT {$VÈMFTTVGBDUPSEFJNQBDUP {&ORVÏDVBSUJMEFTVÈSFBUFNÈUJDBTFFODVFOUSB t 3BQJEF[ZDBMJEBEEFMQSPDFTPEFSFWJTJØO — Valorar la demora en intentar publicar en revistas de máxima calidad con la necesidad de una publicación rápida en revistas inferiores {&MQSPDFTPEFSFWJTJØOQSPQPSDJPOBDSÓUJDBTÞUJMFTZDPOTUSVDUJWBT t $BSBDUFSÓTUJDBTFTQFDÓGJDBTEFMBSFWJTUB $PNQSFOTJØOEFMFTUJMPEFMBSFWJTUB ÓOEJDF UÓUVMPT GPSNBUP FTUJMP UJQPEFMFOHVBKF FUD

{1VFEFOMPTBVUPSFTDVNQMJSUPEPTMPTSFRVJTJUPT 3FDPOPDJNJFOUPEFMPTJOUFHSBOUFTEFMDPNJUÏFEJUPSJBM t $PTUFEFMBQVCMJDBDJØO t 7BMPSBDJØOEFMBPSHBOJ[BDJØOPTPDJFEBERVFMBBWBMB t 4FSDBVUPDPOMBTOVFWBTSFWJTUBT {4FSÈODBQBDFTEFNBOUFOFSTFFOFMUJFNQP

&MBCPSBDJwOEFVONBOVTDSJUP

desestimarse que algunas publicaciones nacionales con amplia difusión en un determinado grupo científico (p. ej., por ser órgano de expresión de algunas sociedades médicas) pueden proporcionar una notable repercusión local con rapidez. Uno de los primeros aspectos que hay que considerar en el proceso de elección es el tipo de revista. Es imprescindible que el tema del estudio que se pretende publicar coincida con los objetivos de la revista. En relación con el perfil de sus lectores habituales, muchas publicaciones periódicas tienen una mayor predilección por artículos clínicos, de ciencia básica o de investigación traslacional. De igual modo, se debe valorar si el manuscrito tiene un carácter general o resulta muy específico, por lo que sería preferible enviarlo a una revista de especialidad o subespecialidad. Es obvio que el prestigio de la revista resulta un elemento decisivo para su selección. El material publicado en una revista de prestigio será más fácilmente reconocido y valorado, además de citado en otras publicaciones o en presentaciones. Sin embargo, estas revistas reciben más manuscritos, tienen estándares más rigurosos y poseen índices de rechazo más elevados. Al margen de los indicadores bibliométricos, existen otros criterios de prestigio que merecen ser considerados. La revista debe estar incluida en el mayor número posible de bases de datos biomédicas, en especial en Medline y en el Science Citation Index. Medline contiene referencias bibliográficas y resúmenes de artículos de unas 4.800 revistas de biomedicina y ciencias de la salud, publicadas en más de 30 lenguas diferentes en más de 70 países. Se estructura en tres sub-bases: Index Medicus (con más de 3.600 publicaciones), Dental Index e International Nursing Index. Pubmed es la plataforma web de búsqueda gratuita que permite el acceso a Medline y a otras bases de datos (http://www.ncbi.nlm.nih.gov/ entrez/query.fcgi?DB=pubmed)13. La inclusión en el Science Citation Index, que contiene 3.500 revistas científicas, o en el Science Citation Index Expanded, que incluye 5.700 revistas adicionales, también resulta muy importante, puesto que constituyen la fuente para el cálculo de los indicadores bibliométricos más reconocidos. De hecho, algunos centros de investigación sólo consideran para propósitos de evaluación los artículos publicados en revistas incluidas en estos índices. Otros criterios de prestigio de una revista son su inclusión en bibliotecas virtuales o en sistemas de acceso electrónico institucionales, la notoriedad de sus autores, su influencia sobre los servicios de relaciones públicas de instituciones sanitarias o académicas y su impacto sobre la prensa ordinaria. Las citaciones y el factor de impacto constituyen un criterio esencial en la percepción de las revistas por los autores y por agencias externas e instituciones. A partir de la premisa de que los artículos más importantes tienen una mayor repercusión científica y se citan con más frecuencia, Eugene Garfield fundó el Institute for Scientific Information mediante el que se elaboran diversos indicadores bibliométricos, publicados anualmente en el Journal Citation Reports. De todos ellos, el más conocido es el factor de impacto o cociente entre el número de citaciones que reciben en un año los artículos publicados en una revista durante los dos años anteriores y su número de publicaciones en esos dos años. Tal ha sido la influencia de este indicador, que algunas bibliotecas comenzaron a usar el factor de impacto como criterio para decidir a qué revistas suscribirse y

© Elsevier. Fotocopiar sin autorización es un delito.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

más tarde algunas universidades e institutos de investigación comenzaron a usarlo para evaluar la productividad de sus científicos. Sin embargo, el uso del factor de impacto con propósitos ajenos a su creación ha sido muy criticado14. El factor de impacto refleja la tasa de citaciones media de una revista, no de un artículo. De hecho, se ha comprobado que existe una débil relación entre el factor de impacto de una revista y el número de citaciones de un determinado artículo15. Se estima que un 17% de los artículos de una revista acaparan el 50% de las citas que recibe16. El factor de impacto sólo valora las citas recibidas en los dos años siguientes a su publicación y debería complementarse con otros indicadores de repercusión, también proporcionados en el Journal Citation Reports, como son la tasa de citación, el semiperíodo de las citas o el factor de inmediatez. A su vez, la evolución del factor de impacto resulta variable. Hay revistas de prestigio que mantienen valores constantes a lo largo de los años, mientras que otras revistas menos prestigiosas pueden experimentar un acusado crecimiento en un momento dado17. Por otra parte, constantemente aparecen nuevas revistas (casi 2.000 al año), que tardan varios años en obtener su factor de impacto, por lo que no pueden ser comparadas con publicaciones de mayor tradición. Además, la distribución del conocimiento dentro de un área temática sigue un patrón no siempre coincidente con el factor de impacto. Se ha comprobado que aproximadamente 150 revistas contienen el 25% de las publicaciones científicas y el 50% de las citaciones, mientras que 2.000 revistas contienen el 85% de las publicaciones y el 95% de las citaciones12,18. Las características y eficiencia del comité editorial también deberían ser consideradas en la elección de una revista. Es conveniente que la revista proporcione unas instrucciones para el autor fácilmente accesibles, comprensibles y claras, en las que se defina qué se espera de los autores y cómo deben enviar un manuscrito. Las revistas más atractivas disponen de revisores muy cualificados y proporcionan unas críticas muy constructivas y sugerencias de elevado nivel científico, tanto por parte de los revisores como de los editores. En la actualidad, resulta exigible que la revista disponga de un ágil sistema de envío electrónico de manuscritos, adaptado a algún formato estándar (Manuscript Central® o EES®). Pero, sobre todo, se debe valorar la rapidez del comité editorial en la toma de decisiones. En las revistas con una elevada tasa de rechazo, es deseable la rápida comunicación del mismo, incluso si se decide no someter el manuscrito al proceso de revisión. Recientemente, algunos comités editoriales ofrecen la posibilidad de evaluar sólo el resumen del artículo, para decidir si podrían tener interés en la revisión de la totalidad del manuscrito. De igual modo, se deben tener en cuenta factores relacionados con la distribución y publicación de la revista. Es deseable que se facilite la relación de los autores con el comité editorial y con el departamento editorial de la revista, así como que se permita la corrección de las pruebas de imprenta en formato PDF. También se debe evaluar la presentación del manuscrito en la revista, su maquetación, el diseño de los gráficos, la calidad del papel o el tipo de letra. Aunque las revistas internacionales llegan a más lectores y son consideradas por más servicios bibliográficos que las revistas nacionales, la tradicional dependencia del número de lectores de la tirada y distribución de la revista está matizada en la actualidad por su disponibilidad en formato electrónico. Mu-

&MBCPSBDJwOEFVONBOVTDSJUP

chas revistas biomédicas tienen una página web, en la que ofrecen las tablas de contenido y los resúmenes o incluso el texto completo de sus artículos. Debido a que el medio electrónico se ha convertido en la principal vía para difundir el conocimiento científico, son especialmente recomendables las revistas que ofrezcan acceso libre al texto completo de sus artículos. En los últimos años ha aumentado el número de revistas que sólo aparecen en formato electrónico, por lo que logran reducir el tiempo medio de publicación de 4-12 meses a poco más de 2 meses. Otros aspectos relacionados que deben considerarse son la oferta de una edición bilingüe en inglés, la publicación electrónica previa de manuscritos aceptados y las características de cesión de los derechos de autor. También resulta muy recomendable averiguar el coste de publicación de la revista considerada. Algunas publican artículos sin cargo alguno para los autores, mientras que otras cobran por la publicación o incluso por la revisión de los manuscritos. En algunos casos, los cargos por publicación se imponen para mitigar los costos de producción de la revista, especialmente en el caso de las publicaciones electrónicas con acceso libre, y en otros se establece como un factor limitante para los autores. En el cómputo de los gastos de publicación, también se debe considerar la posibilidad de incluir figuras en color y su precio, así como el coste de las copias (reprints) del artículo. Por último, es aconsejable identificar a la sociedad propietaria o promotora de la revista. Ésta debe garantizar un trato igualitario para todos los autores, y no sólo para los miembros de la sociedad a la que pertenece, lo que depende en gran medida de la independencia del comité editorial. Otros aspectos de relativa importancia en esta línea son cómo se gestionan los posibles conflictos éticos, cómo se nombra al director de la revista, quién controla a los editores y revisores o si existen garantías sobre la continuidad de la revista. Aunque el número de variables que deben considerarse en la elección de una revista es muy amplio, se ha comprobado que, en orden decreciente de importancia, los elementos más decisivos en la selección son el factor de impacto, el perfil de los lectores, el prestigio de la revista, el tema de la publicación, el coste, la rapidez editorial, la calidad, la visibilidad y la posibilidad de acceso libre3.

13&1"3"$*Î/%&-."5&3*"-13&7*0 :%&'*/*$*Î/%&-"&4536$563" Antes de comenzar a escribir el artículo, resulta conveniente disponer de todo el material previo del proyecto, incluyendo el protocolo de investigación, los cuadernos de recogida de datos, la base de datos, el análisis estadístico y todas las publicaciones preliminares. Este material resulta importante, tanto para definir la estructura del manuscrito como para realizar consultas a lo largo del proceso de redacción. En cuanto a la estructura, los artículos originales suelen dividirse en una serie de apartados preestablecidos: título, resumen, palabras clave, introducción, pacientes y métodos, resultados, discusión, agradecimientos, referencias bibliográficas, tablas y figuras. Dado que las características de este capítulo no permiten una descripción detallada de los mismos, únicamente cabe mencionar que

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

Tabla 2-3. %JSFDUSJDFTQBSBMBQSFTFOUBDJØOEFFTUVEJPTDPOEJTF×PTFTQFDÓGJDPT

© Elsevier. Fotocopiar sin autorización es un delito.

*OJDJBUJWB

Tipo de estudio

Fuente

CONSORT

Ensayos controlados aleatorizados

IUUQXXXDPOTPSUTUBUFNFOUPSH

QUOROM

Revisiones sistemáticas y metaanálisis

IUUQXXXDPOTPSUTUBUFNFOUPSH *OJUJBUJWFT.004&NPPTFQEG

STROBE

Estudios observacionales en FQJEFNJPMPHÓB

IUUQXXXTUSPCFTUBUFNFOUPSH

STARD

Estudios de exactitud diagnóstica

IUUQXXXDPOTPSUTUBUFNFOUPSH TUBSETUBUFNFOUIUN

REMARK

Estudios pronósticos con marcadores XXXDBODFSEJBHOPTJTODJOJIHPW tumorales BTTFTTNFOUQSPHSFTTDMJOJDBMIUN

MOOSE

.FUBBOÈMJTJTEFFTUVEJPT PCTFSWBDJPOBMFTFOFQJEFNJPMPHÓB

IUUQXXXDPOTPSUTUBUFNFOUPSH *OJUJBUJWFT.004&NPPTFQEG

los autores disponen de algunas directrices concretas para la presentación de estudios con diseños específicos. En estas directrices se establecen unas normas que permiten obtener de los autores una exposición transparente de la investigación y facilitan que tanto los revisores como los lectores entiendan el diseño, la realización, el análisis y la interpretación de ciertos estudios (tabla 2-3)10,19. La estructura de las publicaciones de ensayos clínicos controlados y aleatorizados de grupos paralelos se debe ajustar a la declaración CONSORT (Consolidated Standards of Reporting Trials), publicada hace una década20 y revisada posteriormente21,22. Cuenta con 22 puntos referidos a las partes básicas del manuscrito y un diagrama de flujo, que contiene el número de participantes durante la selección, la asignación al tratamiento, el seguimiento y el análisis. Las revisiones sistemáticas y los metaanálisis deben seguir la estructura establecida en la declaración QUOROM (Quality of Reporting Meta-analyses), elaborada en 199923 y revisada recientemente24. También consta de una lista de comprobación, con 18 puntos sobre métodos y resultados, y de un diagrama de flujo. La declaración STROBE (Strengthening the Reporting of Observational Studies in Epidemiology) establece directrices para estudios epidemiológicos, mediante una hoja de comprobación de 22 puntos para tres diseños epidemiológicos principales (de cohortes, de casos y controles y estudios transversales)25. La iniciativa STARD (Standards for Reporting of Diagnostic Accuracy) contiene una lista de 25 puntos y un diagrama de flujo referente a normas para la publicación de informes sobre precisión diagnóstica26,27, mientras que la iniciativa REMARK (Reporting Recommendations for Tumour Marker Prognostic Studies) establece normas para la publicación de estudios sobre capacidad predictiva de marcadores tumorales28.

3&$01*-"$*Î/%&1&3.*404:%&$-"3"$*0/&4 Éste es un aspecto que también conviene tener resuelto antes de comenzar la redacción del manuscrito, en algunos casos por imperativo legal y en otras circunstancias por la demora en su gestión.

&MBCPSBDJwOEFVONBOVTDSJUP

%FDMBSBDJwOEFDPOGMJDUPEFJOUFSFTFT En las últimas décadas se ha intensificado la implicación de los científicos en el mundo empresarial, llegando a participar en la creación de empresas de consultoría o de investigación, especialmente en áreas relacionadas con la biotecnología o la investigación farmacéutica. Cada vez son más los investigadores que mantienen intereses comerciales relacionados con la investigación que desarrollan, superando en algunas áreas el 30%29. Aunque esta relación no siempre supone un motivo de perversión de los resultados científicos, se ha descrito un mayor porcentaje de resultados favorables a la terapia evaluada en estudios financiados por la industria farmacéutica que en los financiados por otras agencias, lo que sugiere una menor publicación de estudios negativos30. Como consecuencia de esta práctica, las revisiones sistemáticas o metaanálisis de los datos publicados podrían mostrar una falsa efectividad de algunos de estos tratamientos. En otro nivel de influencia, se han identificado algunas relaciones directas entre la publicación de ciertos artículos científicos y los resultados económicos de algunas empresas químicas o farmacéuticas31. Ante estas amenazas, la comunidad científica ha adoptado medidas de control y la mayoría de las revistas biomédicas exigen una declaración de conflicto de intereses de los autores en el momento del envío de un artículo32. Se considera que existe un conflicto de intereses cuando el autor o su institución tiene relaciones personales o financieras que influyen de forma poco adecuada en sus acciones10. La posibilidad de conflicto de intereses existe tanto si la persona implicada cree que puede afectar a su juicio científico como si no. Este tipo de relaciones pueden corresponder a motivos económicos (como honorarios, informes, asesorías, peritajes, empleo o propiedad de acciones), a relaciones personales, a rivalidad académica o a la propia pasión intelectual. En caso de potenciales conflictos de intereses relacionados con los compromisos de los autores, éstos deben preparar una declaración de todas las relaciones personales o financieras que pudieran sesgar su trabajo y declarar explícitamente si existen o no posibles conflictos 10. También es necesario precisar la fuente de financiación de todas las personas que han colaborado en la redacción del manuscrito. Antes de escribir el artículo, también se tienen que comunicar los conflictos de intereses a los restantes coautores. Por lo que respecta a conflictos relacionados con la financiación del proyecto, los autores no deberían firmar acuerdos de financiación que interfieran en su capacidad para acceder a los datos y analizarlos independientemente o para redactar los manuscritos y publicarlos. Si la fuente de financiación ha tenido alguna intervención en el diseño del estudio, en la recogida, análisis e interpretación de datos, en la redacción del artículo o en la decisión de presentarlo para su publicación, debería mencionarse10. En algunos estudios financiados por organismos con un interés económico directo sobre los resultados, los editores pueden solicitar a los autores una declaración firmada en la que se haga constar que han tenido pleno acceso a toda la información del estudio y que se hacen totalmente responsables de la integridad de los datos y de la exactitud de su análisis10.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

1SPUFDDJwOEFMBTQFSTPOBTZBOJNBMFT RVFQBSUJDJQFOFOMBJOWFTUJHBDJwO Para la realización de un proyecto de investigación y, por supuesto, para su publicación se requiere la aprobación del comité de ética de investigación clínica de la institución correspondiente, en la que se acredita que el proyecto se realizará siguiendo las normas de buena práctica clínica y los postulados éticos de la declaración de Helsinki y sus posteriores actualizaciones. La fecha de este documento debe ser anterior al inicio del estudio y, en general, debe acompañarse de la aprobación de la dirección de los centros en los que se realizará el proyecto. En ocasiones, un comité editorial o los revisores de alguna revista pueden solicitar la verificación directa del mencionado documento. Si se trata de ensayos clínicos, también es necesario disponer de la autorización de la Agencia Española del Medicamento (http://www.agemed.es/). En los casos de experimentación animal, se debe especificar si se han cumplido las normativas nacionales e institucionales para el cuidado y uso de animales de laboratorio, y contar con la aprobación del comité institucional correspondiente.

© Elsevier. Fotocopiar sin autorización es un delito.

3FHJTUSPPCMJHBUPSJPEFFOTBZPTDMrOJDPT Destacada la importancia de publicar estudios negativos y teniendo en cuenta que la publicación de los ensayos clínicos debe ser acorde con su diseño y objetivos iniciales, se ha establecido la necesidad de realizar una declaración de los mismos, antes de su ejecución. Por ello, se promueve el registro en bases de datos de ensayos clínicos de cualquier proyecto de investigación que prospectivamente asigne seres humanos a grupos de intervención, de comparación concurrente o de control para estudiar la relación causa-efecto entre una intervención médica y un resultado de salud10. Se entiende por intervención médica el uso de medicamentos, procedimientos quirúrgicos, dispositivos, tratamientos conductuales, cambios en el proceso de cuidados, etc. Siguiendo estas indicaciones, la mayoría de las revistas exigen que, al final del resumen de los manuscritos derivados de un ensayo clínico, figure su número de registro. Los registros de ensayos clínicos son bases de datos en formato electrónico y acceso a través de una web, que cumplen funciones éticas (asegurar que se publican los objetivos iniciales del ensayo no distorsionados) y científicas (proporcionan una lista abierta de estudios en marcha) (tabla 2-4). Deben permitir el acceso Tabla 2-4. 3B[POFTQBSBSFHJTUSBSVOFOTBZPDMÓOJDP t 3FTUBVSBSMBDPOGJBO[BQÞCMJDBFOMBJOWFTUJHBDJØODMÓOJDBEFMBJOEVTUSJB GBSNBDÏVUJDB t 'BDJMJUBSFMEFTDVCSJNJFOUPZDPOUSPMEFTFTHPTFOFMEJTF×P t 'BDJMJUBSFMEFTDVCSJNJFOUPZDPOUSPMEFTFTHPTFOMBQVCMJDBDJØO t "TFHVSBSMBJOUFHSJEBEEFMBNFEJDJOBCBTBEBFOMBFWJEFODJB t (BSBOUJ[BSRVFMPTSFTVMUBEPTOPTFPDVMUBOBMDPOPDJNJFOUPNÏEJDPHFOFSBM t "VNFOUBSMBFGJDJFODJBEFMBJOWFTUJHBDJØODMÓOJDB t 1SPNPWFSMBJOOPWBDJØO t -PHSBSTVQVCMJDBDJØOFOSFWJTUBTEFQSFTUJHJP

&MBCPSBDJwOEFVONBOVTDSJUP

gratuito, estar abiertas a todos los usuarios, ser gestionadas por organizaciones sin ánimo de lucro, recoger un conjunto mínimo de datos (tabla 2-5) y disponer de sistemas de control que aseguren su validez. Los registros más empleados son el americano ClinicalTrials.gov (que contiene datos de cerca de 35.000 ensayos clínicos) y el británico International Standard Randomised Controlled Trial Number Register (que contiene aproximadamente 5.000 ensayos clínicos)33. El registro ClinicalTrials.gov es manejado por la National Library of Medicine de Estados Unidos (fig. 2-2), permite el acceso libre y el registro gratuito y contiene campos relativos a los investigadores y al proyecto. Para el registro de un estudio de investigación, es necesario que haya sido aprobado por su comité de ética local y que se realice conforme a las regulaciones de sus autoridades sanitarias. Además, el registro debe ser actualizado cada seis meses durante el período de reclutamiento.

%PDVNFOUPTSFMBUJWPTBMBQSJWBDJEBEZDPOGJEFODJBMJEBEEFMQBSUJDJQBOUF Cualquier información que se obtenga de un paciente durante un estudio de investigación o durante la práctica clínica está sujeta al principio de confidencialidad. Este principio afecta a la publicación en revistas médicas de cualquier material perteneciente a un paciente o sujeto de investigación. Aunque existen distintas aproximaciones al mismo, la más aceptada establece que no existe problema de confidencialidad siempre que el paciente no resulte identificable34. Por tanto, toda la información que pueda facilitar la identificación de un paciente, incluidas sus iniciales o su número de historia clínica, debe ser elimi-

Figura 2-2. 1ÈHJOBQSJODJQBMEFMSFHJTUSPEFFOTBZPTDMÓOJDPTClinicalTrials.gov.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

Tabla 2-5. $POKVOUPNÓOJNPEFEBUPTSFDPNFOEBEPTQPSFM$PNJUÏ*OUFSOBDJPOBM EF&EJUPSFTEF3FWJTUBT.ÏEJDBTFOMPTSFHJTUSPTEFFOTBZPTDMÓOJDPT Ítem

Será consignado por la entidad primaria de registro

'FDIBEFSFHJTUSPEFMFOTBZP

Será consignada por la entidad primaria de registro

*EFOUJGJDBEPSFTTFDVOEBSJPT

1VFEFOTFSBTJHOBEPTQPSMPTQBUSPDJOBEPSFT o por otras partes interesadas

'VFOUF T EFGJOBODJBDJØO

/PNCSFEFMB T PSHBOJ[BDJØO FT RVFGJOBODJB O FMFTUVEJP

1BUSPDJOBEPSQSJODJQBM

-BQSJODJQBMFOUJEBESFTQPOTBCMFEFSFBMJ[BS la investigación

1BUSPDJOBEPS FT TFDVOEBSJP T

&OTVDBTP MBTFOUJEBEFTTFDVOEBSJBTSFTQPOTBCMFT de la realización de la investigación

7. Responsable de contactos

© Elsevier. Fotocopiar sin autorización es un delito.

$PNFOUBSJP

/ÞNFSPFTQFDÓGJDPEFMFOTBZP

1FSTPOBEFDPOUBDUPBOUFFMQÞCMJDP QBSBQBDJFOUFT interesados en participar

3FTQPOTBCMFDJFOUÓGJDP de contactos

1FSTPOBEFDPOUBDUPQBSBBTVOUPTDJFOUÓGJDPTTPCSF el ensayo

5ÓUVMPEFMFTUVEJP

5ÓUVMPCSFWFFTDPHJEPQPSFMHSVQPEFJOWFTUJHBDJØO BDSØOJNP

5ÓUVMPDJFOUÓGJDPPGJDJBM del estudio

&OFTUFUÓUVMPEFCFGJHVSBSFMOPNCSFEFMBJOUFSWFODJØO FMUFNBPCKFUPEFFTUVEJPZFMSFTVMUBEP

3FWJTJØOÏUJDB de la investigación

¿Ha obtenido el estudio en el momento del registro MBBQSPCBDJØOEFMDPNJUÏEFÏUJDB TÓOP

Se da por supuesto que todos los ensayos registrados UFOESÈOMBBQSPCBDJØOEFVODPNJUÏEFÏUJDB antes de su comienzo

12. Tema

&OGFSNFEBEPCKFUPEFFTUVEJP

*OUFSWFODJØO FT

%FTDSJQDJØOEFMFTUVEJPZEFMB T JOUFSWFODJØO FT

DPNQBSBDJØODPOUSPM OPNCSFHFOÏSJDPPOÞNFSP EFTFSJFBTJHOBEPQPSMBFNQSFTB %FCFFTQFDJGJDBSTF MBEVSBDJØOEFMB T JOUFSWFODJØO FT

$SJUFSJPTDMBWFEFJODMVTJØO y exclusión

$BSBDUFSÓTUJDBTDMBWFEFMQBDJFOUFRVFEFUFSNJOBO su elegibilidad para participar en el estudio

15. Tipo de estudio

4FFTQFDJGJDBSÈMBBMFBUPSJ[BDJØO BMFBUPSJ[BEPTGSFOUFBOP BMFBUPSJ[BEPT

FMUJQPEFFONBTDBSBNJFOUP EPCMFDJFHP TJNQMFDJFHP

FMUJQPEFDPOUSPMFT QMBDFCP BDUJWP ZMB BTJHOBDJØOEFMPTHSVQPT QBSBMFMB DSV[BEB GBDUPSJBM

'FDIBQSFWJTUBEFJOJDJPEFM 'FDIBFTUJNBEBEFJODPSQPSBDJØOEFMQSJNFSQBSUJDJQBOUF ensayo 5BNB×PEFMBNVFTUSBQSFWJTUP

/ÞNFSPUPUBMEFTVKFUPTEFMQMBOEFJOWFTUJHBDJØO a incorporar antes de cerrar el ensayo

$POEJDJPOFTEFMSFDMVUBNJFOUP

{&TUÈEJTQPOJCMFFTUBJOGPSNBDJØO TÓOP &ODBTP BGJSNBUJWP FTQFDJGJDBSVOFOMBDFQBSBBDDFEFS a la información

19. Resultado principal

&MSFTVMUBEPQBSBMBFWBMVBDJØOEFMDVBMGVFEJTF×BEP FMFTUVEJP4VEFTDSJQDJØOEFCFSÓBJOEJDBSFMNPNFOUP en que se mide el resultado

20. Resultados secundarios clave

-PTSFTVMUBEPTTFDVOEBSJPTFTQFDJGJDBEPTFOFMQSPUPDPMP 4VEFTDSJQDJØOEFCFSÓBFTQFDJGJDBSFMNPNFOUPEFMB medición

%JTQPOJCMFFOIUUQXXXJDKNFPSH

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 2-6. $POTJEFSBDJPOFTHFOFSBMFTTPCSFMBQVCMJDBDJØO de información de un paciente t -BQVCMJDBDJØOEFDVBMRVJFSJOGPSNBDJØOSFMBUJWBBVOQBDJFOUFSFRVFSJSÈOPSNBMNFOUF TVDPOTFOUJNJFOUPJOGPSNBEP BVODVBOEPTFIBZBOFMJNJOBEPMPTEBUPTRVFQVFEBO llevar a su identificación t /PTFQVCMJDBSÈJOGPSNBDJØOQFSTPOBMTPCSFVOQBDJFOUFTJÏTUFOPMPBVUPSJ[B TBMWPFOMBDJSDVOTUBODJBFYDFQDJPOBMEFFOPSNFJNQPSUBODJBQBSBMBTBMVEQÞCMJDB t 4FQFSNJUJSÈOQVCMJDBDJPOFTTJOFMDPOTFOUJNJFOUPEFMQBDJFOUFTJTFDVNQMFOUPEBT MBTDPOEJDJPOFTTJHVJFOUFT %FTQVÏTEFVOFTGVFS[PSB[POBCMF SFTVMUBJNQPTJCMFMPDBMJ[BSBMQBDJFOUF y tampoco es probable lograr el consentimiento de un familiar &MBSUÓDVMPDPOUJFOFJOGPSNBDJØONVZSFMFWBOUFTPCSFTBMVEQÞCMJDB que no puede ser presentada eficazmente de otro modo &OMBQPTJDJØOEFMQBDJFOUF VOBQFSTPOBSB[POBCMFOPTFPQPOESÓBBMBQVCMJDBDJØO EFMBSUÓDVMP — Se aplican medidas para minimizar el riesgo de identificación del paciente

nada de la publicación. Tampoco deben figurar fotografías ni datos genealógicos, a menos que dicha información resulte esencial para los objetivos científicos del artículo y que el paciente o su tutor conceda el consentimiento escrito para su publicación10,34. En estos casos, el consentimiento informado requiere enseñar el manuscrito que va a publicarse al paciente que pueda ser objeto de identificación. Ocultar la región de los ojos en las fotografías de pacientes no resulta suficiente protección del anonimato 10. Si los datos identificativos no son esenciales, deberían ser omitidos, pero nunca alterados o falsificados. Siempre que existan dudas sobre el mantenimiento del anonimato, es preferible solicitar el consentimiento para la publicación, especialmente cuando se describe un trastorno raro o una enfermedad mental, al igual que para cualquier fotografía (tabla 2-6)35. Algunas excepciones a este procedimiento pueden plantearse cuando el paciente falleció hace tiempo y no tenía familiares, cuando la relación clínica con el paciente sucedió hace mucho tiempo (más de 15 años) o cuando la información clínica se publicará sin los nombres de los autores, por lo que es improbable que nadie pueda identificar al paciente36. En cualquier caso, y ante la posibilidad de una demanda, un comité editorial puede rechazar los artículos que carezcan del consentimiento informado del paciente para la publicación. Estas normas no afectan a las publicaciones de resultados de proyectos de investigación, puesto que ya cuentan con la aprobación del comité de ética correspondiente que garantiza el cumplimiento de las condiciones de anonimato de todos los participantes, ni a la publicación de información obtenida desde una fuente pública, puesto que ésta proviene de una relación periodistasujeto en lugar de una relación médico-paciente34. Los datos relativos a tejidos u otras muestras anónimas, que no permiten establecer una relación con un paciente concreto, también están exentos de este requisito.

1FSNJTPTEFSFQSPEVDDJwO Si en un artículo se pretende incluir algún texto, tabla o figura procedente de otro, es recomendable disponer de la autorización previa de la revista fuente.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0

De hecho, algunas revistas exigen que, junto con la primera versión de un manuscrito remitido para su evaluación, se incluyan copias de los correspondientes permisos de reproducción. En la mayoría de las revistas se puede solicitar este permiso mediante un formulario electrónico disponible en su página web. En el mismo es necesario indicar qué se pretende reproducir, describir el artículo fuente y precisar si se trata de una reproducción exacta, de una modificación o de una traducción. También se requiere información sobre el autor solicitante, el medio en el que se reproducirá el material (libro, revista, página web, disco compacto, tesis, ponencia, copias individuales, documentos para la docencia, etc.) y sus características (título de la revista, fecha aproximada de publicación, editorial y tirada). En ocasiones se plantea la paradoja de que un autor tiene que solicitar permiso para reproducir material de un artículo propio, del que cedió sus derechos a la revista. En este proceso es necesario considerar que algunas revistas cobran por la cesión de permisos de reproducción y que la demora media en su obtención oscila entre dos y cuatro semanas.

130$&40%&&-"#03"$*Î/ #033"%03&4:$033&$$*0/&4

© Elsevier. Fotocopiar sin autorización es un delito.

Aunque ya se ha mencionado que las características y estructura de cada uno de los apartados de un artículo trascienden los objetivos de este capítulo, sí resulta de interés planificar cómo se va a enfocar la tarea de escritura y corrección del manuscrito. Aunque la forma de escribir un artículo depende mucho de la personalidad, capacidad, recursos disponibles y disciplina de sus autores, el método de aproximaciones sucesivas parece ser el más aceptado. Este procedimiento consiste en elaborar versiones sucesivas de un mismo trabajo, mediante la interacción de todos sus coautores: 1. Preparación del primer borrador. Si se ha realizado una buena estructura del manuscrito y se dispone de todo el material necesario, esta fase puede ser relativamente rápida. El consejo más habitual es preparar una primera versión del artículo, que resulte clara y coherente y sirva de punto de partida para las correcciones. Los retrasos en la obtención del primer borrador provienen muchas veces de problemas en las fases anteriores, por defectos en la estructura del artículo, por falta de material o por indefinición de los datos que deben utilizarse. Aunque algunos autores noveles prefieren escribir el texto y añadir después las referencias, ésta no es una práctica recomendable. Desde sus inicios en la escritura biomédica, el autor debe acostumbrarse a defender todas sus afirmaciones con referencias pertinentes y a seleccionar las más adecuadas. Ni en la primera fase de borrador tiene sentido corregir un texto que no vaya acompañado de referencias. Además, esta tarea cada vez resulta más sencilla gracias a los programas de gestión de bibliografía. Por último, las tablas y figuras deben integrarse también en el primer borrador del artículo, según el estilo de la revista.

&MBCPSBDJwOEFVONBOVTDSJUP

En la confección del primer borrador, algunos autores prefieren escribir el artículo invirtiendo el orden de sus secciones; es decir, empezar por las conclusiones y acabar por la introducción. No puede establecerse una regla general sobre estos aspectos y, en cualquier caso, debe adaptarse a las preferencias del autor. De todas formas, si se dispone de un buen esquema estructurado, el orden de escritura no resulta tan importante. 2. Corrección por coautores. Una vez elaborado el primer borrador debe circular entre los demás autores y, mediante sucesivos borradores, se va mejorando el contenido del trabajo. Durante este proceso se aclaran los puntos que resulten más imprecisos, se mejora la argumentación de algunos aspectos de la discusión, se completan apartados que hayan quedado poco definidos o se pueden añadir nuevas tablas o figuras que parezcan oportunas. Para su buena marcha, suele resultar recomendable establecer una fecha límite para las correcciones y solicitar a los coautores que aporten sus matizaciones concretas en el texto, en lugar de realizar críticas genéricas y poco aplicables a la mejora del manuscrito. Aunque no son deseables, si se plantean controversias sobre algún aspecto de la corrección, los autores deberían consensuar el modo de solucionarlas. 3. Aprobación del manuscrito definitivo por todos los coautores. Una vez agotada la fase de corrección por aproximaciones sucesivas, se obtiene el manuscrito final. Éste debe ser aprobado por todos los autores antes de remitirlo a la revista seleccionada.

$0/$-64*0/&4 Aunque la tarea de escribir un artículo pueda parecer compleja y precisar un importante grado de motivación personal, requiere una detallada planificación antes de su inicio. Aspectos como la definición de la pregunta del artículo, la elección de la revista más adecuada o la elaboración de un minucioso esquema estructurado del manuscrito pueden resultar determinantes en el éxito de esta tarea. El establecimiento previo de los criterios de autoría y la recopilación del material, permisos y declaraciones necesarias también son muy recomendables antes de iniciar el proceso de redacción.

#*#-*0(3"'Ê" 1. 2. 3. 4. 5. 6.

UNESCO. Guía para la redacción de artículos científicos destinados a la publicación. 2.ª ed. París: UNESCO; 1983. Albert T. Cómo escribir artículos científicos fácilmente. Gac Sanit. 2002;16:354-7. Warlick SE, Vaughan KTL. Factors influencing publication choice: Why faculty choose open access. Biomed Digit Libr. 2007;4:1. Albert T. A-Z of medical writing. Londres: BMJ Publications Group; 2000. p. 72. Buzan T, Buzan B. The mindmap book. Londres: BBC Books; 1993. Camps D. El artículo científico: Desde los inicios de la escritura al IMRYD. Arch Med. 2007;3:1-9.

1 3 & 1" 3 "5 * 7 0 4 1" 3 " - " 3 & % " $ $ * Î / % & 6 / . " / 6 4 $ 3 * 5 0 7. 8. 9.

10.

11. 12. 13.

14. 15.

16.

17. 18. 19. 20.

21.

22.

© Elsevier. Fotocopiar sin autorización es un delito.

23.

24. 25. 26. 27.

28.

Mari JA. Manual de redacción científica. 2003. 6.ª ed. Disponible en: http://caribjsci.org/ epub1/index.htm [acceso: 11/09/08]. Peh WCG, Ng KH. Why write? Singapore Med J. 2008;49:443-4. Majumdar SR, Roe MT, Peterson ED, Chen AY, Gibler WB, Armstrong PW. Better outcomes for patients treated at hospitals that participate in clinical trials. Arch Intern Med. 2008;168:657-62. Uniform requirements for manuscripts submitted to biomedical journals: Writing and editing for biomedical publication (updated February 2006). Disponible en: http://www. icjme.org/ [acceso: 11/09/08]. Silva G. La autoría múltiple y la autoría injustificada en los artículos científicos. Bol Of Sanit Panam. 1990;108:141-52. Thompson PJ. How to choose the right journal for your manuscript. Chest. 2007;132: 1073-6. Delgado López-Cózar E, Ruiz-Pérez R, Jiménez-Contreras E. Criterios MEDLINE para la selección de revistas científicas. Metodología e indicadores. Aplicación a las revistas españolas con especial atención a las de salud pública. Rev Esp Salud Publica. 2006;80: 521-51. De Granda Orive JI. Reflexiones sobre el factor de impacto. Arch Bronconeumol. 2003;39:409-17. Callahan M, Wears RL, Weber E. Journal prestige, publication bias, and other characteristics associated with citation of published studies in peer-review journals. JAMA. 2002;287:2847-50. Weale AR, Bailey M, Lear PA. The level of non-citation of articles within a journal as a measure of quality: A comparison to the impact factor. BMC Med Res Methodol. 2004;4:14. Anderson J, Belmont J, Cho CT. Journal impact factor in the era of expanding literature. J Microbiol Immunol Infect. 2006;39:436-43. The Thomson Scientific journal selection process. Disponible en: http://scientific.thomson. com/knowtrend/essays/selection ofmaterial/journalselection/ [acceso: 11/09/08]. Vilardell M, Rey-Joli C. Editorial. Med Clin (Barc). 2005;125(Supl 1):1-2. Begg C, Cho M, Eastwood S, Horton R, Moher D, Olkin L, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA. 1996; 276:637-9. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al., for the CONSORT Group. The revised CONSORT statement for reporting randomized trials: explanation and elaboration. Ann Intern Med. 2001;134:663-94. Cobos-Carbó A. Ensayos clínicos aleatorizados (CONSORT). Med Clin (Barc). 2005;125(Supl 1):21-7. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF, et al. Improving the quality of reports of meta-analyses of randomised controlled trials: The QUOROM statement. Lancet. 1999;354:1896-900. Urrutia G, Tort S, Bonfill X. Metaanálisis (QUOROM). Med Clin (Barc). 2005;125(Supl 1): 32-7. Fernández E. Estudios epidemiológicos (STROBE). Med Clin (Barc). 2005;125(Supl 1): 43-8. Altman DG, Bossuyt PMM. Estudios de precisión diagnóstica (STARD) y pronóstica (REMARK). Med Clin (Barc). 2005;125(Supl 1):49-55. Bossuyt PMM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al., for the STARD Group. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Ann Intern Med. 2003;138:4. McShane LM, Altman DG, Samerbrei W, Taube SE, Gion M, Clark GM. Reporting recommendations for tumor MARKer pronostic studies (REMARK). Nature Clin Pract Oncol.

&MBCPSBDJwOEFVONBOVTDSJUP

29. 30. 31. 32. 33. 34. 35.

36.

2005;2:416-22. Krimsky S, Rothenberg LS, Scott P, Kyle G. Financial interests of authors in scientific journals: A pilot study of 14 publications. Sci Eng Ethics. 1996;2:396-410. Davidson RA. Source of funding and outcome of clinical trials. J Gen Intern Med. 1986;1:155-8. Smith R. Medical journals and pharmaceutical companies: uneasy bedfellows. BMJ. 2003;326:1202-5. Campanario JM. Ventajas e inconvenientes de la Historia de la Ciencia como recurso en la enseñanza de las ciencias. Rev Ens Física. 1998;11:5-14. Zarin DA, Keselman A. Registering a clinical trial in ClinicalTrials.gov. Chest. 2007;131:909-12. Singer PA. Consent to the publication of patient information. Br Med J. 2004;329:566-8. General Medical Council. Confidentiality: protecting and providing information. Publishing case studies. Disponible en: www.gmc-uk.org/standards/confidentiality_faq.htm [acceso: 11/09/08]. Smith R. Informed consent: edging forwards (and backwards). BMJ. 1998;316:949-51.

&TUSVDUVSBFMBSUrDVMP PSJHJOBMZPUSPTUJQPT EFBSUrDVMP

© Elsevier. Fotocopiar sin autorización es un delito.

+."SHJNPO

El artículo es el elemento fundamental de la comunicación científica. No es la única forma de presentar los resultados de una investigación, pero sí la más valorada debido a que casi todas las revistas disponen de un sistema de evaluación orientado a valorar y filtrar las contribuciones que reciben para seleccionar las más relevantes, tratando de asegurar tanto la validez científica como la descripción objetiva y transparente de la investigación. Habitualmente, se entiende por «artículo científico» un informe publicado en una revista académica que describe un trabajo de investigación. Estos artículos suelen aparecer en la sección de originales. Sin embargo, en las revistas científicas existen otras maneras de aportar información de interés, aunque no constituyan exactamente aportaciones originales, como los artículos de revisión que analizan críticamente el estado del conocimiento en un área o tema concreto a partir de la literatura publicada, los artículos que presentan casos clínicos aislados o series de casos, los artículos de opinión, las cartas que comentan trabajos publicados por otros investigadores, etc. Además, cada revista tiene su propia especificidad y puede tener secciones en las que publican artículos de otro tipo, como reportajes o series, por ejemplo. Desde otro punto de vista, puede considerarse que existen dos tipos de colaboraciones en las revistas científicas. Por un lado, las enviadas voluntariamente por sus autores, que en general corresponden a trabajos originales, notas clínicas o cartas al director, y que son evaluadas por los órganos directivos y asesores de la revista para decidir si son aceptadas para su publicación. Por otro lado, las elaboradas por el propio consejo de redacción, el editor, el director o autores invitados, publicadas generalmente como editoriales, artículos de opinión o artículos especiales, secciones que, por lo común, no son accesibles para otros escritores. En este capítulo se comentan los aspectos generales de la estructura y el contenido de los artículos originales y, posteriormente, las características principales de otros tipos de artículo.

&MBCPSBDJwOEFVONBOVTDSJUP

"35Ê$6-003*(*/"El artículo original es el prototipo de artículo en que se plasman los resultados de una investigación. Sin embargo, esta definición genérica tiene que matizarse, añadiendo que el informe debe haber sido escrito y publicado de acuerdo con unas normas determinadas y que debe poder ser considerado como una publicación válida, es decir, que además de satisfacer todos los demás requisitos, debe haber sido aceptado y publicado en un medio adecuado (normalmente una revista científica primaria). Según el Council of Science Editors —antes Council of Biology Editors—: «Una publicación científica primaria aceptable debe ser la primera divulgación y contener información suficiente para que los colegas del autor puedan: a) evaluar las observaciones; b) repetir los experimentos, y c) evaluar los procesos intelectuales; además, debe ser susceptible de percepción sensorial, esencialmente permanente, estar a la disposición de la comunidad científica sin restricciones, y estar disponible también para su examen periódico por uno o más de los principales servicios secundarios reconocidos». Day reformula esta definición en términos más simples, indicando que una publicación primaria es: a) la primera publicación de los resultados de una investigación original; b) en una forma tal que los colegas del autor puedan repetir los experimentos y verificar las conclusiones, y c) en una revista u otra fuente documental fácilmente asequible dentro de la comunidad científica. Debe entenderse que la parte que se refiere a los «colegas del autor» alude al arbitraje antes de la publicación, es decir, que los artículos científicos deben aparecer en publicaciones que utilizan dicho arbitraje. La investigación científica demanda precisión, y su comunicación debería reflejar esta precisión en forma de claridad. Sin embargo, a menudo las publicaciones no alcanzan este ideal, y buena parte de las críticas que se les hace se deben a que muchos científicos no son capaces de transmitir sus hipótesis y conclusiones con claridad y sencillez. De hecho, debería dedicarse tanto esfuerzo a la organización y redacción adecuadas del artículo como el consagrado a realizar el estudio. Existen unas reglas estrictas para la redacción y publicación de artículos médicos, elaboradas por el Comité Internacional de Editores de Revistas Médicas (International Committee of Medical Journal Editors, ICMJE) y conocidas popularmente como «normas Vancouver», cuya finalidad principal es conseguir que la comunicación entre el investigador y el lector del trabajo sea coherente, clara y precisa. Un escritor novel puede sentir cierta extrañeza ante una estructura tan rígida, tan diferente de la forma de escribir en humanidades, pero este formato contribuye a una comunicación eficiente de los hallazgos de las investigaciones a una amplia comunidad científica de una manera uniforme. Además, el hecho de que las diferentes partes del artículo estén claramente destacadas y diferenciadas facilita que pueda ser leído a diferentes niveles (p. ej., título y resumen, o título, resumen, tablas y conclusiones). La estructura de un artículo original se conoce mediante el acrónimo IMRD, que representa las iniciales de sus apartados: Introducción, Material y métodos, Resultados y Discusión (tabla 3-1). Estos artículos constan, además, de refe-

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

Tabla 3-1. Formato IMRD de un artículo original

© Elsevier. Fotocopiar sin autorización es un delito.

Apartado

Finalidad

Contenidos

Características

Título

Indicar el contenido Atraer la atención

Corto, conciso y atractivo

Resumen

Sintetizar el estudio

Objetivo del estudio Aspectos clave del diseño Resultados principales Conclusión

Frases cortas y sencillas Autoexplicativo

I Introducción

Contextualizar y justificar el estudio Presentar la hipótesis

¿Qué se ha estudiado? Problema estudiado Antecedentes Motivo de realización del estudio Hipótesis planteada Objetivos del estudio

Brevedad

M Material y métodos

Describir la metodología del estudio

¿Cómo se ha realizado el estudio? Diseño del estudio Población estudiada Mediciones realizadas Materiales y procedimientos utilizados Aspectos éticos Análisis estadístico

Descripción suficientemente detallada para permitir la replicabilidad del estudio

R Resultados

Presentar los datos obtenidos

¿Qué se ha observado? Descripción de la población estudiada Resultados del análisis de los datos

Presentación de los datos sin interpretarlos Resaltar los datos relevantes Apoyarse en tablas y figuras

D Discusión

Interpretar los resultados Considerar si apoyan la hipótesis del estudio

¿Cómo se interpretan los resultados? Puntos fuertes y débiles del estudio Comparación con otros datos publicados Respuesta a la hipótesis del estudio Futuras líneas de investigación

No repetición de resultados Interpretación honesta Conclusión basada en los resultados

Referencias bibliográficas

Proporcionar una lista de la literatura relacionada

Documentos utilizados

Referencias seleccionadas Citación sin errores

rencias bibliográficas y título, y se acompañan de un resumen, y a veces de material adicional en forma de anexos o apéndices. El contenido concreto de cada uno de estos apartados depende en gran medida de las características del diseño del estudio que se presenta, de manera que se han elaborado reco-

&MBCPSBDJwOEFVONBOVTDSJUP

mendaciones y guías de publicación específicas para los diferentes tipos de investigación, que se comentan con detalle en la parte II de este libro. A continuación se comentan los aspectos generales de los diferentes apartados.

*OUSPEVDDJwO La introducción es la carta de presentación del artículo y sirve para que el lector conozca en qué se fundamenta el estudio, las razones que justifican su realización y sus objetivos. Debe responder a preguntas del tipo: ¿qué hemos estudiado?, ¿por qué es una pregunta importante?, ¿qué se sabía sobre el tema antes de hacer este estudio?, ¿en qué contribuirá este estudio a mejorar el conocimiento sobre dicho tema? La introducción debe redactarse pensando en resaltar la necesidad del estudio y estimular la curiosidad del lector. Una característica importante es la brevedad en la exposición. Debe centrar el tema sin hacer una revisión innecesariamente extensa, utilizando pocas citas bibliográficas, de actualidad y bien seleccionadas (en general, no más de la tercera parte del total). No debe presentar información genérica que se puede encontrar en cualquier texto de consulta. Si un lector ha decidido leer este artículo, es porque está interesado en el problema y ya conoce sus aspectos más generales, por lo que se le debe presentar la información específica del problema concreto que se ha estudiado. Una buena introducción debe incluir el marco teórico y el planteamiento del problema de investigación que se trata de resolver, presentando los antecedentes del trabajo, citando y comentando posibles estudios previos, analizando sus divergencias e identificando las lagunas de conocimiento existentes. Su estructura debe asemejarse a un triángulo invertido, cuya base se sitúa en la parte más alta con la información más general, para ir enfocando el tema en los aspectos más específicos estudiados, a medida que se va descendiendo. También deben comentarse las razones que han llevado a los investigadores a realizar el estudio, sin abrumar a los lectores con multitud de datos irrelevantes sobre la trascendencia del problema. Tampoco deben adelantarse acontecimientos, presentando, en este apartado, datos y conclusiones que se derivan del trabajo realizado, ni incluir explicaciones extensas sobre aspectos que serán comentados detalladamente en el apartado de «Discusión». El último párrafo de la introducción suele destinarse a enunciar el objetivo del estudio. Su definición explícita y clara facilita la comprensión del artículo, ya que el lector puede identificar con facilidad los aspectos más relevantes. Así, por ejemplo, en un ensayo clínico debería indicar claramente la enfermedad y la población objeto de estudio, las alternativas que se comparan y la variable de respuesta principal. En la tabla 3-2 se resumen los errores más frecuentes en la elaboración de la introducción de un artículo.

.BUFSJBMZNnUPEPT La finalidad de esta sección es describir el diseño de la investigación y cómo se ha llevado a cabo. Es el apartado más importante del artículo, el evaluado con

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

Tabla 3-2. Errores frecuentes en el apartado de «Introducción» de un artículo original

© Elsevier. Fotocopiar sin autorización es un delito.

t 3FBMJ[BSVOBSFWJTJØOFYIBVTUJWBEFMUFNB t $JUBSVOOÞNFSPFYDFTJWPEFSFGFSFODJBTCJCMJPHSÈGJDBT t $JUBSSFGFSFODJBTCJCMJPHSÈGJDBTEFQPDBBDUVBMJEBE t 3FBMJ[BSVOBSFWJTJØOIJTUØSJDBEFMBFOGFSNFEBE t &YQMJDBSMPRVFTFQVFEFFODPOUSBSFODVBMRVJFSUFYUPEFDPOTVMUB t /PKVTUJGJDBSFMFTUVEJP t "CSVNBSBMMFDUPSDPONVMUJUVEEFEBUPTJSSFMFWBOUFTTPCSFMBUSBTDFOEFODJBEFMQSPCMFNB t 0NJUJSFMPCKFUJWPPFOVODJBSMPEFGPSNBJOBEFDVBEB

mayor detalle en el proceso de revisión por los asesores de la revista y el más vulnerable para el rechazo de un manuscrito. Aunque habitualmente se denomina «Material y métodos», algunos autores consideran que no es un término adecuado cuando la investigación se ha llevado a cabo en seres humanos y sugieren denominarlo «Pacientes y métodos», o bien «Población y métodos» si se han estudiado sujetos presuntamente sanos, o incluso simplemente «Métodos». Este apartado debe incluir la información suficiente para que un lector pueda comprender adecuadamente todo el proceso de la investigación, y con el detalle suficiente para que otros investigadores puedan replicar el estudio. No en vano la reproducibilidad de los resultados se considera uno de los pilares fundamentales que dan solidez al conocimiento científico. Por lo tanto, el texto de este apartado debe organizarse de manera que el lector pueda comprender con claridad el esquema lógico de la investigación, incluyendo los párrafos correspondientes al diseño, los sujetos, las fuentes de información, las intervenciones, los instrumentos, las variables de respuesta, los procedimientos y la estrategia de análisis estadístico, describiendo los detalles de forma objetiva y transparente. Para facilitar la lectura, especialmente si el apartado es extenso, pueden utilizarse epígrafes específicos para cada uno de los bloques de información citados. El primer párrafo de este apartado se reserva para la descripción, en una o dos frases, del tipo de estudio realizado. A continuación se especifican y describen los criterios de inclusión y exclusión seguidos para seleccionar a la población de estudio. La definición de la enfermedad o exposición que se estudia es el criterio que debe presentarse con mayor precisión. Las finalidades de esta descripción son evaluar la adecuación de la población al objetivo del estudio, conocer en qué tipo de individuos se ha observado la presencia o ausencia del efecto o asociación estudiada, evaluar la posibilidad de extrapolar los resultados a otras poblaciones y permitir la replicabilidad del estudio. También debe describirse la procedencia de los sujetos, ya que, para una correcta interpretación de los resultados y valoración de su posible extrapolación, es necesario conocer si proceden de un centro de atención primaria o de un hospital, por ejemplo, así como la técnica utilizada para su captación, informando de los detalles que permitan conocer las características de la muestra de sujetos incluida (si son pacientes derivados desde otros niveles asistenciales, si se captan directamente de la consulta o a partir de algún sistema de registro, si

&MBCPSBDJwOEFVONBOVTDSJUP

existen filtros previos a su inclusión, etc.). En caso de haberse utilizado alguna técnica de muestreo, ésta debe describirse adecuadamente, así como el procedimiento utilizado para asignar los participantes a los grupos de estudio si se trata de un ensayo clínico. También es conveniente especificar el tiempo empleado en reunir a todos los participantes. El cálculo del tamaño de la muestra necesario es un aspecto importante del diseño de cualquier estudio, por lo que debe describirse con detalle cómo se ha determinado y qué asunciones se han realizado. Algunos autores y revistas prefieren presentar esta información conjuntamente con los aspectos del análisis estadístico. La descripción de las variables estudiadas debe incluir su definición, técnicas de medida y fuentes de información, y, si fuera necesario, estimaciones o comentarios acerca de su validez y precisión. Es importante describir cuidadosamente la arquitectura general del estudio, de manera que el lector pueda entender con claridad qué se ha hecho, indicando la pauta de visitas y qué actividades se han realizado en cada una de ellas, quiénes y cuántos eran los observadores, si ha existido entrenamiento previo de los mismos, qué mecanismos de reclutamiento de pacientes se han realizado, cómo se ha controlado la calidad de los datos recogidos, etc. Si el estudio evalúa la eficacia de un tratamiento, debe señalarse si ha existido un período de lavado o blanqueo previo a la intervención, las técnicas de registro de la presencia de reacciones adversas, los criterios utilizados para la retirada anticipada de sujetos, las técnicas de enmascaramiento utilizadas (simple ciego, doble ciego, triple ciego), etc. Además, también debe especificarse si el protocolo del estudio fue aprobado por el comité ético de investigación clínica correspondiente. La última sección de este apartado se reserva a la descripción de la estrategia de análisis y las técnicas estadísticas empleadas. Cuando se utilizan varias pruebas, ha de quedar claro en qué parte del artículo se utiliza cada una de ellas. Si las pruebas son de uso frecuente, no es necesario describirlas; pero si se trata de procedimientos sofisticados o de uso poco habitual, conviene incluir una breve explicación acompañada de una cita bibliográfica, preferiblemente de un libro de texto o un artículo de revisión sobre la prueba, ya que el artículo original, aunque tenga indudablemente un gran valor desde el punto de vista histórico y metodológico, suele ser muy complicado, difícil de localizar y ofrece pocos ejemplos prácticos. También se recomienda hacer constar el programa estadístico utilizado e indicar la naturaleza uni o bilateral de la hipótesis evaluada, así como el nivel de significación aceptado (habitualmente el 0,05). El estilo de este apartado debe ser directo, utilizando frases cortas y sencillas que describan el proceso de la investigación con claridad, transparencia, concisión y en la secuencia lógica. Dado que muchos grupos de investigación trabajan siempre siguiendo las mismas o parecidas metodologías, no resulta raro que esta sección sea muy similar en los trabajos que publican. A veces, la metodología puede describirse brevemente y remitir a los lectores a publicaciones previas en que se expone detalladamente. Algunas revistas aceptan publicar los protocolos de las investigaciones, lo que permite que los trabajos que presentan posteriormente los resultados puedan citarlos y describir el método de forma más concisa.

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

Tabla 3-3. Principales errores cometidos en la redacción del apartado de «Material y métodos» t /PJEFOUJGJDBSFMEJTF×PEFMFTUVEJP t $JUBSVOEJTF×PRVFOPTFDPSSFTQPOEFDPOFMSFBMNFOUFVUJMJ[BEP t 3FBMJ[BSEFTDSJQDJPOFTJOOFDFTBSJBTPTVQFSGMVBT t /PJEFOUJGJDBSFMVOJWFSTPPQPCMBDJØOEFSFGFSFODJB t /PEFTDSJCJSFMQSPDFTPEFDBQUBDJØOEFMPTTVKFUPT t %FGJOJSJOTVGJDJFOUFNFOUFMPTDSJUFSJPTEFTFMFDDJØOEFMPTTVKFUPT t /PQSFTFOUBSFMDÈMDVMPEFMOÞNFSPEFTVKFUPTOFDFTBSJPTPMBTBTVODJPOFTFO RVFTFIBCBTBEP t /PJOGPSNBSEFMQSPDFEJNJFOUPEFBTJHOBDJØOEFMPTTVKFUPTBMPTHSVQPTEFFTUVEJP (en los estudios experimentales) t %FGJOJSWBSJBCMFTRVFQPTUFSJPSNFOUFOPTFVUJMJ[BOFOFMBOÈMJTJT GSFDVFOUFFOBSUÓDVMPT RVFJOGPSNBOTPCSFBTQFDUPTQBSDJBMFTEFVOBJOWFTUJHBDJØONÈTBNQMJB

t &YQMJDBSEFUBMMBEBNFOUFWBSJBCMFTPQSVFCBTOPFTFODJBMFTQBSBFMFTUVEJP t 0NJUJSJOGPSNBDJØOOFDFTBSJBQBSBMBJOUFSQSFUBDJØOEFMFTUVEJPPVUJMJ[BSEFTDSJQDJPOFT incompletas t *ODMVJSJOGPSNBDJØORVFDPSSFTQPOEFBSFTVMUBEPT t 0NJUJSMBTQSVFCBTFTUBEÓTUJDBTVUJMJ[BEBT t /PEFTDSJCJSFMNÏUPEPFOVOPSEFOMØHJDP

En la tabla 3-3 se presentan los principales errores que se cometen al redactar este apartado.

© Elsevier. Fotocopiar sin autorización es un delito.

3FTVMUBEPT La finalidad de este apartado es presentar objetivamente los hallazgos de la investigación, pero sin interpretarlos. A algunos autores les cuesta mucho decidir qué información merece la pena incluir y, ante la duda, presentan toda la que han recogido. Publicar toda la información disponible no es señal de honestidad científica, sino de falta de criterio en la selección de la misma. Los resultados deben presentarse siguiendo una sucesión lógica, de acuerdo con la estrategia de análisis que se ha empleado. Es conveniente evitar la exposición excesivamente detallada y exhaustiva de los datos numéricos en el texto, y recurrir a su síntesis, organización y presentación en tablas y figuras, cuando sea adecuado, teniendo siempre en cuenta que su función es complementar el texto, no duplicarlo. El texto debería estar constituido por párrafos cortos que resalten los hallazgos principales, es decir, aquellos que se refieren a las hipótesis de trabajo y en los que se basarán las conclusiones, y remitir al lector a las tablas y figuras en las que encontrará adecuadamente organizados el resto de datos relevantes. Una buena estrategia es anotar en el borrador de cada tabla y figura uno o dos resultados clave, que serán los que puedan presentarse en el texto. Cabe recordar que el resultado de una prueba estadística no es en sí mismo un resultado clave, sino simplemente una herramienta que ayuda a entender cuál es el verdadero resultado, por lo que debe evitarse concederle una importancia excesiva. Los capítulos 4 y 5 están dedicados a la presentación de los resultados estadísticos y a la elaboración de las tablas y figuras. En la redacción de este apartado, y en la de todo el artículo, debe prestarse especial atención al uso inadecuado de términos como «normal», «aleatorio»,

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 3-4. Errores frecuentes en el apartado de «Resultados» t *ODMVJSJOGPSNBDJØOJSSFMFWBOUF t 0NJUJSJOGPSNBDJØOSFMFWBOUF t 1SFTFOUBSMPTSFTVMUBEPTTJOVOBTFDVFODJBMØHJDB t *OUFSQSFUBSMPTSFTVMUBEPTRVFTFQSFTFOUBO PBDPNQB×BSMPTEFPQJOJPOFTEFMPTBVUPSFT t %VQMJDBSMBJOGPSNBDJØOQSFTFOUBEBFOUBCMBT GJHVSBTPUFYUP t /PDJUBSUPEBTMBTUBCMBTZGJHVSBTRVFQSFTFOUBOSFTVMUBEPT t 1SFTFOUBSJOBEFDVBEBNFOUFMPTBTQFDUPTFTUBEÓTUJDPT — Presentar el grado de significación estadística sin indicar la prueba utilizada ( p huérfana) — Presentar estimaciones puntuales sin intervalos de confianza &YQSFTBSFMHSBEPEFTJHOJGJDBDJØOFTUBEÓTUJDBEFGPSNBEJDPUØNJDBTJHOJGJDBUJWP o no significativo (es preferible indicar el valor de p, especialmente cuando no está muy alejado del valor 0,05) — Presentar solamente el grado de significación estadística, sin una estimación de la magnitud de la diferencia, efecto o asociación 6UJMJ[BSVOOÞNFSPFYDFTJWPEFEFDJNBMFT QFK Q PFEBENFEJB B×PT

&YQSFTBSMPTSFTVMUBEPTFOQPSDFOUBKFTDVBOEPFMOÞNFSPEFDBTPTFTNVZSFEVDJEP QFK FOVOFTUVEJPTPCSFQBDJFOUFT FTDSJCJSFMEFMPTDBTPT

— Utilizar el símbolo ± sin indicar si corresponde a la desviación estándar, al error estándar o al intervalo de confianza — Utilizar el error estándar en lugar de la desviación estándar cuando se describe la distribución de una variable

«significativo» o «correlación», por ejemplo, que tienen un significado estadístico muy concreto, pero que se utilizan inadecuadamente con un significado menos técnico. La tabla 3-4 presenta los errores más frecuentes en el apartado de «Resultados».

%JTDVTJwO El apartado de «Discusión» es muy importante y requiere un gran esfuerzo intelectual y debate entre los coautores, ya que su finalidad es la de interpretar los resultados obtenidos a la luz de lo que se sabe sobre el tema, y explicar cómo se modifica dicho conocimiento al tener en cuenta las aportaciones del estudio. Sin embargo, dado que es el último apartado que se escribe y se suele tener prisa por finalizar el artículo, no se le presta toda la atención que merece. La redacción de este apartado debe estar muy vinculada con la introducción, aunque sin repetir lo que allí ya se ha escrito, comentando cómo se interpretan los resultados del estudio, destacando los aspectos más novedosos y relevantes, analizándolos con cautela, relacionándolos con las teorías subyacentes, comparándolos de forma objetiva con los hallazgos de otros estudios, y argumentando las conclusiones que se derivan, todo ello con honestidad y objetividad, manteniendo un equilibrio entre la sobrevaloración y la subestimación de la importancia de los propios hallazgos. La discusión debe basarse en la estimación de la magnitud del efecto y su relevancia clínica, y no simplemente en el grado de significación estadística. Aunque es recomendable comenzar el apartado con una recapitulación muy concisa de los hallazgos principales que constituyen la respuesta a la pregunta principal del estudio, para captar de este modo la atención del lector,

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

debe evitarse la tentación de convertirlo en una simple, inútil y pesada repetición de los resultados. También debe evaluarse la validez interna del propio estudio y comentar honestamente sus limitaciones. Nadie conoce mejor sus posibles fuentes de error que quien lo ha realizado. Por lo tanto, los autores deben ejercer una autocrítica honesta de su trabajo, señalando sus puntos fuertes y débiles, y realizando, cuando sea posible, recomendaciones para mejorar el método en estudios posteriores. Los resultados observados deben compararse con los de otros trabajos que han utilizado un diseño y metodología similares. Los estudios citados no deben haber sido seleccionados previamente en función de si los resultados son o no coincidentes con los observados en el propio trabajo. Por otro lado, la alusión a otras publicaciones debe hacerse con precisión, sin mutilar frases o palabras y exponiendo lo que el autor referenciado ha querido decir de verdad. Deben explicarse claramente, si existen, las diferencias entre el trabajo original y el de otros autores, tanto en el método seguido como en los resultados. No deben ocultarse las diferencias con los resultados obtenidos en otros trabajos, sino que hay que tratar de explicarlas o, si no es posible, admitir la incapacidad de hacerlo. También es preciso comentar los aspectos relacionados con la validez externa del estudio, es decir, el grado en que se pueden generalizar los resultados o extrapolarlos a otros contextos, exponiendo sus implicaciones teóricas y prácticas con prudencia e imparcialidad. Finalmente, deben indicarse las líneas futuras de investigación e incluir todas aquellas deducciones susceptibles de sustentar un futuro estudio, evitando frases como el manido «es necesario efectuar nuevas investigaciones en este campo» y, en cambio, especificando los aspectos concretos que convendría seguir trabajando. En la tabla 3-5 se presentan los errores más frecuentes que se cometen en este apartado.

© Elsevier. Fotocopiar sin autorización es un delito.

3FGFSFODJBTCJCMJPHSgGJDBT Las referencias bibliográficas son un elemento importante de un artículo científico. Siempre que se utilice información o datos procedentes de otro trabajo, es necesario citar la fuente, de manera que puedan consultarse los documentos en que se basan las afirmaciones que realiza el autor, lo que le añade credibilidad. Aunque en principio puede citarse cualquier tipo de fuente, muchas revistas no aceptan o desaconsejan el uso de algunos tipos de documento, como los resúmenes de comunicaciones a congresos, pósters, artículos de revistas de divulgación o informes privados. Muchos autores piensan que un mayor número de referencias bibliográficas conceden un mayor rigor científico al trabajo. Nada más alejado de la realidad. No deben citarse indiscriminadamente todos los artículos consultados por el mero hecho de haber tenido acceso a ellos, sino que deben seleccionarse los que se consideren más adecuados para que los lectores puedan evaluar los resultados (tabla 3-6). Asimismo, es más fácil publicar estudios poco voluminosos. A igualdad de interés, los editores prefieren artículos cortos en los que ha habido un trabajo previo, por parte de los autores, de selección de las mejores

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 3-5. Errores frecuentes en la elaboración del apartado de «Discusión» de un artículo original t 3FBMJ[BSVOBEJTDVTJØOHFOFSBM OPDFOUSBEBFOMPTSFTVMUBEPTEFMBJOWFTUJHBDJØO t $POWFSUJSMBEJTDVTJØOFOVOBSFWJTJØOEFMUFNB t 3FQFUJSEFUBMMBEBFJOOFDFTBSJBNFOUFMPTSFTVMUBEPTTJOJOUFSQSFUBSMPT t 3FQFUJSDPODFQUPTZBQMBOUFBEPTFOMBJOUSPEVDDJØO t &YBHFSBSMBJNQPSUBODJBEFMPTSFTVMUBEPTFODPOUSBEPT t $PODFEFSJNQPSUBODJBTPMBNFOUFBMBTJHOJGJDBDJØOFTUBEÓTUJDB TJOFWBMVBSMBNBHOJUVE del efecto observado t /PDPOGSPOUBSMPTSFTVMUBEPTDPOMPTEFPUSPTFTUVEJPT t /PSFMBDJPOBSMPTSFTVMUBEPTDPOMBTIJQØUFTJTZPCKFUJWPTEFMUSBCBKP t 3FBMJ[BSJOUFSQSFUBDJPOFTRVFOPTPODPIFSFOUFTDPOMPTSFTVMUBEPT t 3FBMJ[BSJOUFSQSFUBDJPOFTJOKVTUJGJDBEBTEFDBVTBMJEBEDVBOEPTFUSBUBEFTJNQMFT asociaciones t /PEJTDVUJSMBTMJNJUBDJPOFTEFMEJTF×PEFMFTUVEJP t )BDFSFYUSBQPMBDJPOFTZHFOFSBMJ[BDJPOFTOPKVTUJGJDBEBT t 3FBMJ[BSDPOKFUVSBTZDPNQBSBDJPOFTUFØSJDBTTJOGVOEBNFOUP t 1PMFNJ[BSJOOFDFTBSJBNFOUFZEFGPSNBUSJWJBM t &TDSJCJSVOBj%JTDVTJØOxEFNBTJBEPFYUFOTB t /PIBDFSSFDPNFOEBDJPOFTTPCSFGVUVSBTMÓOFBTEFJOWFTUJHBDJØO t "DBCBSMBj%JTDVTJØOxDPOVOSFTVNFOEFMUSBCBKP

y más novedosas referencias bibliográficas. Algunas revistas limitan el número de referencias según el tipo de artículo, por lo que conviene consultar esta información antes de empezar a redactar el trabajo. Por otro lado, debe tenerse en cuenta que las referencias bibliográficas de los artículos publicados son la base para el cálculo del factor de impacto bibliográfico, por lo que éstas deberían corresponder solamente a los artículos más relevantes. Además, este apartado tiene una gran influencia en el proceso de valoración de un manuscrito antes de su aceptación, y suele ser uno de los primeros que revisan los asesores, ya que proporciona una idea del esfuerzo realizado por los autores para identificar y localizar los artículos más relevantes y actuales sobre el tema. Es preferible evitar, en la medida de lo posible, la cita de libros de texto, de resúmenes de congresos y reuniones científicas, la autocitación injustificada y las observaciones o comunicaciones personales no publicadas. Si se quiere hacer referencia a trabajos aceptados, pero pendientes de publicación, pueden incluirse en la relación bibliográfica con la cita adecuada, y añadiendo «En prensa» entre paréntesis. Se recomienda incluir preferentemente artículos de los últimos 5 años, y en especial de los dos últimos años, y referencias fácilmente localizables. Otro aspecto clave es evitar los errores en la citación, por lo que es recomendable comprobar siempre las referencias con el original, para no omitir ninguna parte de la cita. Los errores en la transcripción de una referencia dificultan o impiden su localización por los lectores interesados. Estos errores se producen con más frecuencia cuando los autores copian referencias incluidas en otros trabajos sin haberlas leído, pudiendo llegar a perpetuarlos. También son errores comunes realizar afirmaciones sin citar la fuente que las fundamenta; defender conceptos ampliamente conocidos y aceptados con citas bibliográficas innecesarias; omitir las citas de mayor actualidad, las espa-

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

5BCMB Principales motivos para citar una referencia bibliográfica

© Elsevier. Fotocopiar sin autorización es un delito.

t *EFOUJGJDBSMPTUSBCBKPTDPOTVMUBEPTQPSFMBVUPS 5SBCBKPTRVFBQPZBOPSFGVUBOMBJOGPSNBDJØOQSFTFOUBEB — Trabajos de tema similar al expuesto 5SBCBKPTEFMPTRVFTFIBOPCUFOJEPEFUFSNJOBEPTGVOEBNFOUPTUFØSJDPTPUÏDOJDBT t 1FSNJUJSRVFFMMFDUPSTFJOGPSNFNÈTBGPOEP 5SBCBKPTRVFEFTBSSPMMBODPONBZPSFYUFOTJØOZQSPGVOEJEBEBTQFDUPTSFMFWBOUFT del estudio 5SBCBKPTSFMFWBOUFTRVFBZVEFOBFOUFOEFSFMNBSDPUFØSJDP MPTNÏUPEPTVUJMJ[BEPT los antecedentes, etc. — Justificar afirmaciones ya publicadas sin repetir las argumentaciones — Documentar el origen de la información presentada, proporcionando fiabilidad a la misma — Corregir o discutir las afirmaciones de otros autores — Reconocer los derechos de prioridad de autores precedentes y el trabajo de otros JOWFTUJHBEPSFTRVFIBODPOUSJCVJEPBMEFTBSSPMMPEFVODBNQPEFDPOPDJNJFOUP — Cumplir con el principio ético de no plagiar material ajeno

ñolas o las de grupos competidores o que defienden opiniones contrarias, o apoyar un concepto en una referencia que, o bien no lo desarrolla, o bien no lo hace en el sentido pretendido por los autores. El sistema más utilizado en el área de la biomedicina para citar la bibliografía es el que recomienda el ICMJE en sus requisitos de uniformidad para los manuscritos enviados a revistas biomédicas (www.icmje.org). Estas normas especifican cómo debe citarse cualquier tipo de documento, desde artículos de revistas, libros, prensa a documentos en soporte electrónico, por ejemplo. Las referencias deben citarse mediante un número (entre paréntesis o como superíndice) según el orden en que aparecen en el artículo. El listado de las referencias sigue este mismo orden. Este sistema tiene la ventaja de que no entorpece la lectura del texto y ahorra espacio a la publicación, pero tiene el inconveniente de que, si se añade o suprime una referencia o se modifica el orden en el texto, obliga a renumerarlas todas. Existen otros sistemas de citación. Según el conocido como «estilo de Harvard», por ejemplo, en el texto se cita por el apellido del autor o autores y el año de publicación, mientras que el listado de referencias se ordena alfabéticamente y, cuando el mismo autor tiene dos o más, cronológicamente. Tiene las ventajas de la comodidad para añadir o suprimir referencias y de que el lector conoce los autores que se van citando. En cambio, tiene el inconveniente de que puede entorpecer la lectura del trabajo. Este sistema suele utilizarse en las áreas de humanidades, ciencias sociales y psicología, mientras que en el área de la biomedicina suele recomendarse en las tesis y tesinas. Existe también un sistema mixto en que se elabora una lista alfabética de las referencias, que se numeran, y en el texto se citan por este número.

"QnOEJDFT Algunas revistas permiten la publicación, a veces solamente en la versión electrónica, de anexos o apéndices para presentar material adicional que, sin ser esencial para la comprensión del artículo, puede ayudar a clarificar algún as-

&MBCPSBDJwOEFVONBOVTDSJUP

pecto sin sobrecargar el texto. Este material puede corresponder a datos crudos, fotografías o imágenes adicionales, diagramas, explicación de fórmulas, cuestionarios utilizados para la recogida de datos, resultados detallados de algunos aspectos del análisis estadístico, etc.

3FTVNFO El resumen es muy importante en un artículo, ya que es lo primero —y a veces lo único— que se lee (después del título), lo que se recupera de la mayoría de bases de datos bibliográficas, e incluso todo lo que aparece en las publicaciones de los resúmenes de las jornadas y congresos científicos. Por ello, debe entenderse como una entidad independiente, autoexplicativa e inteligible en sí misma, que permite comprender un estudio en su totalidad. La elaboración del resumen tiene que ser muy cuidadosa, buscando un resultado final que permita a los lectores identificar la relevancia e interés que pueda tener el trabajo para ellos, y de este modo decidir si van a leer el artículo entero, o bien si optan por otro más acorde con sus necesidades. Por lo tanto, debe redactarse incorporando los aspectos más importantes de cada una de las secciones del artículo: una frase con el objetivo principal del estudio; una descripción del método utilizado en dos o tres frases, evitando presentar demasiados detalles, pero asegurando que incluye los elementos clave para comprender qué se ha hecho; resumir los resultados principales en otras dos o tres frases, incluyendo los datos cuantitativos referidos a la pregunta principal del estudio, y, por último, resaltar la conclusión y las principales implicaciones del estudio. El resumen supone un reto a la capacidad de síntesis del autor. Aunque es la primera sección que aparece en la publicación, debe escribirse después de haber finalizado el informe. Su estilo tiene que ser sencillo, las frases cortas y no desarrollar más de una idea. Deben evitarse las siglas, abreviaturas, referencias bibliográficas, tablas y figuras, y no debe incluir información que no aparezca en el texto del artículo. Una estrategia útil para su elaboración es seleccionar las frases clave de los diferentes apartados del artículo y disponerlas en la secuencia adecuada, para luego revisarlas y darles cohesión y claridad. Es importante revisar su contenido con minuciosidad y contrastarlo con el resto del artículo para evitar incorrecciones o contradicciones. La mayoría de publicaciones solicitan que el resumen se estructure en diversos apartados para facilitar su redacción, lectura y comprensión. Los epígrafes varían según la revista (tabla 3-7), y la extensión máxima suele limitarse a 250-300 palabras.

5rUVMP El título es lo primero que se lee de un artículo y puede ser la única información que aparezca en muchas bases de datos e índices. Por ello, si no es atractivo o no identifica el contenido del artículo con claridad y exactitud, muchos lectores no seguirán adelante y la difusión del artículo se verá reducida. Por estas razones, debe prestarse atención a la elección de las palabras que lo com-

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

ponen y a su sintaxis. Es importante incluir palabras que estén muy relacionadas con el contenido del artículo, como la molécula o el microorganismo estudiados, el tratamiento, la respuesta evaluada, etc., de manera que se facilite su identificación por parte de los lectores potenciales que buscarán, en las bases de datos, artículos que incluyan estos términos en el título. El título ha de ser claro, directo, explicativo, atractivo para llamar la atención al lector cuando dé un vistazo al sumario de la revista, breve y fiel al contenido del artículo. Debe utilizar términos precisos, específicos y unívocos, evitando incluir expresiones superfluas del tipo «Un estudio sobre...», «Observaciones sobre...», «Consideración acerca de...», «Reflexión sobre...». Además, no debe contener siglas, abreviaturas ni vocablos o locuciones que sólo tienen sentido en un área determinada, ya que pueden tener diferentes significados según el idioma o la especialidad, por ejemplo. El título tiene que ser conciso, pero no tan corto que sólo incluya términos vagos, genéricos e imprecisos y resulte incompleto o ambiguo. Por ejemplo, el título «Dieta y cáncer» no informa si el autor se ha centrado en un tipo especial de cáncer, o de dieta, o si ha explorado la dieta como un factor protector o de riesgo de contraer la enfermedad. En general, un título puede ser descriptivo o informativo. El primero simplemente destaca el objetivo de la investigación, mientras que el segundo suele informar sobre el resultado principal del mismo o su conclusión. Las revistas secundarias que publican comentarios críticos de otros artículos suelen preferir un título informativo. Además del título, muchas revistas solicitan un título corto (habitualmente de 30-40 caracteres como máximo) que pueda aparecer en el encabezamiento de las siguientes páginas del artículo.

1BMBCSBTDMBWF

© Elsevier. Fotocopiar sin autorización es un delito.

Muchas revistas solicitan una lista de términos relacionados con el contenido del artículo (habitualmente entre 3 y 6 palabras clave) que ayude a clasificar el trabajo en los índices y bases de datos bibliográficos. Es conveniente utilizar los términos del Medical Subject Headings (MeSH) (http://www.ncbi.nlm.nih.gov/mesh/meshhome.html), que es el vocabulario

5BCMB Relación entre el formato IMRD y el resumen estructurado Resumen estructurado Formato IMRD

4 encabezados

FODBCF[BEPT

Introducción

Antecedentes/Objetivo

Objetivo

Material y métodos

Método

Diseño Contexto/Emplazamiento Sujetos/Participantes Intervenciones Mediciones principales

Resultados

Resultados

Resultados

Discusión

Conclusiones

Conclusiones

&MBCPSBDJwOEFVONBOVTDSJUP

controlado que utiliza la National Library of Medicine de Estados Unidos para indexar los artículos para MEDLINE/PubMed.

"VUPSFT Ser autor de un artículo es sinónimo de participación activa en todas las fases del estudio, incluida su comunicación, de tal forma que se pueda discutir y defender públicamente el contenido del artículo. Las responsabilidades que definen la autoría se hallan bien delimitadas y son ampliamente conocidas: 1. Cada autor tiene que haber participado suficientemente en el trabajo representado por el artículo, de modo que pueda asumir la responsabilidad pública de su contenido. 2. La participación debe incluir tres aspectos: a) la concepción o el diseño del trabajo, y/o el análisis e interpretación de los datos, y/o la adquisición de datos; b) la escritura del artículo o la revisión crítica de su contenido, y c) la aprobación de la versión final del texto. 3. La participación única y exclusivamente en la recogida de datos no justifica la autoría. 4. Cada parte del contenido del artículo que sea de valor para fundamentar las conclusiones principales, así como cada fase del trabajo, tiene que poder ser atribuida como mínimo a un autor. 5. Las personas que han contribuido al desarrollo del trabajo, pero cuya colaboración no justifica la autoría, deben nombrarse en el apartado de agradecimientos, describiéndose el tipo de colaboración. Dichas personas deben dar su consentimiento para ser mencionadas. Según las normas Vancouver, cuando un artículo tiene múltiples autores, recomiendan citar los seis primeros e incluir al resto bajo la denominación et al. (del latín, et alii que significa «y otros»), lo que da una idea de lo restrictivo del criterio de autor. En los estudios multicéntricos en los que ha participado un grupo muy numeroso de investigadores, el grupo debe identificar a los responsables del manuscrito y el nombre del grupo. La National Library of Medicine indicará el nombre del grupo y el de los autores identificados como responsables de la autoría. Las revistas citarán generalmente al resto de investigadores en el apartado de agradecimientos o en un apéndice específico. El capítulo 21 desarrolla con más detalle los aspectos relacionados con la autoría.

"HSBEFDJNJFOUPT En una nota al pie de la primera página o en un apéndice al texto, según los requisitos de la revista, pueden especificarse los agradecimientos, que por regla general se darán por tres motivos: a) cualquier colaboración que no justifique la calidad de autor; b) la ayuda técnica, y c) la ayuda financiera y material, es-

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

pecificando su naturaleza, mencionando especialmente las relaciones financieras que puedan dar lugar a un conflicto de intereses. El elemento más importante de esta sección es la cortesía, y, por tanto, cualquier persona cuyo nombre aparece en este apartado debe estar informada de ello y haber dado su autorización.

© Elsevier. Fotocopiar sin autorización es un delito.

"35Ê$6-0%&3&7*4*Î/ Dado el gran volumen de literatura científica publicada, es importante disponer de artículos de revisión que sinteticen el estado actual del conocimiento sobre un tema concreto. Tradicionalmente, estos artículos llevan a cabo una actualización de alguna enfermedad en sus aspectos más generales, englobando su concepto, etiología, patogenia, cuadro clínico, diagnóstico, tratamiento y pronóstico, aunque también pueden limitarse a uno o varios de estos elementos. Suele tratarse de artículos encargados por el comité editorial de la revista a un experto en el tema, y suelen ir dirigidos a un público amplio, formado en gran parte por profesionales jóvenes o que no tienen la posibilidad de estar constantemente informados a través de otros medios. En su elaboración, el experto debe evitar la simple repetición de lo que ya está disponible en los libros de texto, centrándose en las novedades más recientes y los aspectos más controvertidos, y evitando un número excesivo de referencias bibliográficas. El mayor defecto de estas revisiones, denominadas narrativas, es la falta de sistematización en la recopilación de información y en la valoración de su calidad, por lo que muchas son subjetivas y científicamente irrelevantes. Por ello, en los últimos años ha ido adquiriendo una importancia cada vez mayor otro tipo de revisión, denominada sistemática, que corresponde a una síntesis de los estudios realizados sobre una pregunta concreta con la finalidad de proporcionar una respuesta basada en la mejor evidencia disponible, y que sigue en su elaboración una metodología rigurosa y explícita para la identificación, valoración crítica y síntesis de los estudios relevantes (tabla 3-8). Estos trabajos de revisión pueden considerarse verdaderos estudios de investigación realizados por iniciativa de sus autores, por lo que muchas revistas los publican en la sección de artículos originales. Por ello es importante decidir, en primer lugar, la revista a la que se va a enviar, con la finalidad de conocer el formato con que publica este tipo de estudios. Si se publica como artículo original, habitualmente se utiliza el formato IMRD, adaptando su contenido para incluir los aspectos más relevantes. Así, por ejemplo, en el apartado de «Material y métodos» deben describirse los criterios de selección de estudios, la estrategia de búsqueda bibliográfica, la evaluación de la calidad de los estudios y la extracción de los datos, así como los métodos estadísticos utilizados y los análisis de sensibilidad. Por su parte, el apartado de «Resultados» debe presentar los resultados de la búsqueda bibliográfica y del proceso de selección de estudios, las características principales de los incluidos y su calidad metodológica, los resultados de los estudios individuales y del metaanálisis propiamente dicho, de los análisis de subgrupos realizados y de los de sensibilidad. Es conveniente acompañar la descripción de los

&MBCPSBDJwOEFVONBOVTDSJUP

5BCMB Diferencias entre revisiones narrativas y sistemáticas Revisión narrativa

Revisión sistemática

Pregunta

A menudo amplia

A menudo una pregunta clínica concreta

Fuentes y búsqueda de datos

Habitualmente no especificadas Potencialmente sesgadas

Fuentes globales &TUSBUFHJBEFCÞTRVFEB explícita

Selección de estudios

Habitualmente no especificada Potencialmente sesgada

Basada en criterios uniformemente aplicados

Evaluación de los estudios

Variable

Crítica y rigurosa

Síntesis de datos

A menudo cualitativa

Cuantitativa

Inferencias

Algunas veces basadas en la evidencia

Habitualmente basadas en la evidencia

resultados con gráficos que resuman la evidencia presentada de forma directa e intuitiva. De forma similar a los originales, los artículos de revisión también suelen incorporar un resumen estructurado: a) «Propósito»: objetivo primordial del artículo de revisión; b) «Identificación de los datos»: resumen sucinto de las fuentes de información; c) «Selección de estudios»: número de estudios seleccionados y proceso de selección de los mismos; d) «Extracción de los datos»: criterios empleados para valorar la calidad de los estudios seleccionados y procedimiento de recogida de datos; e) «Síntesis de datos»: métodos utilizados para la síntesis cuantitativa y resultados clave, y f) «Conclusiones»: conclusiones clave, incluyendo aplicaciones potenciales y sugerencias para efectuar estudios adicionales.

&%*503*"-:05304"35Ê$6-04%&01*/*Î/ Inicialmente, el término editorial se refería a los mensajes del editor. Sin embargo, actualmente un artículo editorial puede tener otras funciones, como las revisiones críticas de temas científicos, especialmente centradas en un avance reciente o en una controversia, los comentarios de artículos originales que aparecen publicados en el mismo número de la revista, o incluso la posición política respecto a un tema. Habitualmente, este tipo de artículo es solicitado por el comité de redacción de la revista a personas que no son miembros del mismo, pero cuya categoría científica y experiencia garantizan que su criterio permitirá situar el tema del editorial en su justa perspectiva. La dificultad para elaborarlo estriba en la capacidad de síntesis necesaria para expresar de forma breve y concisa su opinión o posición respecto al tema, evitando entrar en detalles sobre aspectos colaterales, así como en el corto espacio de tiempo del que se dispone, ya que se trata de temas de actualidad, por lo que cualquier retraso puede suponer una pérdida de interés.

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

Un editorial bien escrito puede estimular a los lectores y ser el origen de un debate enriquecedor. A veces incluso se solicita un editorial a dos autores con opiniones distintas sobre el tema, con el fin de generar polémica y discusión sobre éste. Aunque aparentemente no sigue un formato concreto y carece de una estructura rígida, debe escribirse de forma cuidada, concisa y confiriendo al texto una secuencia lógica y clara. Suele iniciarse presentando el problema y haciendo una referencia al estado de los conocimientos que hay sobre el mismo hasta el momento, proponiendo las respuestas posibles. A continuación, en los párrafos centrales se presentan las pruebas que van a favor y en contra de dichas alternativas, exponiéndolas de forma resumida y citando los principales estudios que las respaldan. En el último párrafo se realiza una evaluación global de todas las pruebas y se presenta una reflexión personal y las conclusiones del autor sobre el tema.

© Elsevier. Fotocopiar sin autorización es un delito.

/05"$-Ê/*$" Una nota clínica consiste en la comunicación de una o más observaciones clínicas con el objetivo de realizar una aportación novedosa al conocimiento de la fisiopatología de una enfermedad, describir un caso único o casi único que parece representar un nuevo síndrome o enfermedad no descritos anteriormente o que presenta una asociación entre dos o más enfermedades o alteraciones que pueden representar una relación causal insospechada, presentar un estudio familiar o epidemiológico, describir un nuevo procedimiento técnico, presentar un conjunto de casos de una enfermedad peculiar, ya sea por su escasa frecuencia, su presentación clínica atípica o su evolución inhabitual, o describir efectos adversos o inesperados de un tratamiento. El contenido debe incluir la justificación de por qué el caso merece ser leído, su descripción con todos los datos relevantes, una discusión de la evidencia de que se trata de una observación única o inesperada, las posibles explicaciones alternativas de las características del caso, y la conclusión, con las implicaciones pertinentes. Su estructura es sencilla: a) una introducción con una pequeña revisión histórica y una definición de la enfermedad, hallazgo o técnica que va a presentarse; b) la descripción del caso o los casos, preferentemente de forma individual, presentando solamente los datos más relevantes de forma cronológica, y c) una discusión en que se comentan los motivos por los que estos casos se pueden considerar interesantes, se revisan las publicaciones de casos similares, exponiendo las discrepancias con los que se presentan, y se comentan las consecuencias que se derivan para la práctica clínica. Aunque tradicionalmente las notas clínicas han sido muy apreciadas por los profesionales y las revistas, hoy en día se discute mucho sobre la conveniencia de su publicación, de manera que han quedado relegadas a un segundo plano. Los autores deben evaluar honestamente si el caso es lo bastante extraordinario para justificar su publicación. Muchas revistas han aumentado el nivel de exigencia para su publicación e incluso se plantean la continuidad de esta sección.

&MBCPSBDJwOEFVONBOVTDSJUP

$"35""-&%*503 La mayor parte de las revistas científicas disponen de una sección de correspondencia en la que se publican las denominadas cartas al editor o al director, cuya finalidad principal es la de recoger aportaciones de los lectores que añaden información, muestran discrepancias o replican trabajos publicados previamente en la revista. El procedimiento habitual es que se remita la carta a los autores del artículo original, brindándoles la oportunidad de responder, de forma que la carta y la réplica aparezcan publicadas conjuntamente. Esta sección tiene la ventaja de su rápida publicación, enriquece el tema con aportaciones diferentes al estudio original, mantiene el interés de los lectores y establece relaciones entre investigadores distantes. Internet permite que actualmente estas cartas se publiquen con mayor facilidad y rapidez, lo que ha aumentado su interés. Otra utilidad de las cartas es la publicación de pequeñas investigaciones u observaciones clínicas que, por sus características, no se adaptan al formato de artículos más extensos, como los originales o las notas clínicas. Suelen denominarse cartas de investigación o cartas científicas, y pueden publicarse en una sección específica de la revista. La rapidez en su publicación, la facilidad de elaboración al requerir escaso texto y la posibilidad de su publicación en revistas prestigiosas ha hecho que sea una sección concurrida y recomendable para autores que deseen iniciarse en la publicación de trabajos. También se utilizan las cartas al director para dar a conocer trabajos en fases preliminares o para introducir temas controvertidos que permitan una confrontación de opiniones, añadiendo un grado de interés para la revista. Antes de escribir una carta es especialmente importante revisar las instrucciones dirigidas a los autores de la revista para consultar qué tipo de cartas se aceptan y qué restricciones se establecen para ellas en cuanto a extensión, número de autores, posibilidad de incluir tablas o figuras o el número de referencias bibliográficas. La estructura de las cartas es similar a la de los artículos convencionales, aunque desde luego de forma más concisa, sin secciones diferenciadas con titulares y adaptada al espacio que concede la revista. Sin embargo, la brevedad no exime la vigilancia en su calidad, y las cartas al director no deben considerarse una forma menor de comunicación científica.

053045*104%&"35Ê$6-0 Además de las secciones comunes a la mayoría de revistas que publican los artículos comentados anteriormente, pueden existir otras según la especificidad propia de cada revista, en las que se publican artículos de muy diferente índole, generalmente con una finalidad de formación continuada o la expresión de opiniones sobre un tema determinado. En muchas ocasiones se trata de artículos especiales que pueden recibir denominaciones diversas, en los que los autores tienen libertad para incluir su visión, a veces muy particular, sobre un tema que con frecuencia se desvía de lo estándar. Aunque habitualmente son de encargo, algunas revistas también

& 4 5 3 6 $ 5 6 3 " & - " 35 Ê $ 6 -0 0 3 * ( * / " - : 05 3 0 4 5 * 1 0 4 % & " 35 Ê $ 6 -0

suelen aceptar trabajos enviados libremente por sus autores. Por ello es especialmente importante conocer bien las revistas de la propia especialidad. También son frecuentes las series de artículos cortos, coordinadas por un profesional de prestigio, que van apareciendo en números sucesivos de la revista, y que suelen centrarse en temas como economía de la salud, farmacología, metodología, estadística, ética, etc.

© Elsevier. Fotocopiar sin autorización es un delito.

#*#-*0(3"'Ê"3&$0.&/%"%" Argimon Pallàs JM, Jiménez Villa J. Artículo original (I): Introducción. Aten Primaria. 1998;22:256-8. Argimon Pallàs JM, Jiménez Villa J. Artículo original (II): Material y métodos. Aten Primaria. 1998;22:387-90. Bekelman JE, Li Y, Gross CP. Scope and impact of financial conflicts of interest in biomedical research: A systematic review. JAMA. 2003;289:454-65. Chaudhry S, Schroter S, Smith R, Morris J. Does declaration of competing interests affect readers’ perceptions? A randomised trial. BMJ. 2002;325:1391-2. Clarke M, Alderson P, Chalmers I. Discussion sections in reports of controlled trials published in general medical journals. JAMA. 2002;287:2799-801. Davidoff F, DeAngelis CD, Drazen JM, Hoey J, Hojgaard L, Horton R, et al. Sponsorship, authorship, and accountability. Ann Intern Med. 2001;135:463-6. Day RA. Cómo escribir y publicar trabajos científicos. Washington: Organización Panamericana de la Salud; 1990. Egger M, Juni P, Bartlett C; CONSORT Group (Consolidated Standards of Reporting of Trials).Value of flow diagrams in reports of randomized controlled trials. JAMA. 2001;285:1996-9. Flanagin A, Fontanarosa PB, DeAngelis CD. Authorship for research groups. JAMA. 2002;288:3166-8. Huwiler-Muntener K, Juni P, Junker C, Egger M. Quality of reporting of randomized trials as a measure of methodologic quality. JAMA. 2002;287:2801-4. Huth EJ. Cómo escribir y publicar trabajos en ciencias de la salud. Barcelona: Ediciones científicas y técnicas; 1992. International Committee of Medical Journal Editors. Uniform requeriments for manuscripts submitted to biomedical journals. October 2001. Disponible en: http://www.icmje.org. Jiménez Villa J, Argimon Pallàs JM. Artículo original (III): Resultados. Aten Primaria. 1998;22:534-5. Jiménez Villa J, Argimon Pallàs JM. Artículo original (IV): Tablas y figuras. Aten Primaria. 1999;23:310-1. Laine C, Goodman SN, Griswold ME, Sox HC. Reproducible research: Moving toward research the public can really trust. Ann Intern Med. 2007;146:450-3. Medicina Clínica. Manual de estilo: publicaciones biomédicas. Barcelona: Doyma; 1993. Mowatt G, Shirran L, Grimshaw JM, Rennie D, Flanagin A, Yank V, et al. Prevalence of honorary and ghost authorship in Cochrane reviews. JAMA. 2002;287:2769-71. Ordóñez Gallego A, Espinosa Arranz E. La pervertida autoría. Med Clin (Barc). 1998;110:548-9. Pulido M. Obligaciones éticas de los autores: referencias bibliográficas, criterios de originalidad y publicación redundante y derechos de la propiedad intelectual. Med Clin (Barc). 1997;109:673-6. Raff H. A suggestion for the multiple author issue. Science. 2003;302:55-7. Rennie D, Yank V, Emanuel L. When authorship fails: A proposal to make contributors accountable. JAMA. 1997;278:579-85. Wilcox LJ. Authorship: The coin of the realm, the source of complaints. JAMA. 1998;280:216-7.

1SFTFOUBDJwOEFSFTVMUBEPT FTUBErTUJDPTZFMBCPSBDJwO EFUBCMBT ++JNnOF[

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ La finalidad de un artículo científico es presentar un estudio de investigación y comunicar de forma completa e inequívoca sus resultados. Éstos son la base sobre la que se escribe, se discute y se crean nuevas conjeturas e hipótesis como parte del proceso continuo de investigación, por lo que el apartado dedicado a su presentación, aunque suele ser uno de los más cortos en extensión, es clave y debe prestarse un especial cuidado a su elaboración. Por ello sorprende la frecuencia con que los resultados se comunican de forma deficiente; incluso aparecen errores, no sólo en la forma en que se presentan, sino también de tipo estadístico, poniendo en entredicho la calidad de los resultados y las conclusiones que de ellos se derivan. Algunos de los errores relacionados con el uso de la estadística se derivan de la complejidad de los métodos utilizados, por lo que es conveniente contar con la colaboración de un estadístico. Sin embargo, otros muchos defectos se deben simplemente al desconocimiento de algunas reglas básicas que todo investigador debería conocer. En el apartado de «Resultados» deben comunicarse las observaciones realizadas durante el estudio. No hay que limitarse a comunicar los resultados de las pruebas estadísticas, sino que debe incluir toda la información relevante sobre los sujetos estudiados, los no incluidos y los motivos de su no inclusión, las pérdidas de seguimiento y los abandonos, etc.; es decir, toda la información que pueda ser de interés para valorar la representatividad de la muestra estudiada y la comparabilidad de los grupos, si procede, así como la posibilidad de generalizar y extrapolar los resultados a otros contextos. Sin embargo, no se deben presentar todos los datos de forma indiscriminada, sino seleccionar los que sean relevantes, es decir, los relacionados con los objetivos del estudio.

&MBCPSBDJwOEFVONBOVTDSJUP

El autor debe presentar solamente los hechos objetivos, sin discutirlos, interpretarlos ni analizar sus implicaciones, aspectos que se dejan para la «Discusión». Es preciso que los datos sean presentados siguiendo una secuencia lógica que muestre, primero, los resultados principales y, después, los análisis secundarios por orden de relevancia, apoyándose en tablas y figuras cuando sea necesario. Este capítulo se centra en la presentación de los resultados estadísticos y la elaboración de tablas, dejando los aspectos relacionados con los gráficos para el siguiente.

13&4&/5"$*Î/%&%"504/6.c3*$04 Antes de comentar los aspectos específicos relacionados con la presentación de los resultados estadísticos, es conveniente realizar algunas consideraciones generales sobre la comunicación de los datos numéricos (tabla 4-1). Uno de los problemas más frecuentes es la presentación de un volumen excesivo de resultados. Los autores no deben comunicar todos los datos simplemente por el hecho de haberlos recogido, sino que deben seleccionarlos y presentar solamente los relevantes, es decir, los que han de ayudar a interpretar los resultados y a responder a las preguntas del estudio. Es conveniente no dejar esta selección para el final, sino que debería haberse previsto ya al diseñar el plan de análisis que forma parte del protocolo del estudio. Incluir todos los datos, sin omitir ninguno, no es prueba de honestidad científica, sino de que se carece de capacidad de discriminación. Por otro lado, esta selección no implica que solamente deban presentarse los resultados estadísticamente significativos, sino que deben comunicarse todos los que sean relevantes, incluso aunque se hayan obtenido resultados negativos que no satisfagan las hipótesis previas. Un aspecto que suele preocupar a los autores es si deben escribir los números con cifras o con palabras. Aunque la decisión es una cuestión de estilo y puede variar según la revista en que se desee publicar el artículo, existen algunas consideraciones generales que deben tenerse en cuenta. La expresión en letras es más elegante, pero en los textos científicos suele preferirse la utilización de cifras debido a su mayor claridad, si bien cuando se trata de números entre el uno y el diez, pueden expresarse también con todas sus letras. Con frecuencia, los datos numéricos se exponen con una precisión excesiva e innecesaria, simplemente porque aparecen así en los resultados de los cálcuTabla 4-1. Problemas generales frecuentes en la presentación de datos numéricos t 1SFTFOUBSEFNBTJBEPTEBUPT t 1SFTFOUBSTPMBNFOUFMPTSFTVMUBEPTFTUBEÓTUJDBNFOUFTJHOJGJDBUJWPT t &YQSFTBSMPTEBUPTDPOOÞNFSPTPMFUSBT t 1SFDJTJØOFYDFTJWB t "VTFODJBEFEFOPNJOBEPSFT t 6TBSFMTJHOPTJOJOEJDBSBRVÏNFEJEBQSFDFEF t 1PTJCMFDPOGVTJØOFOFMVTPEFMPTHVJPOFT t /PQSFTFOUBSUPEPTMPTEBUPTEFUPEPTMPTTVKFUPT t 6TPJODPSSFDUPEFQBMBCSBTDPOTJHOJGJDBEPUÏDOJDP

© Elsevier. Fotocopiar sin autorización es un delito.

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

los estadísticos. Sin embargo, esta práctica es indeseable, y los datos deben presentarse con el grado adecuado de precisión. Por ejemplo, decir que el promedio de edad de un grupo de sujetos es de 64,476 años solamente añade confusión, ya que en general, para la mayoría de finalidades, es suficiente con decir que es de 64,5 años, valor que además facilita una rápida comprensión al lector. De hecho, la mayoría de las personas asimilan los números con uno o dos dígitos significativos con mucha mayor rapidez y facilidad que los que tienen tres o más. Por lo tanto, redondear los valores a dos dígitos significativos suele mejorar la comunicación. Así, por ejemplo, reconocer que la población de referencia de un centro ha aumentado aproximadamente 3 veces es más fácil cuando se indica que ha pasado de aproximadamente 20.000 a 62.000 habitantes, que si se dice que ha aumentado de 19.954 a 62.281 personas. Sin embargo, este redondeo de los valores debe hacerse cuando se presentan, no cuando se analizan, ya que supondría una pérdida de información que podría afectar a la calidad de los resultados. Este problema también aparece con frecuencia al exponer los resultados de las pruebas estadísticas, por ejemplo, al presentar p = 0,0000002 o t = 1,86543. Habitualmente es suficiente con dos decimales, y, en el caso del valor de p, el menor que suele ser necesario informar es el de p < 0,001. Muchos datos se presentan como porcentajes, tasas, promedios o cocientes. Es imprescindible mostrar claramente los denominadores sobre los que se han calculado, ya que en caso contrario puede resultar imposible interpretarlos correctamente. Además, si el número de casos es muy reducido, es preferible evitar el uso de porcentajes y decimales que son una fuente potencial de confusión. Es más claro y comprensible decir, por ejemplo, que, de tres sujetos estudiados, uno murió, que decir que la mortalidad observada fue del 33,33%. Una fuente habitual de confusión en las publicaciones es la incerteza sobre el significado de un intervalo identificado por el símbolo ± cuando no se indica a qué medida corresponde el valor al que precede, ya que puede tratarse tanto de la desviación estándar (DE) como del error estándar (EE), o incluso puede ocurrir que el intervalo corresponda al intervalo de confianza (IC) del 95%. La interpretación es muy diferente en las tres situaciones, como se comenta más adelante. El uso de los guiones también puede ser motivo de confusión, ya que puede referirse tanto a valores negativos como a un rango o intervalo. Su significado es fácil de identificar cuando los valores negativos no son posibles, como ocurre cuando alude, por ejemplo, al número de sujetos o a su edad (p. ej., rango de edad: 18-64 años) o a un parámetro bioquímico, o incluso al IC de una medida relativa, como el riesgo relativo (RR) (p. ej., IC del 95% RR: 0,7-4,2) o a la odds ratio (OR). Sin embargo, puede prestarse a confusión cuando corresponden a datos en que los valores negativos son posibles, como cuando se refiere al IC de una diferencia entre dos grupos, en cuyo caso es preferible evitar el uso de guiones. Así, por ejemplo, es preferible mostrar el IC del 95% de una reducción absoluta de riesgo (RAR) con la expresión −3 a 12%, que con la expresión −3-12%, que puede ser fácilmente malinterpretada. Otro aspecto general importante es que deben comunicarse todos los datos de todas las unidades de estudio. Si no se informa sobre los datos ausentes, los

&MBCPSBDJwOEFVONBOVTDSJUP

sujetos con datos incompletos y los abandonos, por ejemplo, y cómo han sido tenidos en cuenta, pueden producirse importantes sesgos en la interpretación e incluso suscitar dudas acerca de la calidad del trabajo. Esta información es tan importante que la declaración CONSORT recomienda mostrar un diagrama de flujo con el seguimiento de los sujetos en los informes de los ensayos clínicos, y otras guías realizan recomendaciones similares para otros tipos de estudio. Debe indicarse también qué estrategia se ha seguido en el análisis para evaluar su posible influencia sobre los resultados (p. ej., comparaciones de las características de los sujetos incluidos con las de los no incluidos, análisis de sensibilidad bajo diferentes asunciones, análisis por intención de tratar, etc.). Finalmente, es conveniente restringir a su uso técnico palabras con significado estadístico como «significativo», «aleatorio», «normal», «correlación», «muestra», etc., que pueden llevar a confusión si se usan con otros significados.

13&4&/5"$*Î/%&3&46-5"%04&45"%Ê45*$04 El uso de la estadística en la investigación clínica y epidemiológica ha experimentado un desarrollo tan espectacular en los últimos años, que está provocando cierto desánimo entre los autores y los lectores de las revistas biomédicas, que se sienten impotentes para aplicar e interpretar correctamente los procedimientos estadísticos cada vez más complejos que aparecen en los artículos científicos. Ello ha conducido en múltiples ocasiones a la mera emulación, a menudo fuera de lugar, de los métodos que han utilizado otros investigadores, aunque las preguntas que se intentan contestar o las características de los datos recogidos sean muy diferentes. Parece que si un artículo no presenta suficientes valores de p e informa del uso de técnicas estadísticas complejas o multivariantes y programas sofisticados, el estudio carece del suficiente rigor científico. Además, la disponibilidad y facilidad de uso de los paquetes estadísticos informáticos constituyen un arma de doble filo, ya que ponen procedimientos estadísticos complejos al alcance de muchos profesionales que carecen de los conocimientos necesarios para utilizarlos e interpretarlos correctamente. La finalidad del análisis estadístico es ayudar a comprender los hallazgos de un estudio y determinar qué existe objetivamente en ellos, evaluando si una variable tiene un efecto específico, si varios factores están relacionados entre sí o si existen determinadas diferencias entre los grupos que se comparan, por ejemplo, y así poder responder a la pregunta de investigación. Aunque este capítulo se centra preferentemente en la presentación de los resultados, no debe olvidarse que la aplicación de los métodos estadísticos no se limita al análisis de los datos, sino que debe realizarse a lo largo de todo el proceso de investigación médica con el fin de garantizar su calidad (predeterminación del tamaño de la muestra, procedimiento de selección de los sujetos, elección y valoración de los instrumentos de medida, etc.). Sin embargo, a pesar de la omnipresencia de las técnicas estadísticas en investigación biomédica, todavía no son suficientemente comprendidas por la mayoría de profesionales y son frecuentes los errores en su utilización, por lo

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

que en muchos casos podría parecer que la estadística se ha convertido más en un estorbo que en una ayuda. Sin embargo, los procedimientos estadísticos son simplemente herramientas, y no una finalidad en sí mismos. En la tabla 4-2 se enumeran los veinte errores estadísticos más frecuentes en la literatura biomédica, que no son más que la punta del iceberg.

&TUBErTUJDPTEFTDSJQUJWPT Los estadísticos descriptivos permiten sintetizar conjuntos de datos y presentarlos de una forma sencilla. Se utilizan habitualmente como el primer paso del análisis y comunicación de los resultados de un estudio, al reducir grandes cantidades de datos a unos pocos y más manejables. Los datos categóricos suelen expresarse como porcentajes. Al presentarlos, es conveniente indicar también los numeradores y denominadores de los cálculos, para no perder la perspectiva, ya que no es lo mismo un porcentaje del 20% cuando se refiere a uno de 5 sujetos, que a 100 de 500. Además, cuando el número de sujetos es reducido, suele ser preferible indicar los valores absolutos sin calcular los porcentajes. Así, por ejemplo, si se han estudiado 6 sujetos y 3 de ellos presentan una determinada característica, es preferible decir que la

© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 4-2. &SSPSFTFTUBEÓTUJDPTGSFDVFOUFTFOMPTBSUÓDVMPT EFJOWFTUJHBDJØOCJPNÏEJDB t 1SFTFOUBSWBMPSFTDPOQSFDJTJØOJOOFDFTBSJB t %JWJEJSEBUPTDPOUJOVPTFODBUFHPSÓBTPSEJOBMFTTJOFYQMJDBSFMQPSRVÏOJFMDØNP t 1SFTFOUBSNFEJBTEFHSVQPTQBSBEBUPTBQBSFBEPTTJOFYQPOFSMPTDBNCJPTJOUSBQBSFKBT t 6UJMJ[BSJODPSSFDUBNFOUFMPTFTUBEÓTUJDPTEFTDSJQUJWPT t 6UJMJ[BSFMFSSPSFTUÈOEBSEFMBNFEJB &&. DPNPFTUBEÓTUJDPEFTDSJQUJWPPDPNPNFEJEB de precisión de una estimación t 1SFTFOUBSTPMBNFOUFMPTWBMPSFTEFp de los resultados t /PDPOGJSNBSRVFMPTEBUPTDVNQMFOMBTBTVODJPOFTEFMBTQSVFCBTFTUBEÓTUJDBTVUJMJ[BEBT QBSBBOBMJ[BSMPT t 6UJMJ[BSFMBOÈMJTJTEFSFHSFTJØOMJOFBMTJOFTUBCMFDFSTJMBSFMBDJØOFTSFBMNFOUFMJOFBM t /PQSFTFOUBSUPEPTMPTEBUPTZUPEPTMPTQBDJFOUFT t /PJOGPSNBSTJTFIBOSFBMJ[BEPBKVTUFTQBSBMBTDPNQBSBDJPOFTNÞMUJQMFT PDØNPTFIBOIFDIP t 1SFTFOUBSJOOFDFTBSJBNFOUFDPNQBSBDJPOFTFTUBEÓTUJDBTEFMBMÓOFBCBTBM FOMPTFOTBZPTDMÓOJDPT t /PEFGJOJSjOPSNBMxPjBOPSNBMxDVBOEPTFJOGPSNBEFMPTSFTVMUBEPT de pruebas diagnósticas t /PFYQMJDBSDØNPTFIBOUSBUBEPMPTWBMPSFTJODJFSUPT FRVÓWPDPT EFMBTQSVFCBT EJBHOØTUJDBTBMDBMDVMBSTVTDBSBDUFSÓTUJDBT UBMFTDPNPTFOTJCJMJEBEZFTQFDJGJDJEBE

t 6UJMJ[BSUBCMBTZGJHVSBTTPMBNFOUFQBSBjBMNBDFOBSxEBUPTZOPQBSBBZVEBSBMPTMFDUPSFT t 6UJMJ[BSVOHSÈGJDPPVOBGJHVSBFOMPTRVFFMNFOTBKFWJTVBMOPDPODVFSEBDPOFMEFMPTEBUPT FORVFTFCBTB t $POGVOEJSMBTjVOJEBEFTEFPCTFSWBDJØOxBMQSFTFOUBSFJOUFSQSFUBSMPTSFTVMUBEPT t *OUFSQSFUBSFTUVEJPTDPOSFTVMUBEPTOPTJHOJGJDBUJWPTZCBKBQPUFODJBFTUBEÓTUJDBDPNP jOFHBUJWPTx DVBOEPEFIFDIPTPOOPDPODMVZFOUFT t /PEJTUJOHVJSFOUSFFTUVEJPTQSBHNÈUJDPT FGFDUJWJEBE ZFYQMJDBUJWPT FGJDBDJB BMEJTF×BS FJOUFSQSFUBSMBJOWFTUJHBDJØO t /PQSFTFOUBSMPTEBUPTFOVOJEBEFTDMÓOJDBNFOUFÞUJMFT t $POGVOEJSTJHOJGJDBDJØOFTUBEÓTUJDBDPOJNQPSUBODJBDMÓOJDB "EBQUBEBEF-BOH

&MBCPSBDJwOEFVONBOVTDSJUP

presentan 3/6, que no que lo hace el 50% de los casos, ya que este último valor se presta a errores de interpretación. Si la variable no tiene un elevado número de categorías, suele ser preferible presentar los datos en texto y no malgastar una tabla para hacerlo. Si las categorías corresponden a los intervalos en que se ha dividido una escala cuantitativa (p. ej., edad, altura, peso, etc.), debe comprobarse que son mutuamente excluyentes e indicar con claridad cuáles son los valores límite entre ellos, evitando cualquier solapamiento. Los autores tienen que ser conscientes de que se reduce la cantidad de información que proporciona la variable, por lo que deberían justificar por qué lo hacen y cómo han seleccionado los límites, ya que, en función de los intervalos elegidos, podrían favorecerse determinados resultados. Cuando se sintetiza una variable continua, deben presentarse las medidas de tendencia central y dispersión adecuadas según el tipo de distribución de los datos. Así, cuando ésta es aproximadamente normal, deben utilizarse la media aritmética y la DE, mientras que cuando no lo es, lo más adecuado es mostrar la mediana y la amplitud o el rango intercuartílico. Cuando los valores siguen la distribución normal, la media y la DE tienen un significado muy concreto. Así, por ejemplo, si la edad de una muestra de 100 pacientes tiene una media de 60 años y una DE de 5 años, asumiendo que sigue una distribución normal, estos estadísticos descriptivos indicarían que el 68% de los sujetos de la muestra tendrían una edad entre 55 y 65 años (media ± DE), y que el 95% estarían entre los 50 y los 60 años (media ± 2 DE). Un error frecuente en la literatura biomédica es sintetizar datos cuantitativos presentando la media aritmética acompañada del error estándar de la media (EEM) en lugar de la DE. El EEM es una medida de precisión de la estimación de la media poblacional, por lo que no es un estadístico adecuado para describir la distribución de los valores de una variable, y no debe utilizarse como tal. Cuando la finalidad es descriptiva, la media debe acompañarse de la DE, que indica la variabilidad de la distribución de los valores observados en una muestra alrededor de su media. Sin embargo, algunos autores presentan incorrectamente el EEM en lugar de la DE, intentando dar así una falsa imagen de una menor variabilidad de las observaciones, ya que el EEM es menor que la DE. En el ejemplo anterior, el valor «60 años» es también la mejor estimación disponible de la media de edad de los sujetos de la población de la que procede la muestra estudiada. El valor del EEM, en este caso, es de 0,5 años (menor que la DE), por lo que los límites del IC del 95% son aproximadamente 59 y 61 años (media ± 2 EEM), lo cual indica que si se obtuvieran aleatoriamente muestras similares de esta población, aproximadamente el 95% de ellas tendrían una media de edad situada entre estos valores. Como se ha comentado con anterioridad, una fuente frecuente de confusión en las publicaciones es la incerteza sobre el significado de un intervalo, alrededor de la media, identificado por el símbolo ± cuando no se indica a qué medida corresponde el valor al que precede (DE, EEM, IC del 95%). Cuando la finalidad es descriptiva, la medida de dispersión adecuada es la DE y ha de quedar explícito para evitar errores de interpretación.

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

Cuando la distribución de los datos se aleja de la normal, la medida de posición central más adecuada es la mediana (percentil 50), ya que no está tan influida por los valores extremos como la media aritmética. En esta situación, la dispersión puede describirse mediante la amplitud o rango (habitualmente expresada con los valores mínimo y máximo observados) o el recorrido intercuartílico (diferencia entre el primer y tercer cuartil, es decir, entre los percentiles 25 y 75, que abarca el 50% central de la distribución de valores), ya que la DE, al calcularse en relación con la media aritmética, no es una medida de dispersión adecuada y carece del significado que tiene en caso de una distribución normal. Por otro lado, cuando el número de observaciones es pequeño, a veces puede ser preferible presentar todos los datos, ya que los estadísticos descriptivos pueden llevar a confusión.

© Elsevier. Fotocopiar sin autorización es un delito.

&TUJNBDJwOEFVOQBSgNFUSP La finalidad de muchas investigaciones es estimar el valor de un parámetro poblacional a partir del estudio de una muestra de sujetos. Basándose en la premisa de que lo que es cierto para una muestra (seleccionada aleatoriamente), también lo es para la población de la que procede, se utilizan las medidas de las características observadas en la muestra para estimar el valor de esas mismas características en la población de origen (estimación puntual). La precisión de esta estimación depende de la variabilidad asociada con las técnicas de medida (error de medida), el tamaño y la representatividad de la muestra (error de muestreo) y la variabilidad biológica inherente de la propia característica (error aleatorio). La cantidad de variación asociada a una estimación suele expresarse en forma de intervalo de confianza (IC), que corresponde a un rango de valores, consistente con los datos, que se cree que incluye el verdadero valor poblacional, con una confianza determinada (habitualmente del 95%), proporcionando una idea de la bondad o precisión de la estimación: cuanto más estrecho es el IC, mayor es esta precisión. Por ello, cuando se desea estimar un parámetro poblacional, no es suficiente con presentar solamente el valor observado en la muestra, que corresponde a la estimación puntual, sino que éste debe acompañarse siempre de un IC. Cuando se presenta un IC, es preferible indicar cuáles son sus límites en lugar de expresarlo en la forma «media ± EEM», o incluso «media ± 1,96 EEM» (que es la fórmula habitual de cálculo del IC del 95%), ya que se facilita la comprensión sin obligar al lector a realizar los cálculos. Así, es preferible decir, por ejemplo, que la prevalencia media de úlceras de decúbito en los servicios de un hospital es del 8,4% (IC del 95%: 7,2 a 9,6%), que no expresarla como 8,4% (IC del 95%: ± 1,2%). Además, se evita una posible interpretación errónea del símbolo ±.

4JHOJGJDBDJwOFTUBErTUJDB A pesar de que la literatura biomédica está llena de valores de p y de las expresiones «estadísticamente significativo» y «estadísticamente no significativo», su

&MBCPSBDJwOEFVONBOVTDSJUP

significado e implicaciones suelen ser mal entendidos con frecuencia. Así, una probabilidad o un valor de p inferior a 0,05 (estadísticamente significativo) suele interpretarse de forma incorrecta como prueba de que un tratamiento es efectivo, por ejemplo, y un valor de p superior a 0,05 (estadísticamente no significativo) como prueba de que no lo es.

1SVFCBTEFDPOUSBTUFEFIJQwUFTJT Los valores de p están relacionados con las pruebas de significación estadística o de contraste de hipótesis (tabla 4-3). Habitualmente, esta hipótesis se refiere a la relación entre dos o más variables, y será rechazada o aceptada en función de los resultados del estudio. El valor de p no proporciona una respuesta positiva o negativa, sino que ayuda a interpretar los resultados. Por ello, los aspectos relacionados con este contraste deben quedar claramente descritos en el artículo. Así, en la introducción, debe estar explícita la hipótesis principal del estudio, mientras que en la sección de métodos debe especificarse, entre otros aspectos, el valor de la mínima diferencia entre los grupos que se considera de relevancia clínica, lo que ayudará a interpretar correctamente los resultados teniendo en cuenta las implicaciones clínicas, y a mantener las pruebas estadísticas en perspectiva, además de ser un elemento necesario para la determinación del número de sujetos necesarios. También es preciso especificar el nivel alfa elegido como umbral para decir que un resultado es estadísticamente significativo (por regla general se establece en el 0,05), así como la potencia estadística del estudio. Existen múltiples pruebas estadísticas (tabla 4-4), y es importante especificar las que se utilizan. Cada una de ellas se basa en unas asunciones determinadas, y debe hacerse constar si se ha evaluado su cumplimiento. Son errores frecuentes la utilización de pruebas paramétricas cuando las variables no siguen una distribución normal, o el uso de pruebas para datos independientes cuando en realidad son datos apareados. También es importante reflejar si las hipótesis contrastadas son uni o bilaterales, así como el paquete estadístico utilizado. Si se trata de pruebas sofisticadas, complejas o de uso poco frecuente, es conveniente proporcionar una referencia bibliográfica que la describa, preferiblemente actual, ya que las descripciones originales suelen ser antiguas, difíciles de obtener y excesivamente técnicas.

Tabla 4-3. 5JQPTEFFSSPSZSJFTHPTBTPDJBEPTFOVODPOUSBTUFEFIJQØUFTJT Realidad &YJTUF diferencia )PGBMTB

Resultado de la prueba

/PFYJTUF diferencia )PWFSEBEFSB

%JGFSFODJB TJHOJGJDBUJWB 3FDIB[PEF)P

/PFSSPS

&SSPSUJQP* SJFTHPα

%JGFSFODJB OPTJHOJGJDBUJWB /PSFDIB[PEF)P

&SSPSUJQP** SJFTHPβ

/PFSSPS

)PIJQØUFTJTOVMB OPFYJTUFEJGFSFODJB

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

Tabla 4-4. 1SVFCBTFTUBEÓTUJDBTVUJMJ[BEBTDPONBZPSGSFDVFODJB Variable de respuesta

0CKFUJWP

$VBOUJUBUJWB normal

Ordinal o DVBOUJUBUJWB no normal

Binomial

Tiempo de TVQFSWJWFODJB

Independientes

t de Student

6EF.BOO 8IJUOFZ

χ2 Test de 'JTIFS

-PHSBOL .BOUFM )BFOT[FM

Apareados

t de Student para muestras apareadas

Test de 8JMDPYPO

Test de .D/FNBS

.PEFMPTEF fragilidad

Independientes

"OÈMJTJTEFMB Test de WBSJBO[B ,SVTLBM "/07"

Wallis

χ2

Riesgos proporcionales EF$PY

Apareados

"/07"EF medidas repetidas

Test de Friedman

Q de $PDISBO

.PEFMPTEF fragilidad

Evaluar la fuerza de la asociación

$PSSFMBDJØO de Pearson

$PSSFMBDJØO de Spearman

Predecir el valor de una variable en función de otra

Regresión lineal

Regresión no paramétrica

Describir la relación entre una variable de respuesta y diversas variables predictoras

Regresión lineal NÞMUJQMF Regresión no lineal NÞMUJQMF

Comparar dos grupos

Comparar tres o más grupos

Riesgos proporcionales EF$PY Regresión MPHÓTUJDB simple

Riesgos proporcionales EF$PY

Regresión MPHÓTUJDB NÞMUJQMF

Riesgos proporcionales EF$PY

© Elsevier. Fotocopiar sin autorización es un delito.

"EBQUBEPEF"SHJNPOZ+JNÏOF[ ZEF%PNÓOHVF[FUBM

En el apartado de «Resultados» debe informarse en primer lugar de los resultados de los análisis principales, tanto si son estadísticamente significativos como si no lo son. Hay que evitar seleccionarlos para presentar exclusivamente los que apoyan la hipótesis de trabajo y suprimir los que no lo hacen o son contradictorios. A veces existen valores extremos (outliers) que pueden tener una influencia desproporcionada en algunos análisis estadísticos. No deben ser ignorados, sino incorporados adecuadamente en el análisis, a veces realizándolo con y sin ellos para determinar su efecto. El artículo debe informar de todos estos aspectos.

7BMPSFTEFQ Al comunicar los resultados de las pruebas, es preferible presentar el valor de p y no limitarse a decir si el resultado es o no estadísticamente significativo. Así, por ejemplo, un valor de p de 0,049 y otro de 0,051 son lo bastante próximos

&MBCPSBDJwOEFVONBOVTDSJUP

como para ser interpretados de forma similar, a pesar de que en sentido estricto el primero podría considerarse estadísticamente significativo y el segundo no (con un nivel alfa del 0,05). Habitualmente es suficiente con presentar dos decimales, y el menor valor que suele ser necesario informar es el de p < 0,001. Un error frecuente es presentar el valor de p = 0,0000, claramente incorrecto, que corresponde a la simple traslación automática del valor que proporcionan algunos paquetes estadísticos debido a la precisión con que lo expresan. Aunque este valor en realidad corresponde al redondeo de un valor de p inferior a 0,00005, suele ser suficiente con expresarlo como p < 0,001. También suele recomendarse acompañar el valor de p con el del estadístico utilizado y de los grados de libertad, si procede, así como de una estimación de la magnitud del efecto y su IC. Uno de los errores más frecuentes en la literatura médica es, precisamente, la denominada «p huérfana». Por otro lado, cuando los resultados son estadísticamente no significativos, es conveniente no utilizar expresiones del tipo «los resultados mostraron una tendencia hacia la significación» o «se aproximaron a la significación», ya que sugieren erróneamente a los lectores que pueden ser interpretados como si fueran estadísticamente significativos, cuando de hecho se desconoce si la inclusión de un número mayor de sujetos habría conducido a los mismos resultados.

$PNQBSBDJPOFTN|MUJQMFT El problema de las comparaciones múltiples radica en que cuantas más hipótesis se contrasten con los mismos datos, más probable será cometer un error tipo I. Sin embargo, en un estudio son frecuentes las situaciones en que se realizan múltiples comparaciones, por ejemplo, al comparar los grupos por diferentes variables, al realizar análisis secundarios o repetidos en múltiples puntos de tiempo, al comparar múltiples variables de respuesta o al realizar análisis de subgrupos. En cualquier caso, debe informarse si se ha utilizado alguna estrategia de protección frente a dicho problema, como por ejemplo la corrección de Bonferroni. Además, es importante especificar si responden a hipótesis establecidas a priori, en cuyo caso deben estar adecuadamente justificadas, o bien si se trata de comparaciones a posteriori. Cuando se comparan medias, un error frecuente es la comparación de diferentes grupos dos a dos mediante una t de Student. Cuando se comparan tres o más grupos, la prueba más adecuada es el análisis de la varianza (ANOVA) y, en caso de encontrar una diferencia estadísticamente significativa en conjunto, se aplica posteriormente un procedimiento de comparaciones múltiples (Tukey, Student-Neuman-Keuls, Scheffé, etc.) para determinar cuál o cuáles de los grupos muestran diferencias estadísticamente significativas, sin aumentar la probabilidad de cometer un error tipo I.

4JHOJGJDBDJwOFTUBErTUJDBZSFMFWBODJBDMrOJDB Un resultado estadísticamente significativo no es necesariamente relevante desde el punto de vista clínico. Al aumentar el tamaño de la muestra, se incre-

© Elsevier. Fotocopiar sin autorización es un delito.

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

menta el poder estadístico de la prueba para detectar incluso pequeñas diferencias, de manera que un valor pequeño de p puede deberse tanto a la existencia de una diferencia importante como a haberse estudiado un elevado número de sujetos, por lo que una diferencia estadísticamente muy significativa puede carecer de interés clínico. Por otro lado, la ausencia de significación estadística no es sinónimo de ausencia de diferencia: si la potencia estadística es reducida (tamaño de la muestra insuficiente), simplemente el estudio no es concluyente, pero no puede decirse que sea negativo. Por ello, en la discusión del artículo deben interpretarse los resultados del análisis estadístico, diferenciando con claridad la significación estadística de la relevancia clínica. Las conclusiones del estudio no deberían basarse exclusivamente en los valores de p, sino que deben tener en cuenta también aspectos como el diseño y la ejecución del estudio, la magnitud de la diferencia observada y la amplitud de su IC, la plausibilidad biológica, otras evidencias adicionales, etc. Los resultados de las comparaciones principales deberían presentarse siempre con medidas de la magnitud del efecto o de la diferencia observadas, con independencia de si son o no estadísticamente significativas, para poder evaluar su relevancia clínica. Dado que estas medidas corresponden a las estimaciones puntuales del efecto que se desea determinar, deben acompañarse de su correspondiente IC para conocer su precisión (habitualmente con una confianza del 95%). Es preferible presentar los límites del intervalo, y reservar, en todo caso, el formato con el símbolo ± para las tablas, con la finalidad de ahorrar espacio, y solamente si el intervalo es simétrico. Un IC del 95% se asocia a una significación estadística al nivel del 5%, de manera que el propio IC puede ser utilizado para indicar, por ejemplo, si una diferencia es estadísticamente significativa (al nivel del 5%). Así, el resultado es estadísticamente significativo al nivel del 5% cuando el IC del 95% de una diferencia no incluye el valor cero, o bien cuando el IC del 95% de una OR o un RR no incluye el valor 1. Mientras que el valor de p suele interpretarse simplemente como indicativo de si un resultado es estadísticamente significativo o no, el IC, al proporcionar un rango de valores entre los que se considera que está situado el verdadero valor, permite a los lectores interpretar la magnitud del resultado y sus implicaciones a ambos límites del intervalo. Además, al presentarse en las unidades de medida de la variable, facilitan la interpretación de los resultados. Por estos motivos, los IC suelen ser preferibles a los valores de p, aunque a menudo se presentan conjuntamente. En la tabla 4-5 se exponen diversas formas de expresar un mismo resultado con niveles crecientes de información. Deben indicarse las diferencias absolutas de todas las variables principales del estudio, lo que evita posibles confusiones si se presentan exclusivamente como medidas relativas o porcentajes, aunque éstas también pueden presentarse si se considera adecuado hacerlo. Cuando se comparan grupos, no deben exponerse únicamente las diferencias observadas entre el punto de partida y el final de cada uno de ellos, sino también las diferencias entre los grupos. Como es lógico, todas las medidas relacionadas con las variables principales deben ir acompañadas de su IC del 95% correspondiente.

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 4-5. 'SBTFTRVFQSFTFOUBOVONJTNPSFTVMUBEP PSEFOBEBT EFMBRVFDPOUJFOFNFOPTBMBRVFDPOUJFOFNÈTJOGPSNBDJØO

Frase 1

El efecto del tratamiento fue estadísticamente significativo

2

El efecto del tratamiento fue una reducción estadísticamente significativa de la presión arterial diastólica (p < 0,05)

3

4

5

6

El efecto del tratamiento fue una reducción estadísticamente significativa de la presión arterial diastólica (p = 0,02) La presión arterial diastólica media del grupo tratado se redujo de 110 a 92 mmHg (p = 0,02) La presión arterial diastólica media del grupo tratado se redujo en 18 mmHg, de 110 a 92 mmHg (p = 0,02) La presión arterial sistólica media del grupo tratado se redujo de 110 a 92 mmHg (reducción = 18 mmHg; IC del 95%: 2 a 34 mmHg; p = 0,02)

&TUBEÓTUJDBNFOUF Valor TJHOJGJDBUJWP de p

Valores QSFZQPTU

*$EFM %JGFSFODJB 95% de la absoluta diferencia

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

X

*OEJDBTJFMSFTVMUBEPFTFTUBEÓTUJDBNFOUFTJHOJGJDBUJWP QFSPOPDVÈOUPMPFT5BNQPDPQFSNJUFFWBMVBSMBSFMFWBODJBDMÓOJDB4JOFNCBSHP BMHVOPTBVUPSFTMPJOUFSQSFUBODPNPRVFBQPZBMBSFDPNFOEBDJØOEFVTBSFMUSBUBNJFOUP 4JNJMBSBMBBOUFSJPS*OGPSNBEFRVFFMWBMPSEFpFTNFOPSEF QFSPQPESÓBTFSQ NVZTJNJMBSB Q RVFTFSÓBFTUBEÓTUJDBNFOUFOPTJHOJGJDBUJWB 4JNJMBSBMBBOUFSJPS QFSPZBTFDPOPDFFMWBMPSFYBDUPEFp. *OGPSNBEFMPTWBMPSFTBOUFTZEFTQVÏTEFMUSBUBNJFOUP QFSPMBEJGFSFODJBEFCFDBMDVMBSTF *OGPSNB BEFNÈT EFMBNBHOJUVEEFMBEJGFSFODJB RVFQPESÓBDPOTJEFSBSTFDMÓOJDBNFOUFSFMFWBOUF QFSPTØMP es una estimación puntual. *OGPSNBBEFNÈTEFM*$EFMEFMBEJGFSFODJB4VMÓNJUFJOGFSJPS NN)H OPFTDMÓOJDBNFOUFSFMFWBOUF NJFOUSBTRVFFMTVQFSJPS NN)H TÓMPFT*OEJDB QPSUBOUP RVFFMSFTVMUBEPOPFTDPODMVZFOUF .PEJGJDBEBEF-BOH

"TPDJBDJwOZDPSSFMBDJwO Los términos «asociación» y «correlación» se refieren a las relaciones entre variables. En general, se considera que dos variables están relacionadas si un cambio en una de ellas se acompaña de un cambio en la otra. Cuando se trata de variables categóricas, aunque puede utilizarse una prueba estadística como la χ2, suele ser conveniente incluir alguna medida de aso-

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

ciación, como el coeficiente phi; o bien, si se evalúa la relación entre la exposición a un factor y el desarrollo de una enfermedad, puede ser preferible utilizar medidas epidemiológicas como el RR o la OR. Si lo que pretende medirse es su grado de concordancia, se utiliza el índice kappa de Cohen. Cuando las variables son continuas, resultan útiles las representaciones gráficas para tener una mejor comprensión de la naturaleza de la relación y determinar si es lineal, en cuyo caso también puede calcularse el coeficiente de correlación lineal de Pearson (r). Al interpretarlo, debe tenerse en cuenta que correlación no es sinónimo de causalidad (aunque dos variables presenten un elevado coeficiente de correlación, no significa que exista una relación causal entre ellas) ni de concordancia (dos medidas pueden estar muy relacionadas sin dar nunca el mismo resultado, ya que el coeficiente de correlación refleja únicamente la tendencia al cambio del valor de una variable cuando la otra también cambia). Al comunicar los resultados de estos análisis, además de informar de la relación de interés, identificar las variables y sintetizar sus valores con los estadísticos descriptivos adecuados, debe presentarse el resultado de la prueba estadística aplicada, si procede, y el valor de la medida de asociación o del coeficiente calculado, conjuntamente con su IC del 95%.

© Elsevier. Fotocopiar sin autorización es un delito.

"OgMJTJTEFSFHSFTJwO El análisis de regresión intenta predecir el valor de una variable de respuesta (variable dependiente, habitualmente representada por Y) a partir de los valores conocidos de una variable predictora o independiente (regresión simple) o de varias (regresión múltiple), habitualmente representadas por X. Si la variable dependiente es cuantitativa, se habla de regresión lineal, y si es binaria, de regresión logística. Si se ha realizado un análisis de regresión lineal simple, además de identificar las variables y presentar los estadísticos descriptivos adecuados, debe confirmarse que se cumplen las asunciones necesarias (especialmente importantes en el caso de la regresión, ya que si la relación entre las variables no es lineal, el análisis puede ser incorrecto), así como presentar la ecuación de regresión (en el texto o en una figura), el valor de p y el IC del 95% del coeficiente de regresión. Al interpretar la ecuación, la recta no debe extenderse más allá de los datos recogidos. También es conveniente mostrar el coeficiente de determinación r2, que mide la fuerza de la asociación al indicar el porcentaje de variabilidad conjunta de ambas variables. Además, si han existido valores extremos (outliers), debe explicarse cómo han sido tratados. En un análisis de regresión lineal múltiple, el investigador suele recoger datos de diferentes variables potencialmente predictoras, determina cuáles de ellas están fuertemente asociadas con la variable de respuesta, y las incorpora en un modelo matemático (ecuación de regresión) que intenta «ajustar» a los datos. Por ello, es importante describir el método seguido para seleccionar las variables que se incluyen en el modelo (hacia delante, hacia atrás, paso a paso, etc.) e indicar si se evaluaron posibles problemas de colinealidad entre ellas, así como especificar si se determinó la posible existencia de interacciones. La ecuación de

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 4-6. 1SFTFOUBDJØOEFMPTSFTVMUBEPTEFVOBOÈMJTJTEFSFHSFTJØONÞMUJQMF 7BSJBCMFTQSFEJDUPSBTEFMBTDPODFOUSBDJPOFTEF/5QSP#/1 /UFSNJOBMQSPQÏQUJEPOBUSJVSÏUJDPDFSFCSBM FOPSJOBFOQBDJFOUFTDPOJOTVGJDJFODJBDBSEÓBDB "OÈMJTJTEFSFHSFTJØOMJOFBMNÞMUJQMF $PFGJDJFOUFEF regresión

&SSPSFTUÈOEBS

t

p

Sexo

Edad

Constante

¦

¦

Hipertensión

Diabetes

Creatinina

Vp

¦

¦

Obesidad

DPAV

7QWFMPDJEBEEFQSPQBHBDJØOEFMGMVKPNJUSBM %1"7EFTQMB[BNJFOUPEFMQMBOPBVSJDVMPWFOUSJDVMBS

regresión suele resumirse en una tabla que incluye el número de observaciones y, para cada variable independiente, su coeficiente de regresión (habitualmente con su error estándar), su IC del 95% y el valor de p (tabla 4-6). Es conveniente presentar también el valor del coeficiente de determinación R2, que ayuda a evaluar la bondad de ajuste de la recta al cuantificar la proporción de la variación total que es explicada por el modelo de regresión. El análisis de regresión está muy relacionado con el análisis de la varianza (ANOVA), en el que las variables independientes son categóricas. Cuando éstas son tanto categóricas como cuantitativas, se utiliza la regresión lineal múltiple, aunque a veces, cuando la variable independiente principal es categórica, se realiza un análisis de la covarianza (ANCOVA). Si la variable de respuesta es binaria, el análisis corresponde a una regresión logística, que también puede ser simple o múltiple. Al comunicar sus resultados, es conveniente presentar, para cada variable independiente, en lugar del valor de los coeficientes de regresión logística, que son difícilmente interpretables, su traducción en OR, y sus respectivos IC del 95%.

"OgMJTJTEFTVQFSWJWFODJB En muchos estudios longitudinales, el tiempo de seguimiento no es el mismo para todos los sujetos. En esta situación se utiliza una modalidad de análisis, denominada de supervivencia, que utiliza no sólo información sobre si el sujeto ha presentado el evento de interés (muerte, aparición de una complicación, recidiva, etc.), sino también el intervalo de tiempo transcurrido hasta que ocurre, de manera que se estima la probabilidad de supervivencia como una función del tiempo desde un punto de partida determinado (p. ej., el diagnóstico o el inicio del tratamiento). Los datos de los sujetos que no han presentado el evento durante el estudio se denominan censurados. También

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

pueden ser censurados los datos de los sujetos que mueren durante el estudio por causas no relacionadas con las variables de interés, y de los que han sido retirados del estudio o lo han abandonado. Típicamente se utiliza el número de pacientes todavía «vivos» (sin el evento de interés) en diferentes momentos del tiempo, y se determina la probabilidad de que un sujeto continúe vivo al final de cada período. Su representación gráfica se denomina curva de supervivencia (fig. 4-1). Al comunicar los resultados de un análisis de supervivencia, es importante describir las características de la población estudiada, especificar el punto de partida e informar de los datos censurados y del método estadístico utilizado para estimar la tasa de supervivencia (Kaplan-Meier o actuarial). Debe presentarse la tasa de supervivencia estimada para los tiempos de seguimiento adecuados, con su correspondiente IC del 95%, y el número de pacientes en riesgo de morir en cada período. A menudo puede ser preferible presentar los resultados en una figura o una tabla. A veces puede ser conveniente informar también de la mediana del tiempo de supervivencia. Cuando se comparan dos curvas de supervivencia (p. ej., para comparar el efecto de dos intervenciones), deben presentarse los resultados descriptivos de cada grupo así como los de la prueba estadística utilizada (log-rank test o Wilcoxon). Para analizar la asociación entre diferentes variables explicativas y la tasa de supervivencia se utiliza un modelo de regresión de riesgos proporcionales de Cox, la presentación de cuyos resultados debe incluir también una medida del riesgo asociado a cada variable (hazard ratio), con su correspondiente IC del 95%.

100 90 80

Porcentaje

© Elsevier. Fotocopiar sin autorización es un delito.

70 60 50 40 30 20 10 0 0

5

10

15

20

25

30

35

40

45

50

26

16

11

5

Tiempo (meses) 85 76 Pacientes de riesgo

70

63

58

49

39

Figura 4-1. $VSWBEFTVQFSWJWFODJB

&MBCPSBDJwOEFVONBOVTDSJUP

&-"#03"$*Î/%&-"45"#-"4 Los resultados de un estudio deben comunicarse de forma concisa y clara, resaltando en el texto los más importantes, y apoyándose en tablas y figuras cuando sea necesario, pero sin abusar de ellas. Las tablas permiten organizar los datos numéricos o de texto de forma estandarizada en filas y columnas, mientras que las figuras son presentaciones visuales de los resultados (en forma de gráficos, diagramas, fotografías, dibujos, esquemas, mapas, etc.). Los datos deben presentarse en el texto, en una tabla o en una figura, pero no en más de una forma a la vez, evitando repeticiones innecesarias. Como regla general, no debe elaborarse una tabla a menos que deban presentarse datos repetitivos. Cuando se trata de presentar resultados sencillos, es preferible resumirlos en una simple frase, con los datos sintetizados entre paréntesis: «La coronariografía se realizó con mayor frecuencia en los hombres (56,8%) que en las mujeres (33,1%; p < 0,001)». Las tablas permiten disponer y ordenar grandes cantidades de datos en filas y columnas, de manera que el lector pueda observarlos, estudiarlos, comprenderlos y analizarlos tanto de forma individual como en conjunto. Aunque una tabla bien diseñada suele ser más exacta, más completa y puede presentar mucha más información que un gráfico, éste es preferible cuando se desea poner de manifiesto la existencia de una tendencia o un patrón en la relación entre conjuntos de variables. El capítulo 5 está dedicado a los aspectos específicos de la utilización de gráficos en la comunicación de los resultados.

/|NFSPZUBNBvPEFMBTUBCMBT Algunos autores parecen creer que todos los resultados numéricos deben presentarse en una tabla. Sin embargo, no todos lo requieren. Es importante decidir qué tablas son realmente necesarias, qué información es preferible presentar en forma de figuras, e incluso si algunas tablas o figuras pueden eliminarse e incluir su contenido en el texto. Aunque la decisión sobre cómo se sintetizarán y presentarán los resultados suele tomarse una vez completado el análisis estadístico de los datos, la comunicación de los resultados debería empezar a planificarse ya desde el desarrollo del plan de análisis en el protocolo del estudio, de manera que pueda asegurarse que, en el momento de la redacción del manuscrito, se dispondrá de todos los datos necesarios para la elaboración de las tablas y figuras. Las tablas se utilizan cuando es necesario informar al lector sobre valores exactos de datos numéricos, cuya exposición en texto requeriría una larga parrafada repleta de cifras y difícil de comprender. La tabla 4-7 muestra un ejemplo de tabla innecesaria, ya que incluye solamente tres datos numéricos que hubieran podido presentarse fácilmente en el texto; además, no indica el número de casos a que se refieren los porcentajes. La tabla 4-8 muestra un ejemplo similar en que, además de no presentar el número total de casos incluidos, muestra una precisión innecesaria en los valores de los porcentajes; asimismo, el título contiene una abreviatura innecesaria, no justificada aunque se explique su significado en la nota al pie.

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

5BCMB &KFNQMPEFUBCMBJOOFDFTBSJB Resultados de la escala de sobrecarga del cuidador al inicio del programa Grado de sobrecarga

%

/PFYJTUFTPCSFDBSHB

4PCSFDBSHBMFWF

Sobrecarga intensa

Tabla 4-8. &KFNQMPEFUBCMBJOOFDFTBSJB 0SJHFOEFMBTPMJDJUVEEF%.0 Origen de la solicitud

/

.ÏEJDPEFGBNJMJB

Reumatólogo

Traumatólogo Ginecólogo Otros

© Elsevier. Fotocopiar sin autorización es un delito.

%.0EFOTJUPNFUSÓBØTFB

A la hora de decidir qué tablas y figuras van a elaborarse, hay que tener en cuenta que algunas revistas limitan en sus instrucciones para autores el número máximo permitido. Si no se especifica, conviene hojear algunos números recientes de la revista para ver cuál es la cantidad habitual en función de la extensión de los artículos. Después hay que evaluar si se necesita realmente el número máximo de tablas que se permite, ya que los editores normalmente prefieren omitir las tablas que contienen un escaso volumen de datos e incluirlos en el texto si son realmente relevantes, ya que la composición de las tablas es más laboriosa y costosa. Las tablas y figuras deben ordenarse de forma que su secuencia facilite al lector la comprensión de los hallazgos del estudio y le conduzca a través de las etapas necesarias para responder a la pregunta planteada en la investigación. Las tablas se numeran consecutivamente según se mencionan en el texto, en una secuencia independiente de las figuras, y debe comprobarse que todas ellas están citadas en el texto, que su secuencia coincide y que su orden es el adecuado. Al remitir al lector a una tabla, es conveniente utilizar frases que llamen la atención de los lectores hacia los datos o tendencias que se desea resaltar, referenciando la tabla o figura correspondiente entre paréntesis: «La incidencia acumulada a los 5 años fue significativamente menor en el grupo tratado que en el placebo (tabla 2)». Es preferible evitar el uso de frases que simplemente dirijan al lector a una tabla o figura, sin proporcionar más información: «La tabla 1 muestra los resultados de la comparabilidad inicial de los grupos». Aunque rara vez las instrucciones para autores incluyen detalles suficientes sobre la preparación de las tablas, su estilo y tamaño pueden deducirse fácilmente de las publicadas en números recientes de una revista.

&MBCPSBDJwOEFVONBOVTDSJUP

Es preciso evaluar el espacio que ocupará la tabla una vez publicada para decidir si su tamaño es adecuado para la revista y si será fácilmente comprensible por el lector. Aunque el tamaño de una tabla debe ajustarse a las necesidades de los datos que se presentan, debería evitarse la elaboración de tablas demasiado extensas que incluyan gran cantidad de datos, de manera que el lector se pierda entre una maraña de cifras y variables y le resulte difícil poder evaluar sus interrelaciones.

1BSUFTEFVOBUBCMB Una disposición adecuada de la tabla es fundamental. Al elaborarla, debe tenerse en cuenta que la facilidad y velocidad para comprenderla dependen mucho de la distribución lógica de su tabulación, por lo que su estructura debe ser lo más simple y clara posible, con las filas y columnas ordenadas según una secuencia lógica y comprensible. Una tabla debe ser fácilmente inteligible sin tener que consultar el texto. Para ello, se requiere un título adecuado y una estructura lógica de los datos, deducible con facilidad de los encabezamientos de las filas y columnas. Los términos con los que habitualmente se designan las partes de una tabla son (fig. 4-2): t Título: indica el número de orden de la tabla y describe su contenido. t Campo o cuerpo: espacio que contiene los datos numéricos y/o los términos o frases descriptivos que constituyen el mensaje de la tabla. Este contenido suele estar dispuesto en filas horizontales y columnas verticales.

Título Encabezamientos de columna

Encabezamientos de fila

Cuerpo

Notas al pie

Figura 4-2. Partes de una tabla.

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

© Elsevier. Fotocopiar sin autorización es un delito.

t Encabezamientos de columna: identifican el tipo de datos alineados verticalmente en cada una de las columnas. t Encabezamientos de fila: identifican el tipo de datos alineados horizontalmente en cada una de las filas. t Notas al pie: explican detalles del contenido de la tabla. El título debe ser lo bastante específico como para que pueda entenderse la tabla sin necesidad de consultar el texto, evitando la repetición de información que proporcionan los encabezamientos de las filas y columnas. El título tiene que ser breve (habitualmente se recomienda que no sobrepase las 10 palabras) y no debe incluir términos ambiguos, partículas de relleno, recursos retóricos ni abreviaturas. Si el lector necesita detalles que el título no puede incluir sin ser demasiado largo y que no corresponden a los encabezamientos, pueden incluirse en las notas al pie. Para disponer correctamente los datos de la tabla, es necesario ordenar las filas y columnas siguiendo una secuencia lógica, teniendo en cuenta que las comparaciones primordiales se establecen de izquierda a derecha y de arriba abajo. Es conveniente utilizar una disposición similar en tablas similares, de forma que se facilite la comprensión de las mismas. Los encabezamientos de columnas que presentan datos numéricos deben incluir la unidad de medida de los datos, que idealmente debe ser aplicable a todos los datos que se presentan en dicha columna. Es preferible reestructurar la tabla que forzar al lector a considerar cambios en las unidades de medida. Si un grupo de columnas forman una unidad lógica, se designará con un encabezamiento de grupo que identifique, sin dejar lugar a dudas, qué columnas incluye. Lo mismo ocurre con los encabezamientos de fila, indicando los grupos y subgrupos con un sangrado que identifique claramente sus relaciones mutuas. Si las filas incluyen datos numéricos, deben indicarse claramente las unidades de medida. En caso de que las filas correspondan a intervalos en que se ha dividido una variable continua, debe asegurarse que son mutuamente excluyentes y que se identifican claramente los límites de cada intervalo, sin solapamientos entre ellos. Los datos de las columnas deben centrarse bajo sus encabezamientos y, si son numéricos, según el punto decimal. Ninguna intersección de columna y fila debe quedar en blanco: si el dato es «nada», se indica con un cero; si no hay dato, la ausencia se señala con puntos suspensivos (…), guiones (---) o una abreviatura cuyo significado se explique en una nota al pie (como ND por «no disponible» o NA por «no aplicable»). Si las cantidades son grandes y no es necesaria demasiada precisión, pueden expresarse en cantidades menores indicando en el encabezamiento de la columna, y entre paréntesis, el multiplicador utilizado (p. ej., «miles»). Si los datos de una fila o columna son idénticos, es preferible no incluirlos en el cuerpo de la tabla e indicar su valor en una nota al pie. Es conveniente incluir los valores marginales (totales), ya que ayuda, por ejemplo, a determinar si los porcentajes se han calculado sobre el total de la fila o de la columna, lo que contribuye a su mejor interpretación. Al presentar los datos, solamente deben incluirse los dígitos significativos, ya que un número excesivo de decimales puede confundir al lector dando una

&MBCPSBDJwOEFVONBOVTDSJUP

falsa imagen de gran precisión y, además, dificultando la comprensión y comparación de los datos. Hay que comprobar que todos los datos de la tabla concuerdan completa y exactamente con su presentación en otros lugares del artículo, como el texto, el resumen u otras tablas. También debe verificarse que todos los datos concuerdan internamente (p. ej., que los porcentajes de la fila o columna suman el 100%, o que los valores absolutos suman el número de casos estudiados), lo que obliga a repasar las sumas, restas y otras operaciones matemáticas implícitas en la tabla. Con la finalidad de ahorrar espacio, a veces se incluyen abreviaturas que no se aceptarían en el texto. Todas las abreviaturas de las tablas, excepto los símbolos estandarizados de las unidades de medida, deben explicarse en notas al pie, aun cuando se hayan explicado en el texto. Las notas al pie pueden utilizarse para expresar el significado de las abreviaturas, describir determinadas condiciones del estudio, señalar las valoraciones estadísticas (p. ej., indicando los resultados que son estadísticamente significativos), reconocer la fuente de la tabla (si ha sido tomada de otra publicada) o para cualquier otra finalidad que ayude a hacer que una tabla sea explícita por sí misma. Aunque algunas revistas aceptan que estas notas se marquen con números volados, dado que pueden confundirse con potencias (cuadrado, cubo, etc.) o con citas bibliográficas, las revistas suelen preferir utilizar letras minúsculas voladas en orden alfabético (a, b, c, …) o una secuencia convencional de signos (*, †, ‡, §, ¶, #, …). Si los datos de la tabla no provienen del estudio que se presenta sino que se han tomado de otra fuente, el autor debe señalarlo claramente en la primera nota al pie, indicando con una fórmula del tipo «Fuente:…», «Extraída de…» o «Tomada de…», por ejemplo. El mecanografiado de la tabla debe seguir las instrucciones para los autores de la revista. Habitualmente debe hacerse a doble espacio, incluyendo los encabezamientos y las notas al pie. Las revistas difieren respecto del uso de líneas horizontales y verticales, de acuerdo con el estilo de cada publicación. Las tablas y figuras se numeran independientemente y se presentan en páginas separadas del texto. Cada tabla se empieza en hoja aparte, y si no cabe en una, puede continuarse en una segunda, con la designación de número de orTabla 4-9. Recomendaciones para la elaboración de tablas t 4ØMPEFCFFMBCPSBSTFVOBUBCMBDVBOEPEFCBOQSFTFOUBSTFEBUPTSFQFUJUJWPT t 1SFTFOUBSMPTEBUPTDPNPUFYUP UBCMBTPGJHVSBT QFSPOPNÈTEFVOBGPSNBBMBWF[ t %FCFOTFSBVUPFYQMJDBUJWBT t 4FODJMMBTZEFGÈDJMDPNQSFOTJØO t 5ÓUVMPCSFWFZDMBSP t &ODBCF[BNJFOUPTDMBSPTEFMBTGJMBTZDPMVNOBT JODMVZFOEPMBTVOJEBEFTEFNFEJEB t 0SEFOBDJØOMØHJDBEFMBTGJMBTZDPMVNOBT1SJPSJEBEEFJ[RVJFSEBBEFSFDIB ZEFBSSJCBBCBKP t &WJUBSFMBCVTP t *ODMVJSMPTWBMPSFTNBSHJOBMFT UPUBMFT QBSBGBDJMJUBSMBDPNQSFOTJØO t 4JTFVUJMJ[BOBCSFWJBUVSBT EFCFOIBDFSTFFYQMÓDJUBT t 6UJMJ[BSVOBEJTQPTJDJØOTJNJMBSFOUBCMBTTJNJMBSFT

1 3 & 4 & / 5"$ * Î / % & 3 & 4 6 -5" % 0 4 & 4 5" % Ê 4 5 * $ 0 4 : & - " # 0 3 "$ * Î / % & 5" # - " 4

den y título repetido seguido de «continuación», repitiendo los encabezamientos de columna para evitar confusiones en cuanto a su alineación. La tabla 4-9 sintetiza las principales recomendaciones que deben tenerse en cuenta al elaborar una tabla.

#*#-*0(3"'Ê"3&$0.&/%"%"

© Elsevier. Fotocopiar sin autorización es un delito.

Argimon Pallàs JM, Jiménez Villa J. Métodos de investigación clínica y epidemiológica. 3.ª ed. Madrid: Elsevier; 2004. Cobo E, Muñoz P, González JA. Bioestadística para no estadísticos. 1.ª ed. Barcelona: Elsevier; 2007. Day RA, Gastel B. How to write and publish a scientific paper. 6.ª ed. Cambridge, Mass.: Cambridge University Press; 2006. Domínguez R, Segú JL, Cobo E. Importancia del análisis estadístico en la preparación de un artículo. En: Mabrouki K, Bosch F, eds. Redacción científica en biomedicina: lo que hay que saber. Barcelona: Fundación Dr. Antonio Esteve; 2007. p. 83-98. Huth EJ. How to write and publish a scientific paper in the medical sciences. 2.ª ed. Baltimore: Williams & Wilkins; 1990. Lang T. Twenty statistical errors even YOU can find in biomedical research articles. Croat Med J. 2004;45:361-70. Lang TA, Secic M. How to report statistics in medicine. Filadelfia: American College of Physicians; 1997. Medicina Clínica. Manual de estilo. Publicaciones biomédicas. Barcelona: Doyma Libros, S.A.; 1993. p. 139-62.

&MJNQBDUPEFMPTHSgGJDPT FOMBDPNVOJDBDJwO DJFOUrGJDB +"(PO[gMF[Z-+PWFS

© Elsevier. Fotocopiar sin autorización es un delito.

*/4536.&/5"-&4603/".&/5"-&4 La representación gráfica se ha convertido en un elemento habitual en los medios de comunicación, tanto científicos como divulgativos, además de la prensa escrita o la televisión. Su presencia se considera un potente mecanismo de transmisión de información. Algunos tópicos han pasado a adquirir rango de axioma: un gráfico se explica por sí sólo, una imagen vale más que mil palabras, el espectador comprende mejor y más rápido ante un gráfico. La vía gráfica está en alza gracias al auge de los medios que facilitan su creación y difusión, principalmente medios informáticos (potentes ordenadores e Internet). Por otro lado, la mayoría de textos de estadística dedican poco espacio y escaso énfasis a la parte gráfica. La accesibilidad y facilidad de uso de la técnica gráfica contribuyen a su diseminación. Sin embargo, tal crecimiento no ha logrado ni gráficos mejores por parte de sus creadores, ni un aumento de la capacidad de interpretación del público al que van destinados, a veces simplemente la población en general. En consecuencia, el lenguaje gráfico —si podemos llamarlo así— se ha banalizado; Howard Wainer 1 comentaba con ironía que «In the more than 200 years since the inicial development of graphics techniques, we have adquired some wisdom in their use, born of experience», y veinte años más tarde no creemos que su opinión haya dado un vuelco. Podemos encontrar dos objetivos que hacen justificable el uso de un gráfico, especialmente en un entorno científico: la exploración y la comunicación. Por decirlo con palabras de Armitage y Berry2, el gráfico trata de ayudar en particular al análisis estadístico: para mejorar la comprensión del lector de la estructura de los datos, para valorar las premisas o para sugerir nuevas hipótesis que puedan ser contrastadas con posterioridad. Respecto al segundo objetivo, se

&MBCPSBDJwOEFVONBOVTDSJUP

refiere a la presentación «simple y evocadora» de información estadística. De una manera u otra, estos gráficos buscan impactar. El término es revelador, porque puede tener dos caras: un gráfico extraordinario produce una inigualable impresión en el lector, pero un gráfico impactante puede ser sólo deshonesto, un instrumento para falsear datos. Como en tantas ocasiones, un buen gráfico empieza con una pregunta: ¿para qué lo quiero? Pongamos como ejemplo el caso de un investigador que posee pares de medidas de la presión arterial obtenidas con un instrumento manual y con otro automático, y desea estudiar su concordancia, es decir, hasta qué punto son coincidentes. En primera instancia, se ha decidido por un diagrama de dispersión para representar la relación entre ambas variables (fig. 5-1A), y ante el resultado puede creer que la situación es altamente satisfactoria. Sin embargo, una visión alternativa (fig. 5-1B) le hubiera resaltado la posible existencia de distintos tipos de errores en las mediciones (sobre el gráfico de BlandAltman, que representa las diferencias frente al promedio, puede consultar el artículo de los autores de 19993). En este caso, si hubieran divulgado el primer diagrama, los autores no habrían podido ser acusados de malicia, sino de ignorancia, por no hacer uso del gráfico apropiado. En biomedicina, el uso y las aplicaciones de gráficos o imágenes son extremadamente amplios, y sería una vana pretensión intentar abarcarlos completamente en este capítulo. Su potencial es enorme y diverso: desde los gráficos e imágenes generados automáticamente por los actuales instrumentos de análisis y diagnóstico, hasta los gráficos como herramienta para la gestión u organización de tareas asistenciales. Por ello, se exponen tres ámbitos concretos que consideramos de interés general: a) resaltar el potencial de los gráficos como instrumento para progresar en el conocimiento científico, apuntando algunas de las nuevas tendencias y posibilidades en este ámbito; b) abordar el uso de los gráficos como herramienta para transmitir información científica; en este apartado es donde se dan algunas recomendaciones específicas al lector usuario de gráficos (sea como creador o como consumidor), todas ellas aplicables, con mayor o menor importancia, a cualquier ámbito donde los gráficos sean utilizados, y c) el potencial de los gráficos como herramienta en la atención y cuidado del paciente, exponiendo algunas de las ideas que han ido apareciendo en la literatura en los últimos años.

6/")&33".*&/5"1"3"(&/&3"3$0/0$*.*&/50 En palabras de R. A. Fisher4: «El examen preliminar de la mayor parte de los datos es facilitado por el uso de diagramas. Éstos no demuestran nada, pero traen fácilmente características excepcionales a la vista [del experimentador]; no son por tanto un sustituto para los tests críticos a aplicar a los datos, pero tienen valor al sugerir tales tests, y para explicar las conclusiones elevadas a partir de ellos». La cita, que aparece en la introducción del libro de Brian Everitt5, precede a la lista con los tres objetivos generales del análisis de datos que el autor destaca: a) representación y descripción; b) análisis e interpretación, y c) resumen y exposición.

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

180

160

140

120

100 A. 80 80

100

120

140

160

180

Manual

20

10

© Elsevier. Fotocopiar sin autorización es un delito.

0

-10 B. -20 80

100

120

140

160

Promedio Figura 5-1. A. Valores de presión arterial obtenidos manualmente confrontados a un procedimiento automático. B. Gráfico de Bland-Altman, en el que se puede apreciar un incremento de la diferencia de medidas ligado a la magnitud de la presión.

&MBCPSBDJwOEFVONBOVTDSJUP

Su campo de utilidad abarca desde la presentación de datos brutos (individuales) a estadísticos generados con mayor o menor sofisticación a partir de los mismos, y que constituyen a menudo el resultado final del análisis. La visión de Fisher, a principios del siglo XX, no dista mucho de la que representa Everitt, a finales de la década de los setenta. El diagrama es un instrumento cuyo fin primordial es la exposición de información, con precisión y claridad. Facilita la interpretación de los datos y, adicionalmente, puede sugerir nuevas vías para su análisis. Recientemente se contempla el gráfico desde una nueva perspectiva: en su concepción moderna, el gráfico es un participante activo en el proceso científico del descubrimiento. Los factores que han ayudado a avanzar en esta dirección serían, por un lado, la disponibilidad de datos, software y potentes ordenadores que hacen accesibles a cualquiera el enorme gasto computacional que supone el tratamiento en tiempo real de gráficos que interactúan con el usuario, y, por otro lado, el impacto del análisis exploratorio de datos (más conocido por las siglas EDA), sobre las ideas de J. W. Tukey6. No cabe confundir EDA con un conjunto de técnicas relativas a la estadística gráfica. El análisis exploratorio de datos se entiende mejor como una actitud para afrontar el análisis de datos: éstos contienen la llave que conduce a la información, y el investigador se comporta como un detective que pretende resolver un problema.

%JBMPHBSDPOVOHSgGJDP El gráfico que aparece en un artículo, póster o libro es necesariamente un objeto estático. Acabar como una representación en dos dimensiones ha sido un clásico destino que hasta época reciente ha lastrado las posibilidades del gráfico, limitándolas a producir una imagen lo más rica posible pero en el limitado mundo del plano. Esperar que un simple diagrama bivariante refleje las estructuras importantes existentes en un conjunto de datos multidimensional es una exigencia notable que, por otro lado, ha producido técnicas tan interesantes como el análisis de componentes principales (véase Aluja y Morineau7), donde se escogen los ejes de acuerdo con las direcciones de máxima variabilidad en los datos. La representación de múltiples dimensiones en el papel ha supuesto un reto que ha conseguido algunos éxitos notables, y también algunos resultados ciertamente imaginativos, aunque de discutible utilidad. Los diagramas de glifos (el término «glifo» se refiere a los canales verticales que aparecen como elementos decorativos en las columnas y, por extensión, a un símbolo que representa información de modo no verbal) son diagramas de dispersión que tienen asociado a cada individuo no un símbolo idéntico, sino una forma variable dependiente de otros factores. Los atributos que se pueden alterar pueden ser tanto cualitativos (símbolos diferentes) como cuantitativos (tamaño, orientación o color pueden depender de una variable continua). Las caras de Chernoff8 son un ejemplo especial de glifo, donde los rasgos faciales, como la amplitud del rostro o los ojos, o la curvatura de la boca, están ligados a los factores en estudio, produciendo para cada elemento una «cara» que nuestra respuesta emocional puede interpretar de manera global. En el ejemplo de la figura 5-2 se muestran ocho variables relacionadas con la calidad de vida del individuo, en

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

© Elsevier. Fotocopiar sin autorización es un delito.

tres casos que, de izquierda a derecha, reconocemos inmediatamente como de peor a mejor calidad global. Otra aproximación multivariante es la de las curvas en coordenadas parale9 las , que para cada punto en d dimensiones conecta una línea de trazos a través de d ejes paralelos (fig. 5-3). Esta representación permite detectar agrupaciones o patrones especiales, bajo la apariencia que presenta el haz de rectas (p. ej., los gorriones hembras de Manly suelen tener una cabeza más bien pequeña, en relación con otras dimensiones de su cuerpo10). Estos métodos, orientados para la representación de un número «alto» de dimensiones, deberían ir al lado de los procedimientos que se basan en proyectar sobre el plano datos en tres dimensiones. Además, una secuencia de gráficos de acuerdo con una cuarta variable —ligada al tiempo— permite ampliar la riqueza del análisis. En este punto cabe tener presente que los gráficos no sólo son un fin, la representación más expresiva, el mejor remate de la investigación desarrollada, sino también una herramienta de trabajo. Esto es más común en tiempos recientes, desde que la potencia de cálculo computacional no es un lujo y desde que existen productos informáticos que incorporan algunas técnicas que intentaremos describir muy brevemente. El rasgo distintivo sobre las representaciones estáticas que aparecen en cualquier publicación es que la construcción de un gráfico es interactiva entre el usuario y el ordenador y, en consecuencia, el objetivo está más cerca del proceso habitual del investigador —plantear hipótesis de trabajo, validar, reformular— que de la elaboración de una representación finalista. El ordenador permite implementar secuencias dinámicas de diagramas, usando el tiempo como dimensión adicional, o permitiendo al explorador elegir el ángulo de proyección de sus datos. Como indican Wainer y Velleman11, la representación de gráficos es como una conversación, en la que ambas partes intercambian puntos de vista y se enriquecen mutuamente, incrementando en este proceso la posibilidad de detectar patrones, relaciones o excepciones. Los procesos de interacción se están definiendo en torno a ciertas operaciones básicas. Se asume que los datos representados son vistos desde varios puntos

1

2

3

Figura 5-2. Representación con caras de Chernoff de la calidad de vida en tres individuos (de izquierda a derecha, y respectivamente, suponiendo que para cada uno de ellos todas las variables incluidas en el gráfico estén al 30 al 50 y al 70% de su rango de variación).

&MBCPSBDJwOEFVONBOVTDSJUP

Variable Longitud húmero

Pico/ cabeza

Longitud total

Figura 5-3. Representación en coordenadas paralelas de las mediciones realizadas sobre 49 gorriones hembra. De Manly10.

de vista y de diferentes maneras, pero consistentemente, de acuerdo con el principio de «enlazado» (linking), según el cual todas las vistas son coherentes en la representación de los datos, en cuestiones como los símbolos o colores empleados. De este modo, si un conjunto de puntos es seleccionado —la operación fundamental—, éstos resaltarán desde cualquier punto de vista, y los restantes puntos permanecen igualmente pero como en segundo plano, y sólo para proporcionar un contexto para los actores protagonistas. Las acciones que más frecuentemente se ofrecen para permitir la selección de observaciones reciben los nombres de «cepillar» (brush) y «rebanar» (slice). Ambas, y otras operaciones como «aislar» o «enmascarar», se basan en el principio por el que destacar la identidad común de un subconjunto de datos en múltiples vistas permite al analista relacionar mejor las distintas representaciones y, por tanto, descubrir más fácilmente estructuras subyacentes.

"CSVNBEPTQPSFMFYDFTPEFEBUPT Un campo que emerge con fuerza es la minería de datos (usualmente conocida con el nombre de Data Mining). Lo traemos a colación aquí porque contiene los rasgos básicos que estamos destacando: la exploración, en busca de estructuras, asociaciones o relaciones en general, que se organiza sobre un gran conjunto de datos (en este caso, se trataría de ingentes cantidades de datos, residentes en enormes bases de datos). Aunque las técnicas empleadas en aplica-

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

ciones reales no posean una gran complejidad, se hacen interesantes propuestas de las que queremos destacar la de Wegman12, precisamente por hacer hincapié en procedimientos gráficos basados en la representación en coordenadas paralelas. La conclusión que debe extraerse es que, cuando la densidad de los datos provoca el agotamiento de las posibilidades de un método, es estimulante descubrir que se continúan abriendo nuevas e imaginativas vías para seguir extrayendo la información relevante.

-04(3Ç'*$04&/-"$0.6/*$"$*Î/$*&/5Ê'*$" #*0.c%*$"

En el terreno de la comunicación científica (publicaciones, ponencias y pósters en congresos), los gráficos se utilizan fundamentalmente para la presentación de resultados obtenidos en un trabajo de investigación. Los gráficos son una valiosa herramienta para cumplir con este objetivo, ya que ofrecen varias ventajas. En primer lugar, un gráfico adecuado permite explicar la hipótesis de investigación que se aborda en un determinado trabajo, a la vez que permite al lector hacerse una idea general y comprender los principales resultados del mismo en poco tiempo, sin necesidad de una lectura detallada del texto. Por otro lado, los gráficos muestran al lector interesado en el tema detalles o matices de los datos, y de sus complejas relaciones, que difícilmente podríamos exponer en forma de texto. Frecuentemente, permiten describir resultados con mayor precisión que la que se puede obtener mostrando los estadísticos convencionales.

© Elsevier. Fotocopiar sin autorización es un delito.

"MHVOPTDPODFQUPTCgTJDPTQBSBDSFBSHSgGJDPTEFDBMJEBE Para crear un gráfico de calidad que sirva a estos propósitos, dos aspectos van a resultar fundamentales: tener una idea muy clara de qué se desea comunicar al lector y conocer algunas reglas básicas relacionadas con el modo en que opera la percepción visual humana para poder optimizar el diseño del gráfico. Del mismo modo en que es imposible recomendar una secuencia de acciones que conduzca al análisis estadístico ideal de nuestros datos, es también imposible ofrecer reglas que nos garanticen que vamos a emplear el gráfico más apropiado a nuestros datos. Aun así, algunas características genéricas pueden identificarse en el «gráfico ideal» para mostrar los resultados obtenidos en un trabajo. La primera de ellas es que el gráfico debe ser autoexplicativo: la información necesaria para interpretar correctamente el gráfico debe estar contenida en el mismo (títulos de ejes, unidades, leyendas) o en el correspondiente pie de figura. Por supuesto, esta propiedad no excluye la necesidad del contexto que proporciona el marco de trabajo: artículo, informe, comunicación oral, etc. La consistencia del gráfico, tanto interna (entre títulos y pies de figura, unidades no proporcionales a las distancias en los ejes, etc.) como externa (discrepancias respecto a informaciones contenidas en las tablas y el texto, o la repetición innecesaria de la información), debe cuidarse al máximo, ya que este tipo de errores se dan con más frecuencia de la que sería deseable.

&MBCPSBDJwOEFVONBOVTDSJUP

Otra particularidad común al hipotético gráfico ideal es que muestre características de los datos que no pueden ser explicadas fácilmente de otro modo, ni en forma de tablas ni en el texto. Finalmente, un buen gráfico debería ayudar al lector a comprender y recordar con facilidad los resultados y conclusiones más relevantes de la investigación presentada. Sin embargo, a pesar de que estas reflexiones son compartidas por la mayor parte de los investigadores, no es habitual que desde los medios de comunicación científica se emprendan acciones encaminadas a mejorar este aspecto. Si nos centramos en el ámbito de las revistas biomédicas, veremos que, en las recomendaciones a los autores, lo más habitual es encontrar unas directrices que hacen exclusivamente referencia a los aspectos más formales (tamaño y tipo de las fuentes, legibilidad de los símbolos, claridad en las leyendas y títulos) o a los estrictamente editoriales (número de figuras, utilización del color, numeración, identificación y calidad de impresión de los originales)13,14. Por el contrario, es fácil encontrar de manera sistemática directrices que hacen hincapié en la correcta presentación de los resultados estadísticos en el texto (mostrar tamaños muestrales, incluir medidas de variabilidad, presentar estimaciones de los efectos, etc.), directrices que en muchos casos también deberían aplicarse a la presentación gráfica de resultados. En las revistas biomédicas, los originales que abordan cuestiones metodológicas presentan parecida asimetría. Mientras que es relativamente habitual encontrar trabajos que presentan, revisan y discuten alternativas metodológicas para la elaboración y presentación de resultados, éstos no plantean —o lo hacen de modo muy somero— los aspectos específicos de la representación gráfica15. En la tabla 5-1 se muestran los pasos básicos que nos deberían llevar a la elaboración de gráficos de calidad16. Esta lista pretende ser simplemente orientativa y está enunciada en términos de acciones positivas que, debidamente aplicadas a nuestro problema particular, nos ayudarán a mejorar los gráficos. Tabla 5-1. Pasos que hay que seguir para la elaboración de los gráficos 1. Definir qué es necesario comunicar al lector y determinar si un gráfico es la mejor herramienta para ello (frente a una tabla o a la exposición en forma de texto) 2. Identificar las principales características que condicionarán la construcción del gráfico: ¿debe/puede mostrar los datos?, ¿su objetivo primordial es describir o comparar/ relacionar?, ¿cuál es la naturaleza de las variables (cualitativa, cuantitativa)? 3. Identificar correctamente la naturaleza de las unidades de información: ¿son distintas variables medidas en un mismo individuo?, ¿existe apareamiento (natural o por diseño) que deba reflejarse en el gráfico y de qué manera? 4. Determinar qué variable o variables es necesario mostrar para ilustrar convenientemente el resultado que se desea comunicar y juzgar cuidadosamente si es necesario incluir posibles variables de interacción o de confusión para que el lector pueda valorar su importancia 5. Elegir el formato gráfico, preguntándose siempre si hay una alternativa mejor para mostrar esos datos. Evaluar si el hecho de combinar elementos gráficos (p. ej., añadir las distribuciones univariantes en los ejes de un diagrama de puntos) puede mejorar la calidad del gráfico 6. Elaborar minuciosamente el gráfico, prestando especial atención al hecho de que sea autoexplicativo y de que sea consistente tanto con la información mostrada en el mismo (ejes, etiquetas, abreviaturas) como con el resto de los contenidos del manuscrito (duplicidad de resultados, cambios de unidades, tamaños de la muestra) Adaptado de Schriger y Cooper16.

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

© Elsevier. Fotocopiar sin autorización es un delito.

3FDPNFOEBDJPOFTFOMBQSgDUJDB Para ilustrar algunas de las ideas planteadas en el apartado previo, tomemos un hipotético ejemplo y, comenzando con una representación gráfica deficiente, vayamos corrigiendo errores y enriqueciéndola aplicando distintos cambios que nos den lugar a diferentes visiones de los datos de nuestro problema, tal vez útiles para responder a objetivos diversos. Pretendemos evaluar el efecto inducido por un fármaco (F) frente a placebo (P) en un diseño de grupos paralelos donde 50 pacientes se han aleatorizado en dos grupos de 25, y disponemos de una medida basal (B) y un postratamiento (PT) del parámetro funcional de interés (resistencia pulmonar, con unidades hPa l−1 s). La primera representación (fig. 5-4A) corresponde a un diagrama de barras con elementos que obstaculizan, o directamente impiden, al lector la correcta percepción de los resultados obtenidos. El efecto de profundidad, las líneas de parrilla, los tramados, la base oscura, distraen más que ayudan, sin aportar absolutamente nada a la representación gráfica. La falsa perspectiva, y los distintos planos en los que se encuentran el eje de ordenadas y las barras provocan que la percepción de la altura no se corresponda con el valor que representan, lo que hace necesario incluirlos en el gráfico. Además, el eje de ordenadas muestra un rango pequeño, exagerándose visualmente las diferencias entre ambos grupos (P frente a F), diferencia que además se expresa en forma de resultado estadístico como un valor de p descontextualizado, sin indicar a qué contraste corresponde. Simplemente corrigiendo estos aspectos obtenemos la figura 5-4B, donde se ha mantenido toda la información relevante y se han eliminado los elementos superfluos, a la vez que se ha corregido la distorsión. Ahora, el lector puede apreciar de modo mucho más claro el resultado global del experimento. Aun así, este nuevo gráfico no permite al lector hacerse una composición de lugar sobre la imprecisión asociada, información que deberá buscar en el texto o en alguna tabla del manuscrito, lo que le impide evaluar críticamente las diferencias y la significación que muestra el gráfico. Incorporar la información sobre la variabilidad puede hacerse fácilmente y, en este caso, hemos optado por incluir una línea que indique la semiamplitud del intervalo de confianza del 95% (dado que es simétrico) a la vez que hemos eliminado el valor de p (que habremos incorporado al texto de forma apropiada) obteniendo la figura 5-4C. Sin embargo, una mirada crítica a este gráfico nos permite identificar dos cuestiones importantes. En primer lugar, el gráfico muestra únicamente los valores correspondientes a la media, la variabilidad y el tamaño muestral de cuatro grupos, información que quizá podría plasmarse mejor en forma de tabla. En segundo lugar, no se expresa la relación entre los valores basales y postratamiento, ignorando la dependencia entre ambas observaciones. En el mismo gráfico se puede representar la distribución de las observaciones en los cuatro grupos, lo que solventaría el primero de los puntos. Diversas alternativas nos permiten comparar las distribuciones: box-plots, donde se representa la distribución de forma condensada tal y como se representa en la figura 5-4D; histogramas, diagramas de tallo y hojas, o dot-plots adyacen-

&MBCPSBDJwOEFVONBOVTDSJUP

6 Basal Postratamiento

6

Resistencia pulmonar

5 P < 0,002

4 4

4 4 3 Placebo Grupo

Figura 5-4A

Fármaco

6 Basal Postratamiento 5

P < 0,002

Resistencia pulmonar

4

3

2

1

0 Placebo

Figura 5-4B

Fármaco Grupo

Continúa

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

7 Basal 6

Postratamiento

Resistencia pulmonar

5

4

3

2

1

n = 25

n = 25

n = 25

n = 25

0 Placebo

Fármaco Grupo

Figura 5-4C 10

9

Basal Postratamiento

8

7

Resistencia pulmonar

© Elsevier. Fotocopiar sin autorización es un delito.

6

5

4

3

2

1 n = 25

n = 25

n = 25

n = 25

0 Placebo

Figura 5-4D

Grupo

Fármaco

Continúa

&MBCPSBDJwOEFVONBOVTDSJUP

10 9

Resistencia pulmonar

8 7 6 5 4 3 2 1 0 B

PT Placebo

Figura 5-4E

B Grupo

PT Fármaco

Placebo

10

Resistencia pulmonar

9 8 7 6 5 4 3 2 1 0 Basal

Postratamiento Fármaco

10

Resistencia pulmonar

9 8 7 6 5 4 3 2 1

Figura 5-4F

0 Basal

Postratamiento

Continúa

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

10 9 8

Resistencia pulmonar

7 6 5 4 3 2 Placebo 1

Fármaco

0 Figura 5-4G

10 9

Tipo A Tipo B

Resistencia pulmonar

© Elsevier. Fotocopiar sin autorización es un delito.

8 7 6 5 4 3 2 1 0 Placebo

Fármaco

Figura 5-4H Figura 5-4. La evolución de un gráfico deficiente a un gráfico útil.

&MBCPSBDJwOEFVONBOVTDSJUP

tes, donde se muestra la distribución completa de los datos (fig. 5-4E). Cualquiera de estas gráficas transmite una imagen bastante realista de los resultados del experimento: apreciamos que la distribución de los valores postratamiento tiende a presentar un cierto desplazamiento hacia valores superiores en ambos grupos, aunque el hecho más llamativo es que el fármaco ensayado induce un sensible incremento en la dispersión de los valores postratamiento, lo que permite plantear al lector cuestiones sobre la heterogeneidad en su efecto, o tal vez problemas en la forma de administración. No nos olvidemos del segundo problema que habíamos identificado: la dependencia individual entre los valores basales y postratamiento. Un modo usual de incluir esta relación en el gráfico es unir los puntos de los dot-plots mediante segmentos tal y como se muestra en la figura 5-4F. Esta estrategia útil permite mostrar al lector que parte de la gran dispersión observada en el grupo con tratamiento activo se debe a que parecen existir dos «tipologías» de individuos: la mayoría, que sí manifiestan un efecto, y algunos individuos que no reflejan prácticamente cambio alguno respecto al valor basal. Con 25 individuos en cada grupo, un tamaño relativamente pequeño, esta representación gráfica parece interesante, pero si dispusiéramos de 200 individuos por grupo, su utilidad se vería muy comprometida, pues la gran densidad de segmentos ocultaría cualquier patrón señalado por una posible relación. En estas situaciones se debe recurrir a otras alternativas, como presentar un diagrama de puntos de la diferencia postratamiento menos basal (PT–B) respecto del valor basal, o la alternativa presentada en la figura 5-4G, donde se han ordenado los individuos de menor a mayor en función de sus valores basales, mostrando la magnitud del cambio inducido por el tratamiento como líneas verticales de distinta longitud, con lo que su extremo está indicando el valor individual postratamiento17. En revistas biomédicas es mucho más habitual encontrar el primer tipo de gráficos para mostrar la relación (v. fig. 5-4F) que esta última alternativa (v. fig. 5-4G). Aunque ambos gráficos muestran al lector el experimento efectuado con gran detalle, si se siguen las recomendaciones de Cleveland18 sobre la percepción visual sería preferible utilizar este último gráfico, puesto que las magnitudes del cambio inducido se expresan de forma directa como una longitud, mientras que en el gráfico anterior tienen que derivarse de la pendiente del segmento. Estas consideraciones sobre las diferencias en la percepción de la imagen gráfica pueden parecer muy sutiles, pero el lector debe tener en cuenta que pueden llegar a repercutir en la toma de decisiones derivadas de la información contenida en el gráfico, tal y como han demostrado algunos autores19. Otras modificaciones permitirían incluso añadir más información al gráfico sin complicarlo. La inclusión de otras potenciales variables de interés, como por ejemplo el sexo o cualquier estratificación de una variable continua, puede lograrse simplemente introduciendo distintos símbolos o colores en estos mismos gráficos (fig. 5-4H). Recordamos al lector que este ejemplo sólo pretende ilustrar las posibilidades que nos ofrece un gráfico de calidad para evaluar las complejas relaciones que pueden presentar los datos, en este caso un experimento con grupos paralelos.

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

© Elsevier. Fotocopiar sin autorización es un delito.

-""5&/$*Î/"-1"$*&/5& 16&%&/":6%"3/04-04(3Ç'*$04 Actualmente, los profesionales de la salud (personal técnico, de enfermería o médicos) disponen de una abrumadora cantidad de información sobre el paciente. ¿Es esto, tal como parece, una buena noticia? Creemos que sí, pero se hace necesario plantearse alternativas que faciliten el manejo y la utilización de toda esta información al profesional de la salud. El historial médico completo de un paciente contiene información de muy diversos tipos, orígenes y finalidades, y en muchas ocasiones no está organizada para ser de especial utilidad en el cuidado y seguimiento clínico del paciente. Algunos estudios han demostrado que la utilización de información resumida y bien organizada mejora la calidad asistencial20. La representación gráfica ha de permitir al profesional explorar la información disponible sobre el paciente a distintos niveles de profundidad (p. ej., respecto al tiempo) o de abstracción (p. ej., representando simultáneamente distintos parámetros relacionados con una determinada función vital), lo que ha de redundar en una mejor comprensión de los datos así como estimular y facilitar la identificación de patrones o relaciones que difícilmente serían detectados de otra manera. Se han propuesto algunas iniciativas, tanto en ámbitos específicos (respiratorio21, cuidados intensivos22) como en un entorno general hospitalario23-25. Éste es un campo relativamente reciente, y dado que el coste del desarrollo, implementación y mantenimiento de este tipo de herramientas es elevado, son aún pocos los ensayos pioneros en esta dirección. Por todo ello, no se dispone todavía de suficiente información para definir directrices generales adecuadamente validadas que puedan ayudar en el diseño de soluciones eficaces en el entorno asistencial particular. En el ámbito de la medicina, las herramientas o sistemas de visualización de la información deberían conseguir un variado y ambicioso conjunto de objetivos. Éstos cubren desde la presentación de la información médica de un modo más intuitivo, fácil de comprender, aprender y reconocer, hasta permitir al profesional la posibilidad de ampliar visualmente información sutil y sobre los eventos relacionados con el diagnóstico, tratamiento, gestión de pacientes y su proceso de curación, que de otro modo sería difícil de plasmar. Todo ello sin olvidar la premisa fundamental: evitar el exceso de información, que colapsa y dificulta la apreciación de la información relevante. El procedimiento propuesto por Powsner y Tufte23 se basa en una representación compuesta por un panel denominado graphical patient summary donde cada subgráfico del panel presenta una variable de interés (fig. 5-5), junto a un listado de eventos asociado a cada paciente. Es un diseño relativamente sencillo pero muy informativo, al que se le pueden añadir muchos elementos de interactividad para adecuarlo a las necesidades de un entorno particular. En resumen, subrayemos que los gráficos son una herramienta con un potencial que va más allá del terreno estrictamente científico y con una clara utilidad en el ámbito asistencial. No dudamos de que estas herramientas se irán introduciendo progresivamente en nuestro entorno y éstas serán de mayor utilidad en la medida en que los propios profesionales implicados sean capaces

&MBCPSBDJwOEFVONBOVTDSJUP

16-abril

26-abril-03 2

Glucosa

12.9 mmol/l

+

3

+

Severamente Reducido reducido

Rango normal

Elevado

Severamente elevado

1

-

-1 año

-1 sem

4

5

6

Figura 5-5. Diseño básico de un subgráfico típico del graphical patient summary propuesto por Powsner y Tufte23, que permite evaluar con facilidad la serie histórica de valores de glucemia del paciente. Å fecha de admisión; Ç fecha actual; É último valor observado; Ñ un año, o más, anteriores a la admisión; Ö la semana anterior a la admisión; Ü la semana posterior a la admisión.

de aportar ideas y sugerencias sobre sus necesidades vinculadas a las tareas de atención al paciente.

$0/$-64*0/&4 El profesional científico, y en particular el profesional de la salud, puede beneficiarse de un conocimiento notable de la técnica de representación gráfica de datos. Al igual que la estadística, no es un barniz de ciencia que puede mejorar el aspecto de un trabajo deficiente. Es una herramienta imprescindible en el proceso de revelación del conocimiento, enturbiado por auténticas avalanchas de datos de obtención económica. El lenguaje de la representación gráfica es prácticamente una disciplina que progresa a medida que surgen nuevos retos y propuestas de solución. Por ello, no podemos constatar la existencia de un conjunto sólido de referencias que debe seguir el profesional que lo desea aplicar adecuadamente en su área, solamente algunas guías con bastante sentido común. Las buenas representaciones gráficas comparten con la redacción de calidad el mérito de convertir al lector

& - * . 1" $ 5 0 % & - 0 4 ( 3 Ç ' * $ 0 4 & / - " $ 0 . 6 / * $ " $ * Î / $ * & / 5 Ê ' * $ "

en un participante activo del trabajo: no sólo le atraen y le involucran en la investigación, sino que además le convierten en un evaluador crítico que aprende e imita las técnicas del lenguaje que tan hábilmente le han atrapado. Recomendable es la obra de Tufte26, quien plasma en sus libros abundantes ejemplos de la buena y la mala práctica del uso de gráficos. Tras un repaso, el lector seguramente hallará motivación para aplicar el mismo grado de rigor a sus representaciones gráficas que a sus textos.

#*#-*0(3"'Ê" 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.

© Elsevier. Fotocopiar sin autorización es un delito.

16.

17. 18. 19.

20.

21. 22.

Wainer H. Graphical visions from William Playfair to John Tukey. Statistical Science. 1990;3:340-6. Armitage P, Berry G. Estadística para la investigación médica. 3.ª ed. Madrid: Harcourt Brace; 1997. Bland JM, Altman DG. Measuring agreement in method comparison studies. Stat Methods Med Res. 1999;8:135-60. Fisher RA. Statistical methods for research workers. Londres: Oliver and Boyd; 1925. Everitt B. Graphical techniques for multivariate data. Londres: Heinemann Educational Books Ltd.; 1978. Tukey JW. Exploratory data analysis. Reading, Ma.: Addison-Wesley; 1977. Aluja T, Morineau A. Aprender de los datos. El análisis de componentes principales: una aproximación desde el Data Mining. Barcelona: EUB; 1999. Chernoff H. The use of faces to represent points in k-dimensional space graphically. J Am Stat Assoc. 1973;68:361-8. Inselberg A. The plane with parallel coordinates. The Visual Computer. 1985;1:69-91. Manly BFJ. Multivariate statistical methods: a Primer. 2.ª ed. Londres: Chapman and Hall; 1994. Wainer PF, Velleman H. Statistical graphics: Mapping the pathways of science. Annu Rev Psychol. 2001;52:305-35. Wegman EJ. Visual data mining. Stat Med. 2003;22:383-97. International Committee of Medical Journal Editors. Uniform requirements for manuscripts submitted to biomedical journals. Ann Intern Med. 1997;126:36-47. Lemann J. Serving as a reviewer. Kidney Int. 2002;62:1081-7. Mora R. Cómo mejorar la calidad estadística de los artículos presentados a revistas biomédicas: lista de comprobación para los autores. Med Clin (Barc). 1999;113:138-49. Schriger DL, Cooper RJ. Achieving graphical excellence: Suggestions and methods for creating high-quality visual displays of experimental data. Ann Emerg Med. 2001;37:7587. McNeil D. On graphing paired data. Am Stat. 1992;46:307-11. Cleveland WS. The elements of graphing data. Monterey, Ca.: Wadsworth Advanced Books and Software; 1985. Elting LS, Martin CG, Cantor SB, Rubenstein EB. Influence of data display formats on physician investigators’ decisions to stop clinical trials: Prospective trial with repeated measures. BMJ. 1999;318:1527-31. Whiting-O’Keefe QE, Simborg DW, Epstein WV, Warger A. A computerized summary medical record system can provide more information than the standard medical record. JAMA. 1985;254:1185-92. Cole WG, Steward JG. Metaphor graphics to support integrated decision making with respiratory data. Int J Clin Monit Comput. 1993;10:91-100. Horn W, Popow C, Unterasinger L. Support for fast comprehension of ICU Data: Visualization using Metaphor Graphics. Methods Inf Med. 2001;40:421-4.

&MBCPSBDJwOEFVONBOVTDSJUP 23. 24.

25. 26.

Powsner SM, Tufte ER. Graphical summary of patient status. Lancet. 1994;344:386-9. Plaisant C, Mushlin R, Snyder A, Li J, Heller D, Shneiderman B. LifeLines: using visualizations to enhance navigation and analysis of patient records. 1998 Proc AMIA Annu Fall Symp. 1998:76-80. Kosara R, Miksch, S. Visualization methods for data analysis and planning in medical applications. Int J Med Inf. 2002;68:141-53. Tufte ER. The visual display of quantitative information. Cheshire, Ct.: Graphics Press; 1983.

&MFTUJMPDJFOUrGJDP .1VMJEP

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ La palabra «estilo» proviene del latín stylus, nombre aplicado al punzón con el cual escribían los antiguos en tablas enceradas. Por metonimia, tropo que consiste en designar algo con el nombre de otra cosa tomando el efecto por la causa o viceversa (es decir, el empleo de las palabras en sentido distinto del que propiamente les corresponde, pero que tiene con éste alguna conexión, correspondencia o semejanza), entendemos por estilo la manera de escribir o de hablar peculiar de un escritor o de un orador. El estilo científico correspondería pues al carácter propio que los científicos —y, en este caso, los médicos y profesionales de la salud— dan a sus trabajos, entendiéndose como el conjunto de características y cada una de las distintas formas que los individualizan. En general, el examen de los textos escritos (mayoritariamente artículos) que se publican en la literatura biomédica, considerados como clase o categoría (frente a otras, como, por ejemplo, la de los escritos literarios, filosóficos o periodísticos) pone de manifiesto la baja calidad de los mismos. Independientemente del contexto científico, orientación particular de la revista, idioma y lugar de publicación, un sinfín de críticas han resaltado, entre otros, algunos de los defectos que los caracterizan: la monotonía, ampulosidad, jerga, ambigüedad, expresión tosca, imprecisión y falta de claridad. Muchos científicos desconocen que durante el proceso de revisión de los manuscritos por expertos (peer review), hasta una cuarta parte de las objeciones suscitadas por los expertos son debidas a problemas relativos a la incomprensión del texto, lo que es lo mismo, a la incapacidad de los autores para poder reflejar adecuadamente por escrito la línea argumental de su pensamiento. Con frecuencia los conceptos esenciales y las ideas sobresalientes son ininteligibles porque no se supieron elegir las palabras adecuadas, la sintaxis precisa, construir las frases lógicas o agruparlas en párrafos coherentes para crear un escrito claro, sencillo, lúcido y brillante. De hecho, los investigadores tampoco son igualmente conscientes de la enorme rivalidad que se establece en la sede de las revistas biomédicas, ya en la fase inicial, durante las primeras evaluaciones de los manuscritos científicos. La comprobación de la buena disposición de las secciones del texto, el respeto escrupuloso de las instrucciones específicas de la revista en cuestiones de pre-

&MBCPSBDJwOEFVONBOVTDSJUP

sentación y redacción, así como una prosa que refleje ideas bien organizadas, adecuadamente dispuestas y coherentes son, sin duda, el mejor atributo para realzar la cuestión científica del trabajo y, en último término, el mensaje del estudio.

-"$"-*%"%%&-"3&%"$$*Î/$*&/5Ê'*$" Lamentablemente, la destreza para escribir y la importancia de la calidad de la redacción científica y, por ende, de los escritos médicos están sujetas a un cierto menosprecio en el ambiente altamente tecnificado y competitivo del quehacer diario de los médicos. Las enseñanzas escolares quedan lejos. Durante los años de formación universitaria, los exámenes suelen ser del tipo de respuestas múltiples y hay pocas posibilidades de ejercitar las habilidades de redacción para desarrollar temas extensos por escrito. A lo largo de los años de formación de posgrado, las historias y los informes se garabatean deprisa, con profusión de abreviaturas, expresiones clisé, anglicismos y jerga, lo que los hace prácticamente indescifrables e ininteligibles para cualquier persona ajena a la medicina, o incluso para los propios facultativos ajenos a la nomenclatura y acrónimos de una temática o subespecialidad determinada. Además, los modelos asiduos de lectura del médico suelen ser los artículos científicos de la especialidad, en su mayoría publicados en inglés, lo que complica todavía más el aprendizaje de las habilidades necesarias para redactar correctamente los escritos médicos usando un estilo científico adecuado. Asimismo, otra creencia común es el divorcio entre el «fondo» y la «forma», de manera que, habiendo un asunto sustancial que comunicar (en resumen, una cuestión científicamente de interés), la forma o el modo como éste se transcriba y redacte tiene poca importancia. Muchos profesionales de la salud admitirían, a lo sumo, la claridad (a veces sinónimo de objetividad) como único requerimiento formal para un escrito de estilo apropiado. Obviamente, la claridad no puede representar una virtud aislada sin tener en consideración otros aspectos cualitativos inherentes a la buena prosa científica, tales como la precisión, la sencillez, la fluidez y la concisión. Es evidente que pocos profesionales estamos dotados de genio literario; pero, para la inmensa mayoría, la consecución de un nivel adecuado de sintaxis y morfología a la hora de escribir se fundamenta, además de en la toma de conciencia de la importancia de redactar con corrección, en un proceso de aprendizaje. Para salvar los obstáculos en el logro de este objetivo relativamente sencillo, tanto en la etapa del adiestramiento como en la fase de puesta en práctica de los objetivos alcanzados, e incluso más tarde, cuando se ha logrado un claro dominio de la redacción científica, se deberían contemplar algunos aspectos básicos, de índole general, que son esenciales y de sentido común.

3FGMFYJPOFTBOUFTEFFNQF[BSBFTDSJCJS ¿En qué se diferencia un buen escrito de otro peor, o de uno francamente malo? Es probable que ninguna respuesta pueda satisfacer plenamente, ya

&-&45*-0$*&/5Ê'*$0

que la bondad es una cualidad subjetiva. Aunque parte de la excelencia proviene de la ausencia de errores y del respeto escrupuloso de las reglas gramaticales del idioma en el que se escribe, esta corrección no es, por sí misma, una garantía. Las reflexiones que se proponen a continuación son útiles por diversos motivos, especialmente para mejorar la eficiencia en la tarea de escribir.

1PSRVnZQBSBRVJnOTFFTDSJCF

© Elsevier. Fotocopiar sin autorización es un delito.

Sin prestar atención a la importancia de conocer el propósito de por qué se escribe y a quién va dirigido el escrito, es fácil que la novedad principal, el resultado sobresaliente o el asunto de mayor interés del trabajo de investigación queden desdibujados en el marco global del escrito. La respuesta a la pregunta ¿por qué se escribe? implica un ejercicio de síntesis antes de empezar. Es decir, plasmar por escrito en tres o cuatro frases el mensaje real del trabajo, las conclusiones o implicaciones del estudio que de forma prioritaria se desea transmitir a los lectores del escrito. La finalidad real del asunto tampoco puede llegar clara y directamente al usuario del artículo si durante el proceso de redacción científica del texto no se tuvieron en cuenta las características propias de los lectores. Aquellos rasgos inherentes a su condición que los hacen peculiares y los diferencian de los demás. Es natural que el nivel de complejidad de un texto científico, y, como consecuencia, el grado de elaboración y de diversidad del estilo científico, dista de ser el mismo en función, por ejemplo, de los conocimientos del lector. El estilo requerido para describir un avance médico en un medio de comunicación de masas, como la prensa escrita, no puede ser idéntico al necesario para referir el mismo avance en un periódico especializado, en una gaceta médica o en una publicación científica. En síntesis, el mejor estilo científico es aquel que, adaptándose a cada circunstancia, consigue una prosa concisa, directa, precisa y, si es posible, atractiva, porque ha utilizado las mejores construcciones gramaticales y las palabras más adecuadas para transmitir, sobre todo, el mensaje del trabajo y para hacer hincapié en su importancia. Una premisa indispensable es haberse puesto en la posición del lector, o simplemente contestar a la pregunta: si yo fuera el lector de este trabajo, ¿qué me interesaría conocer?

0SHBOJ[BSMBTJEFBT El lector atento discierne con gran facilidad si la línea de pensamiento del escrito es ilógica o está incompleta. Para asegurar la coherencia, pilar fundamental del estilo científico, es recomendable escribir un esbozo, asegurándose de que contiene las partes esenciales que constituyen el cuerpo del documento y que posteriormente hay que desarrollar.

4FMFDDJPOBSZFNQMFBSMBTQBMBCSBTDVJEBEPTBNFOUF La simplificación es la clave para lograr una comunicación rápida y efectiva. En este sentido, los estudios sobre la calidad de la condición de legibilidad de los

&MBCPSBDJwOEFVONBOVTDSJUP

textos biomédicos demuestran que el nivel óptimo de comunicación se establece cuando el estilo científico empleado logra un grado de comunicación justo por debajo de la cota de comprensión del lector.

$PSSFHJSFMUFYUP El primer intento para conseguir un estilo científico acorde con los preceptos que hay que seguir y los vicios que hay que eludir (descritos a continuación) nunca es el definitivo. Todos los buenos y avezados escritores revisan su trabajo varias veces, mejorando párrafos oscuros, construcciones defectuosas, buscando sinónimos más apropiados, cambiando el orden de los párrafos y mejorando la puntuación del escrito. Uno mismo casi nunca es lo suficientemente crítico con sus propios artículos y con su estilo científico. Disponer de la opinión, y corrección, de alguien con competencia probada en esta tarea es altamente provechoso. Además, ofrece una forma de aprendizaje de inestimable valor.

"53*#6504%&-#6&/&45*-0$*&/5Ê'*$0 A continuación se describen algunos de los atributos que caracterizan el buen estilo científico, es decir, las cualidades que hay que cultivar frente a los defectos que han de evitarse.

$MBSJEBE Un estilo científico claro es aquel que presenta un razonamiento o argumento de fácil comprensión. Su oponente es el estilo farragoso, caracterizado por una forma de escribir en el que abundan ideas desordenadas, oscuras, inconexas y que no muestran relación entre sí. Algunas veces se omiten una o más palabras (necesarias para una construcción gramatical correcta) creyendo que el sentido resulta más claro, como en el caso de la elipsis (p. ej., «no adenopatías» por «no se palpan adenopatías»). El abuso del reflexivo y de la voz pasiva (p. ej., «ha sido encontrado, haya sido debido, fueron analizados») también resta claridad. Ejemplo (estilo claro): Varón de 20 años de edad que desde hacía 14 meses se trataba con sesiones de acupuntura por dolor en el calcáneo. El motivo de consulta fue anorexia, astenia, ictericia, coluria, prurito y dolor abdominal difuso de 72 horas de evolución.

Ejemplo (estilo oscuro): Desde comienzos de los años sesenta, se viene insistiendo en la necesidad de establecer equipos médicos que entiendan sobre el uso de antimicrobianos (AM), aprovechando los recuentos periódicos de las infecciones que surgen en el hospital.

&-&45*-0$*&/5Ê'*$0

'MVJEF[ Un estilo científico fluido es aquel que no muestra dificultad a la lectura, en el que la línea argumental se sigue y comprende perfectamente, bastando una sola lectura. Dícese de un escrito que puede leerse de un tirón, al contrario del que es incoherente, inconsistente e ilógico. Ejemplo (estilo fluido): No es fácil hacer la crítica de un diccionario. Me parece imposible leerlo de punta a rabo. Se puede curiosear largamente por sus páginas, yendo de aquí para allá, que es ocupación grata para quienes sienten la fascinación de las palabras. Pero mejor es ir a comprobar algunos rasgos: un diccionario se recomienda por su autoridad, sus propósitos, su modernidad, esto es, a quiénes va dirigido y qué servicios pretende prestar.

Ejemplo (estilo incoherente): La experiencia de nuestro grupo, con más de 68 casos en los últimos cinco años (datos no publicados), es tan variada como la detección de infecciones en la válvula mitral, el hallazgo de abscesos en el aparato subvalvular con bloqueo completo como presentación clínica, sin imagen ecocardiográfica de típica vegetación valvular en pacientes sin antecedentes de endocarditis infecciosa.

1SFDJTJwO Un estilo científico preciso se caracteriza por los atributos de concisión y exactitud rigurosa, es decir, el texto escrito no es ambiguo, incierto, dudoso, ni admite interpretaciones distintas en función del lector. La metáfora sólo vale cuando añade fuerza expresiva y precisión a lo que se escribe. Ejemplo (estilo preciso):

© Elsevier. Fotocopiar sin autorización es un delito.

Cuando se planifica la realización de un ensayo clínico, un aspecto que merece especial atención es el de informar cuidadosamente a todos los investigadores del objetivo primario del estudio.

Ejemplo (estilo impreciso): Para los pacientes que no requerían relajación muscular, la técnica anestésica consistía en el uso de óxido nitroso oxígeno 60/40% durante varios minutos.

4FODJMMF[ Un estilo científico sencillo se caracteriza por descripciones llanas, sin artificio, utilizando palabras simples y carentes de tecnicismos, en la medida de lo posible. Como contrapartida, un estilo verboso se caracteriza por ser abundante y copioso de palabras. Si, para evitar la repetición de palabras, se em-

&MBCPSBDJwOEFVONBOVTDSJUP

plean sinónimos, hay que procurar escoger términos sencillos, que no sean muy raros, a fin de evitar la interrupción de la lectura para tener que recurrir al diccionario. La costumbre de emplear palabras altisonantes está muy extendida, creyendo que confiere más categoría al estilo científico. La sencillez está reñida con la ampulosidad. Aunque ciertos términos altisonantes están recogidos en el Diccionario de la Real Academia Española de la Lengua, cuanto más sencilla y fácil de entender sea una palabra, más claro y fácil será el mensaje (algunos términos altisonantes y su correspondiente término más sencillo son los siguientes: posicionamiento por «posición», atractividad por «atracción», uniformización por «uniformidad»). Ejemplo (estilo sencillo): Numerosos estudios epidemiológicos han coincidido en destacar la asociación de tabaquismo, hipertensión, hipercolesterolemia y diabetes como el principal factor de riesgo de aterosclerosis coronaria.

Ejemplo (estilo verboso): Plenamente demostrada la importancia de la función inmunológica del bazo, que ha estimulado la búsqueda de técnicas quirúrgicas para el salvamento de este importante órgano, creemos que en el momento actual la asociación de los conocimientos anatómicos del bazo, con la disponibilidad de modernos métodos de exploración y control, permiten dar un nuevo paso en la idea de conservación esplénica.

$PODJTJwO Un estilo científico conciso se caracteriza por la sobriedad, brevedad y economía de palabras en el modo de expresar un concepto con exactitud. Su antónimo sería un estilo pomposo, ostentoso (galas retóricas), hueco, hinchado y altisonante. Con frecuencia, el uso de circunloquios (escritura de varias palabras cuando con una sola podría entenderse el escrito; p. ej., en un número considerable de casos por «frecuentemente», en la totalidad de los pacientes por «todos», en la proximidad de por «cerca») origina un estilo ampuloso y poco conciso. Asimismo, debería evitarse el empleo de palabras innecesarias con el propósito de enfatizar o añadir expresividad, tal como sucede en el caso de los pleonasmos. Los pleonasmos (p. ej., conclusiones finales, repetir de nuevo, persona humana, base fundamental) contribuyen a la superabundancia de palabras y no favorecen la buena legibilidad del escrito. Ejemplo (estilo conciso): El objetivo del estudio fue valorar la relación existente entre los niveles de contaminación atmosférica y las visitas de urgencia por crisis de asma en la ciudad de Roma.

&-&45*-0$*&/5Ê'*$0

Ejemplo (estilo pomposo):

© Elsevier. Fotocopiar sin autorización es un delito.

El análisis retrospectivo de esta serie de pacientes, formando parte del colectivo de visitas ambulatorias de nuestro centro, ha significado un punto muy valioso de referencia, con el fin de poder comparar los resultados obtenidos con los derivados de estrategias educacionales basadas en la distribución de folletos informativos cuyos datos proceden de los resultados procedentes de un análisis en controles históricos.

Otros defectos de la prosa científica que conviene evitar incluyen el artificio (uso de jerga especializada, tendencia a la solemnidad), la vacuidad (sentencias huecas, comentarios irrelevantes, perogrulladas, vaguedades inespecíficas), la pretensión (tentación de exagerar a la hora de ponderar un problema o de interpretar un resultado), la monotonía (falta de variedad, repetitivo, frases uniformes) y el coloquialismo (propio o relativo de una conversación informal, modos de decir coloquiales que no son parte del lenguaje formal de la comunicación escrita). Por otra parte, el empleo de sinécdoques (tropo que consiste en extender, restringir o alterar de algún modo la significación de las palabras, para designar un todo con el nombre de una de sus partes, o viceversa; p. ej., operar una rodilla o tratar un pulmón) contribuye a la mala calidad de la prosa científica. Otros defectos frecuentes, tales como las construcciones negativas (p. ej., osteoartritis no primitiva), las faltas ortográficas por derivación defectuosa (p. ej., preveer por «prever», lubrificar por «lubricar») o las palabras incorrectas usadas como sinónimos (p. ej., caso por «paciente», cantidad por «concentración», dosificación por «dosis», temperatura por «fiebre», variable por «variado», definitivo por «distinto», eficaz por «eficiente») son vicios extendidos que empobrecen la prosa científica. Sin embargo, cabe destacar que el buen estilo científico aúna la mayoría de las cualidades deseables. Un estilo claro suele ser fluido, conciso y sencillo, mientras que el estilo científico defectuoso generalmente combina los vicios de ambigüedad, imprecisión, verbosidad, jerga, artificio y vacuidad. Otro rasgo sobresaliente del buen estilo científico es que es fácil de puntuar. Las frases claras, cortas e inequívocas eliminan los problemas de puntuación; es decir, las dudas referentes al uso de los signos ortográficos necesarios para distinguir el valor prosódico de las palabras y el sentido de las oraciones y de cada uno de sus miembros, especialmente del signo ortográfico de la coma. Las frases cortas y largas deben conjugarse según lo exija el sentido del párrafo, ni la monótona sucesión de frases cortas ininterrumpidas (el abuso del punto y seguido propio del modo de escribir anglosajón), ni la vaguedad del período ampuloso.

&3303&4'3&$6&/5&4 El rigor es una característica propia del lenguaje científico y no sólo en cuanto al contenido, sino también en cuanto a la elección de las palabras adecuadas para cada mensaje. A continuación se describen los errores que se cometen con más frecuencia en los textos médicos, la presencia de los cuales, de forma única o combinada, puede afectar seriamente a la bondad del estilo científico.

&MBCPSBDJwOEFVONBOVTDSJUP

"CVTPEFTJHMBT Las siglas son palabras formadas por el conjunto de letras iniciales de una expresión compleja. Aunque en los trabajos científicos tienen la ventaja de la concisión (p. ej., en el caso de la extensión limitada del resumen), no se debe abusar de ellas. En general, las siglas utilizan letras mayúsculas (p. ej., SNC: sistema nervioso central), pero también puede incluir letras minúsculas como modificadoras del contenido (p. ej., ARNm: ácido ribonucleico mensajero). En la elaboración de los textos científico-médicos hay una tendencia a convertir en abreviatura cualquier término, con el fin de ahorrar espacio o ganar agilidad expresiva (p. ej., PA: pancreatitis aguda, EIC: enfermedad inflamatoria crónica), sin tener en cuenta que el abuso de siglas precisamente dificulta la legibilidad de los escritos. Ejemplo (abuso de siglas): En nuestra experiencia, la IPP en DIR tratados con DPCA resulta la forma más fisiológica para mantener niveles estables de glucosa sérica. (IPP: insulina intraperitoneal; DIR: diabéticos con insuficiencia renal; DPCA: diálisis peritoneal continua ambulatoria.)

&YUSBOKFSJTNPT BOHMJDJTNPT

Se denominan extranjerismos a los vocablos o giros de una lengua empleados en otra (en el caso de los anglicismos, la adopción de términos o expresiones propios del inglés), en nuestro caso el castellano, sin haberse adaptado a los criterios lingüísticos propios, ni haberse aceptado oficialmente. Los extranjerismos suelen ser en su mayoría barbarismos. Sin embargo, cuando estos términos ocupan un vacío semántico en la otra lengua o, lo que es más frecuente, cuando se afianzan por el uso repetido (p. ej., randomizar), los términos acaban por aceptarse. Como corolario, en no pocas ocasiones, la Real Academia de la Lengua Española acaba por reconocer y admitir dichos vocablos o nuevas acepciones de los términos (p. ej., el término desapercibido como sinónimo de «inadvertido», comportar como sinónimo de «implicar» o «suponer», test como sinónimo de «ensayo» o «prueba»). Otras veces, el término en inglés es tan habitual que, aunque no esté aceptado, no puede ser sustituido por otro (p. ej., shock). Asimismo, en ocasiones, aun existiendo la palabra alternativa en nuestra lengua, se utiliza otra palabra castellana similar al término anglosajón (p. ej., «medicina basada en la evidencia» por «medicina basada en las pruebas»). Cabe mencionar también el falso amigo, que es una palabra de otro idioma que se parece (en la escritura o en la pronunciación) a una palabra en la lengua materna del hablante, pero que tiene un significado diferente. Algunos ejemplos de falsos amigos en inglés son los siguientes: abstract (por «abstracto»), actually (por «actualmente»), ancient (por «anciano»), attend (por «atender»), college (por «colegio»), domestic (por «doméstico»), large (por «largo»), lecture (por «lectura»), quarterly (por «cuatrimestral»), recipient (por «recipiente»), severe (por «severo») o success (por «suceso»).

&-&45*-0$*&/5Ê'*$0

Es obvio que la medicina es una ciencia en constante cambio, y muchas veces el lenguaje no es lo suficientemente versátil y acomodadizo para incorporar el término castellano con la suficiente celeridad al tecnicismo inglés. Sin embargo, sería deseable buscar la alternativa en nuestra lengua, aunque debido a que el inglés se ha convertido en el vehículo internacional para la transmisión de la información científica (y prácticamente el único), parece augurarse un panorama sombrío para poder contrarrestar la pérdida de nuestra riqueza verbal en beneficio de la universalidad del inglés.

#BSCBSJTNPT Incorrección que consiste en pronunciar o escribir mal las palabras, o en emplear vocablos impropios. En diversos manuales de estilo pueden encontrarse listas de barbarismos, algunos de los más corrientes son: visualizar por «observar», patología por «enfermedad», rutinario por «habitual», manejar por «tratar», bacteremia por «bacteriemia», adolecer por «padecer», o relegar por «quitar». Sin embargo, de todos los vocablos, posiblemente control sea el léxico bárbaro por excelencia. Algunos ejemplos del uso incorrecto de esta palabra son los siguientes:

© Elsevier. Fotocopiar sin autorización es un delito.

«administración de jarabe para el control de la tos»

tratamiento

«control de los parásitos»

supresión

«para el control de las secreciones»

reducir

«pacientes que han sido controlados»

revisados, seguidos

«el contagio puede controlarse»

evitarse

«controlar la diseminación del virus»

erradicar

«los linfocitos controlan la respuesta inmune»

modulan

«la infección también puede controlarse con amoxicilina»

curarse

«los mecanismos que controlan la función»

rigen, regulan

«el control de la tuberculosis»

la lucha contra

«el tubo control»

testigo

«control de aguas residuales»

depuración

«la erupción es autolimitada y se controla por sí misma»

extingue, desaparece

«la primera medida es controlar la hemorragia»

cortar, cohibir

«respiración controlada mediante aparatos de ventilación mecánica»

asistida

«la vacunación está considerada el mejor método de control»

profiláctico

«se prescriben analgésicos para controlar la cefalea»

aliviar

3FEVOEBODJB Consiste en el empleo de palabras innecesarias por estar ya expresado sin ellas lo que las mismas dicen. Suelen ser recursos viciosos que contribuyen a la tosquedad de la expresión.

&MBCPSBDJwOEFVONBOVTDSJUP «los resultados fueron completamente normales»

normales

«destacan unos márgenes absolutamente nítidos»

nítidos

«nuestra experiencia personal en el tratamiento»

nuestra experiencia

«un tumor hueco por dentro»

hueco

«en las circunstancias actuales presentes»

actuales

«conviene volver a releer las indicaciones del tratamiento»

releer

«la principal causa etiológica de la hipertensión arterial»

causa

«la participación activa en la discusión»

participación

1SPCMFNBTEFNPSGPMPHrB Algunos errores frecuentes incluyen confusiones de género (p. ej., el asma crónica, el asa estrangulada, el estroma), problemas con los sufijos (p. ej., nefrósico por «nefrótico», necrósico por «necrótico»), así como el desconocimiento acerca de las reglas de acentuación de las palabras compuestas (manteniendo únicamente la tilde de la última palabra cuando la palabra compuesta no está unida por un guión, p. ej., cientificotécnico, y respetando la tilde de ambas si las dos voces están unidas por un guión, p. ej., médico-quirúrgico); plural de las palabras compuestas (usando el plural para la última o para ambas palabras dependiendo de la presencia del guión, p. ej., cientificotécnicos, relación médicos-enfermos) o uso de guión cuando se utilizan siglas y nombres propios (p. ej., VIH-negativo, Coombs-positivo). Los errores de concordancia también son frecuentes, especialmente en el caso de las enumeraciones. Incorrecto: Los aspectos más importantes del programa han sido: 1) introducir una evaluación trimestral, 2) alentar al personal sanitario, 3) distribuir folletos informativos, 4) elaboración de un programa integral y 5) un estudio cuantitativo que está previsto próximamente.

Corrección: Los aspectos más importantes del programa han sido: 1) introducir una evaluación trimestral, 2) alentar al personal sanitario, 3) distribuir folletos informativos, 4) elaborar un programa integral y 5) diseñar un estudio cuantitativo que se llevará a cabo próximamente.

Para otras dudas referentes a otros aspectos del género gramatical, reglas de puntuación, uso de la tilde, símbolos, prefijos, terminaciones, raíces e índices, transcripción y pérdida de fonemas (no pronunciados) y palabras derivadas es recomendable consultar manuales de estilo y libros de gramática.

$0/4&+04:3&(-"413Ç$5*$"4&-%&$Ç-0(0 1. Las palabras son las herramientas del escritor: el empleo de la palabra exacta, propia y adecuada es una regla fundamental del buen estilo científico.

&-&45*-0$*&/5Ê'*$0

2. Por mucha práctica que se tenga en el arte de la redacción, nunca se logra una versión definitiva al primer intento. 3. En la mesa de trabajo nunca debe faltar un buen diccionario. 4. Los puntos y aparte indican al lector que el razonamiento contenido en un párrafo ha concluido y que seguidamente se inicia otra cuestión. 5. Conviene escribir en la forma más clara, sencilla y concisa que sea posible. 6. Hay que evitar el uso de anglicismos. 7. No conviene abusar de preposiciones, conjunciones, palabras rebuscadas, gerundios y adjetivos innecesarios. 8. Cuando se releen los escritos, siempre se encuentra algo que corregir. 9. Antes de escribir hay que tener una idea muy clara de lo que se quiere decir, es decir, del mensaje del trabajo. 10. Leer asiduamente a los buenos escritores. El estilo, como la música, también «se pega».

#*#-*0(3"'Ê"3&$0.&/%"%"

© Elsevier. Fotocopiar sin autorización es un delito.

Hernández-Vaquero D. El artículo científico en biomedicina. Normas para la publicación de trabajos. Barcelona: Ciba-Geigy; 1992. p. 39-60. Locutora J, Lorenzo-González JF. El lenguaje médico español. La realidad y el deseo. Med Clin (Barc). 2003;120:424-5. Llorens Perol J. Sobre la viciosa costumbre de abusar de barbarismos. Med Clin (Barc). 1985;84:315-6. Medicina Clínica. Manual de estilo. Publicaciones biomédicas. Barcelona: Doyma Libros, S.A.; 1993. p. 139-262. Navarro FA. Lenguaje médico: el rayo neológico que no cesa. Med Clin (Barc). 2004;122:430-6. Navarro FA, Hernández F, Rodríguez-Villanueva L. Uso y abuso de la voz pasiva en el lenguaje médico escrito. Med Clin (Barc). 1994;103:461-4. Ordóñez Gallego A, García Girón G. Diversos aspectos del lenguaje médico (los modismos al uso). Med Clin (Barc). 1988;90:419-21. Pulido M. Sobre la calidad de los escritos médicos. Med Clin (Barc). 1985;85:276-8.

&TDSJCJSFOJOHMnTOPSNBT HFOFSBMFTFJOUFSBDDJwO DPOFMUSBEVDUPS 9#PTDI

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ El profesional español a menudo se ve coartado y frenado en su intento de estructurar y escribir su investigación en inglés debido a la escasez de directrices sobre la estructura informativa del artículo científico con las que complementar sus conocimientos lingüísticos. En realidad, en la bibliografía hasta ahora publicada no se ha reflejado especial interés por el estudio del artículo de investigación. En este sentido, pretendemos que el presente capítulo abarque algunos de estos detalles. Uno de los aspectos más importantes que debe observar el investigador a la hora de redactar un artículo de investigación es conocer el destinatario, es decir, quién va a ser el lector más habitual de ese texto. Por esta razón, no es aconsejable cambiar el destino de un artículo sin hacer una revisión profunda del mismo, y no solamente en cuanto a las convenciones formales que cada revista marca en sus instrucciones al autor. Menos aconsejable aún puede ser traducir el artículo a una lengua extranjera —en este caso, el inglés— y enviarlo para su publicación en una revista internacional, si ése no era el destino original para el cual fue escrito el artículo. Probablemente, la diferencia más notable entre un artículo elaborado tan sólo para la comunidad científica nacional y otro dirigido a la internacional se encuentra en la justificación de la necesidad de la investigación que el autor debe hacer en la introducción del artículo. La actividad investigadora a nivel internacional es mucho más competitiva que aquella que se limita al ámbito nacional. Además de los aspectos relacionados con el lector a quien va dirigido el artículo de investigación, se han observado diferencias entre el estilo de este tipo de género en publicaciones nacionales e internacionales. Algunas de las causas

&MBCPSBDJwOEFVONBOVTDSJUP

apuntadas para explicar estas diferencias hacen referencia a modelos de escritura adquiridos por los autores en su propia lengua, que más tarde introducen de manera inconsciente en sus artículos de investigación destinados a publicaciones internacionales en inglés. Es necesario apuntar que los modelos, la terminología y las convenciones lingüísticas sufren variaciones constantes relacionadas con los nuevos conocimientos y las nuevas tendencias lingüísticas que van surgiendo. En el caso del artículo de investigación en inglés, el lenguaje responde a la necesidad del investigador de comunicar los resultados de sus estudios a la comunidad científica internacional y obtener así su reconocimiento.

&-*/(-c4&/-"416#-*$"$*0/&4$*&/5Ê'*$"4 Si bien muchas de las convenciones que diferencian los artículos de investigación en inglés dependen de la disciplina, existe un lenguaje común a casi todos estos artículos: el lenguaje académico. Este lenguaje supone una dificultad añadida para el investigador, que en la mayoría de los casos ha adquirido nociones del inglés coloquial, tal como habitualmente se enseña hoy en día en escuelas, institutos y academias. Es evidente, sin embargo, que del mismo modo que el español que utilizamos en nuestra vida cotidiana no es el apropiado para escribir un texto académico, tampoco lo es el inglés coloquial. El investigador necesitará, pues, conocer las características más relevantes del lenguaje académico utilizado en los artículos de investigación. Algunas de las características de este lenguaje son la utilización de un vocabulario formal y especializado (se debe conocer este vocabulario en inglés antes de comenzar a redactar el artículo), la elección del tiempo verbal correcto o la utilización de un lenguaje claro y conciso. Cuando un investigador decide escribir un artículo académico en inglés puede escoger, en función de sus conocimientos del idioma, entre escribir el primer borrador en castellano o bien, si ya tiene conocimientos, hacerlo directamente en inglés. Tanto en un caso como en el otro, es muy recomendable la interacción con un traductor nativo, ya sea para traducir el texto por completo o para revisar el estilo y la gramática empleados. A la hora de seleccionar un traductor para este fin, es deseable que se trate de alguien con experiencia previa en la revisión y traducción de manuscritos en inglés en el área científica correspondiente. En la tabla 7-1 se detallan en forma de lista una serie de recomendaciones que el autor debe tener en consideración para facilitar el trabajo del traductor. Aun cuando el estilo es algo que cada autor cultiva a su modo, existe no obstante una serie de pautas que no debería obviar. Como norma general, podemos decir que no es necesario utilizar construcciones tortuosas ni palabras poco usuales, sino que hay que tener en cuenta que con frecuencia la investigación se juzga exclusivamente por su capacidad de comunicación. En este sentido, puede ocurrir que un trabajo realizado con toda seriedad y exquisitez sea rechazado simplemente por su expresión escrita. Se pueden establecer cuatro cualidades de la buena prosa científica, a saber: fluidez de expresión, claridad de exposición mediante párrafos conectados adecuadamente, exacti-

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

Tabla 7-1. Interacción con el traductor/revisor de inglés: recomendaciones para facilitar su labor

© Elsevier. Fotocopiar sin autorización es un delito.

1. No formatear el artículo antes de enviarlo al traductor (p. ej., no justificar) 2. Señalar al traductor el tipo de inglés en que debe escribirse el artículo (inglés británico o norteamericano) 3. Señalar, siempre que sea posible, la revista diana, así como el número de palabras permitidas 4. Intentar proporcionar un artículo publicado en inglés sobre el mismo tema para facilitar el trabajo 5. Asegurar que el texto en castellano ha sido corregido adecuadamente 6. Revisar el estilo del castellano para evitar frases ambiguas e ideas confusas. Tratar de escribir frases sencillas con la construcción en inglés si es posible (sujeto-verbo-objetos directos e indirectos-cláusulas subordinadas) 7. No emplear palabras o frases rebuscadas. Escribir en un castellano claro, correcto y elegante pero sin adornos 8. Utilizar siempre el mismo término para describir el mismo concepto, aun cuando pueda parecer extraño en castellano. No usar circunlocuciones 9. Asegurar que todas las abreviaturas están identificadas con el nombre completo la primera vez que se utilizan y que no se insertan abreviaturas para nombres que no se repiten más de una vez. Consultar las normas de la revista a este respecto 10. Asumir que, por regla general, el texto final en inglés será un 10% más corto. No escribir un artículo excesivamente largo en castellano con la esperanza de que el traductor podrá reducirlo ad infinitum 11. No asumir que cuando el artículo en inglés está revisado o traducido ya se puede enviar a la revista. Recordar que el autor, y no el traductor, es el experto en el tema científico correspondiente

tud en la elección adecuada de las palabras y frases, y economía de palabras, evitando las palabras y frases innecesarias. Por esta razón, es importante que mantengamos una especial atención a cómo expresamos nuestra investigación. Un recurso estilístico utilizado con mucha frecuencia en los artículos de investigación en inglés es el denominado hedging, es decir, el uso de ciertas construcciones lingüísticas cuya función es, por una parte, matizar la expresión y, por otra, proteger al investigador de posibles reacciones negativas de otros investigadores ante las afirmaciones derivadas de los resultados de su investigación. Este recurso también se utiliza para introducir las conclusiones del trabajo realizado con una actitud de modestia ante la comunidad científica. Algunos ejemplos de cómo se aplica este recurso en inglés se pueden observar en la tabla 7-2. Otra característica del estilo académico de los artículos de investigación es la necesidad de simplificar el lenguaje y utilizar la terminología adecuada: a menudo se utilizan numerosas palabras de una forma poco adecuada, sobre todo cuando pueden ser sustituidas por otras más usadas y frecuentes. Esto no sólo sucede con palabras extraídas de la terminología específica, sino también con expresiones como el uso de demonstrate en vez de show, employ o utilize en vez de use, encounter en vez de find, o advocate en vez de suggest. El uso excesivo de palabras se presenta como uno de los problemas más difíciles de resolver, especialmente para el investigador que escribe en inglés como segunda lengua, para quien a menudo el circunloquio se presenta como la única solución para expresar un concepto. Esto suele suceder con expresiones como «it has been shown/found/noted that», «in order to», «in regard to», «with

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 7-2. Ejemplos de utilización de hedging en el inglés académico Utilización de lenguaje impersonal

the results show...

los resultados indican...

it has been proved…

se ha comprobado… Utilización de verbos mitigadores

it appears that...

parece que...

we believe that...

creemos que... Introducción de ciertos adverbios y expresiones adverbiales:

probable

probablemente

occasionally

ocasionalmente

to our knowledge...

que nosotros sepamos... Uso de verbos modales

it may be...

podría ser...

it could be possible...

podría ser posible...

respect to», «in relation to», etc. Por ejemplo, la frase «The groups were broadly comparable with respect to age and weight» se podría sustituir por «The groups were of similar ages and weights». A nivel textual, el artículo de investigación debe caracterizarse por la cohesión y coherencia con la que están expresados los argumentos. La coherencia consiste en conseguir que las partes que componen el modelo organizativo estén conectadas lógicamente mediante la repetición de palabras clave, la utilización de pronombres y sinónimos, así como la localización efectiva de palabras y expresiones, como se puede observar en la tabla 7-3. Estas palabras y expresiones son las que ayudan al lector a seguir el texto mediante una progresión lógica de ideas. Para el escritor novel en una lengua que no es la propia, resolver el problema del antecedente en una frase —palabra, oración o parte de la oración a la que el escritor se quiere referir mediante un pronombre— supone, con frecuencia, una dificultad añadida. La regla más importante para que la frase tenga una redacción fácil a la vez que correcta en este aspecto es que el antecedente debe visualizarse con toda facilidad por parte del lector. En cualquier caso, debe evitarse la ambigüedad que puede suponer ejemplos como: «Didactic presentations focus on technical aspects of surgery. They are designed to be brief with ample time for questions and answers». En esta oración no queda claro si el antecedente de they son las presentaciones didácticas o los aspectos técnicos de la cirugía. Un adecuado replanteamiento de la frase aclararía estas dificultades: «Didactic presentations, focusing on technical aspects of surgery, are designed to be brief with ample time for questions and answers». Otro tema gramatical que atañe al discurso científico se refiere al uso de la voz pasiva. A pesar de que para muchos autores la voz pasiva hace que la redacción sea antiestética y poco flexible, otros se refugian en ella como escudo, o simplemente porque el uso de la primera persona suena a inmodestia por parte del autor. La voz activa, evidentemente, es más directa y proporciona al

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

Tabla 7-3. Recursos utilizados para la obtención de una coherencia adecuada en el inglés académico Conectores

accordingly…

de acuerdo con…

as a consequence…

como consecuencia… Conjunciones

however due to...

debido sin embargo a… Palabras generalizadoras

this duality

esta dualidad, cuando se habla de dos visiones, posiciones, etc.

media

medios de comunicación, cuando anteriormente se ha hablado en concreto de varios medios, como televisión, prensa, etc.

lector la sensación de que el escritor realmente realizó la investigación y, por lo general, se recomienda su uso siempre que sea posible. La verdad es que en algunas secuencias del artículo científico, el uso de la voz pasiva se presenta como algo casi necesario e incluso como elemento importante para la objetividad de la investigación. Si bien es evidente que en los trabajos científicos la voz pasiva tiene su uso, y se utiliza mucho más cuando el artículo viene firmado por más de un autor o cuando se describen métodos empleados a lo largo de la investigación, especialmente en la sección de metodología (como, p. ej., «was used», «was discused», «were found», «were analyzed», etc.), también es cierto que su uso no debería ser excesivo, pues conduciría a un discurso difícil de leer, a la vez que despersonalizado.

© Elsevier. Fotocopiar sin autorización es un delito.

13&1"3"$*Î/%&-."/64$3*50 Una pregunta que con frecuencia se hace el investigador cuando quiere elaborar un artículo en inglés es si se debe redactar primero en español y luego traducirlo, o bien si es preferible comenzar en inglés desde el principio. Si partimos de la idea de que escribir un artículo de investigación no significa simplemente narrar un experimento, sino que mediante la escritura el autor está realizando una tarea de reflexión crítica, al mismo tiempo que fija sus conocimientos sobre la materia y sobre el lenguaje propio de ésta, cada vez cobra más sentido hacer el esfuerzo de realizar toda la tarea en la lengua en que vamos a redactar el artículo, en este caso el inglés. Escribir significa empezar a presentar el tema, con un lenguaje y una perspectiva propios. Cuando se empieza a escribir ya se está eligiendo un estilo. Algunos investigadores eligen a menudo la opción de la traducción, una vez concluido el artículo en su lengua materna. Es mucho más difícil por dos razones: en primer lugar, porque se debe conseguir redactar un artículo en español con las características propias del estilo requerido en inglés, y en segundo lugar, porque conseguir una traducción en la que no interfieran factores estilísticos y de lenguaje de la lengua propia sobre la extranjera es realmente complicado.

&MBCPSBDJwOEFVONBOVTDSJUP

Utilizar el inglés desde el principio puede ayudar al investigador a fijarse más en la terminología específica y las características de los artículos que lee en inglés y que frecuentemente componen sus fuentes bibliográficas.

03("/*;"$*Î/%&-."/64$3*50 La estructura más característica del artículo de investigación en inglés es el formato IMRD (Introducción, Método, Resultados y Discusión), que se acompaña de un título y un resumen.

5rUVMP El título de un artículo de investigación es clave para su difusión, aceptación, publicación y, en último término, para que el artículo sea leído por el mayor número posible de investigadores. Si el título no resulta interesante, el artículo no será leído, independientemente de lo valioso o relevante de la investigación o del avance tecnológico que presente. Tampoco parece conveniente forzar un título para que resulte falsamente atractivo, de forma que se establezca una desconexión con los contenidos del artículo. Esta práctica no sería aceptada normalmente por una revista académica. El título de un artículo de investigación debe caracterizarse por ser interesante, informativo e incluir resultados especialmente relevantes. Para incorporar toda la información necesaria, el título puede ser largo e incluso constituir una oración completa.

3FTVNFO Una vez seleccionado el modelo que más se ajusta para organizar las ideas del resumen, debemos tomar en consideración también algunas cuestiones relacionadas con el estilo y el uso del lenguaje. De forma más concreta, podemos destacar los siguientes puntos: t Considerar si es apropiado o no el uso de la primera persona en la redacción del resumen. t La sintaxis más apropiada, teniendo presente la poca flexibilidad de la sintaxis inglesa con relación a la española (mucho más flexible). t Las expresiones que ayudan al autor a enlazar o contraponer ideas (conectores). t El empleo más adecuado de los tiempos verbales. t Lo importante es observar que el sujeto, no importa su extensión, aparece en inglés (en las oraciones afirmativas) en posición inicial y siempre precediendo al verbo.

$POFDUPSFT Hay una serie de expresiones, denominadas conectores, que nos ayudan a relacionar conceptos. Hay conectores para enlazar ideas, para expresar consecuen-

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

cias, para contraponer conceptos, para expresar contraste, concesión y otras posibles relaciones entre diversas ideas. Los conectores son parte esencial en cualquier resumen y, por extensión, en cualquier texto. Sin ellos, establecer las relaciones entre las ideas que queremos expresar sería difícil y, con frecuencia, imposible. Esto no quiere decir que, por ejemplo, en un resumen tenga que haber muchos conectores. En ocasiones puede contener sólo una de estas expresiones. Lo que ocurre es que la presencia de ese conector es a menudo clave en la organización conceptual del resumen. Un buen dominio y un uso adecuado de estos conectores son muy útiles a la hora de elaborar, no sólo el resumen, sino todo el artículo de investigación y, por extensión, en cualquier ámbito en donde se requiera emplear el inglés académico (tabla 7-4).

Tabla 7-4. Conectores empleados en el inglés académico Conectores para localizar la investigación en el tiempo

recently

recientemente

previously

previamente

later

más tarde, a continuación, seguidamente

before

antes, antes de

in summary

en resumen

Conectores para localizar la investigación en el espacio físico o en el espacio del texto

here

aquí, en este punto

there

allí

in this paper

en este artículo

in figure 2

en la figura 2 Conectores para añadir conceptos o introducir ejemplos

for example

por ejemplo

for instance

por ejemplo

that is

es decir Conectores para enfatizar una idea

furthermore

además

moreover

además, por otra parte

© Elsevier. Fotocopiar sin autorización es un delito.

in addition to

además de Conectores para expresar relaciones de oposición

however

sin embargo

on the other hand

sin embargo, por otra parte

although

aunque Conectores para expresar razones o resultados de un proceso

thus

por lo tanto

therefore

por lo tanto, en consecuencia

consequently

por lo tanto, en consecuencia Conectores para expresar la finalidad de un proceso o investigación:

to this end

con esta finalidad Continúa

&MBCPSBDJwOEFVONBOVTDSJUP

Tabla 7-4. Conectores empleados en el inglés académico (cont.) for this purpose

con este propósito

for the evaluation of this

para evaluar esto

Conectores para expresar los medios mediante los cuales se ha realizado un proceso o parte de la investigación

in this way

de esta forma

by further studies

mediante más estudios Conectores para expresar condiciones

in this case

en este caso

then

entonces, por lo tanto

if

si

perhaps

quizá, a lo mejor Conectores para expresar la validez de los resultados que se describen

in general

en general

usually

normalmente

clearly

claramente

significantly

de forma significativa

as is well known

como es sabido

Conectores que permiten que los autores expresen su punto de vista personal sobre los resultados y la investigación

interestingly

curiosamente

unfortunately

desafortunadamente

apparently

aparentemente, en apariencia

5JFNQPTWFSCBMFT Es cierto que la voz pasiva es más frecuente en el inglés científico y académico que en el inglés que se emplea en otros contextos y con otros fines. Sin embargo, esto no quiere decir que en los resúmenes o en los artículos de investigación haya más formas pasivas que activas. De hecho, las formas pasivas constituyen aproximadamente un 25% del total de las formas verbales empleadas en un texto en inglés científico o académico. Lo que ocurre es que este porcentaje de formas pasivas es menor en otros contextos. El presente simple, tanto en activa como en pasiva, se emplea con frecuencia para describir las características técnicas de un dispositivo o método de análisis, dependiendo de cada disciplina. En cuanto a los verbos modales, may y can son los más utilizados en inglés académico. En el caso de may, se emplea generalmente para matizar una afirmación.

*OUSPEVDDJwO Escribir una introducción para un artículo científico no debe dejarse al azar y reducirla simplemente a la expresión de un objetivo. La «Introducción» debe representar el nexo de unión entre los lectores y la investigación realizada por el autor o los

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

autores. De ahí que una buena «Introducción» no sólo debe saber conectar con el lector para convencerle de que siga leyendo, sino que también debe ser la conexión entre la propia investigación y el conocimiento básico que se supone posee el lector sobre el tema que se está estudiando. Precisamente por esto es necesaria una atención especial a la hora de seleccionar, no sólo la información que se va a introducir en esta sección, sino también en qué términos se va a expresar.

5JFNQPTWFSCBMFT Al plasmar por escrito la investigación científica, el uso de los tiempos verbales en inglés se presenta como una de las principales cuestiones que el autor debe de tener en cuenta. Como idea general, se puede decir que, por un lado, cualquier expresión referida a la investigación ya publicada previamente (información que aparece principalmente en la «Introducción») debería ir en tiempo presente, tanto simple como continuo, así como en pretérito perfecto. Por otro lado, en aquellas expresiones referidas exclusivamente a la propia investigación, principalmente en las secciones de «Material y métodos», así como «Resultados», el tiempo predominante debería ser el pasado, tanto en la voz activa como pasiva. En la «Introducción» es frecuente, además, el uso de frases nominales genéricas: «The incidence and prevalence of diseases... increase with aging», pero también con grupos nominales muy complejos: «Alpha acid glycoprotein plasma concentrations in late pregnancy are important determinants of free drug concentrations...». Con todo, el tiempo verbal predominante sigue siendo el presente (increase, are used, are).

© Elsevier. Fotocopiar sin autorización es un delito.

.nUPEPT En un artículo de investigación, la sección de «Métodos» desempeña un papel importante. Se trata de la segunda sección más relevante de un artículo de investigación, ya que responde a la pregunta de cómo se realizó ésta, y en ella se explica la metodología seguida para la consecución de los objetivos específicos del estudio. En medicina, la sección de «Métodos» se caracteriza por una cierta rapidez, ocasionada por la presunción de conocimiento previo sobre el tema, hecho que da como resultado una mayor densidad de información.

&TUJMP La sección de «Métodos» debe elaborarse con un estilo narrativo, directo y factual. Se recomienda la utilización de frases cortas para facilitar la comprensión y evitar que la sección resulte demasiado densa por la cantidad de detalles que se presentan y por la minuciosidad descriptiva que la caracteriza, con la consiguiente complejidad lingüística. Es también aconsejable respetar las pautas de claridad, concisión y secuencia. Por otra parte, la redacción se realizará preferentemente en pasado, puesto que se trata de relatar los pasos seguidos durante la investigación.

&MBCPSBDJwOEFVONBOVTDSJUP

5JFNQPZWP[WFSCBM Al tratarse de una sección cuyo contenido se refiere exclusivamente a la propia investigación, el tiempo verbal predominante es el pasado simple, tanto en voz activa como en pasiva, aunque podemos anticipar, a modo de regla general, que el tiempo verbal más frecuente en esta sección es el pasado simple en voz pasiva. El tiempo verbal típico de las descripciones de «Material y métodos» es el pasado simple (simple past tense), que se puede utilizar tanto en voz activa como en pasiva. Sin embargo, en algunos casos muy concretos vemos cómo se hace uso del presente simple (simple present tense), tanto en activa como en pasiva. La voz pasiva se utiliza para dar un carácter impersonal a la información que presentamos, con la intención de enfatizar el proceso, restándole así importancia al agente responsable del proceso en sí. En ocasiones se prefiere un estilo más personalizado, caracterizado por la utilización frecuente del pronombre de primera persona del plural (we). Muy frecuentemente, la elección de la voz verbal (activa-pasiva) en descripciones de «Material y métodos» tiene su origen en una intención clara por parte del autor de colocar la información conocida a principio de frase y la información nueva al final.

3FTVMUBEPT La sección de «Resultados» de un artículo de investigación muestra la tarea desarrollada por los investigadores. Esta sección suele constar, no solamente de la exposición de los datos obtenidos tras una investigación, sino a menudo también de una somera explicación de sus contenidos.

&TUJMP Por lo que respecta a las convenciones relacionadas con la utilización de tiempos verbales en la sección de «Resultados», se puede observar que la misma dista mucho de ser totalmente homogénea, y que este hecho suele hacer disminuir la calidad general de muchos textos escritos por investigadores que no Tabla 7-5. Recomendaciones para la utilización de tiempos verbales en la sección de «Resultados» de los artículos de investigación 1. A la hora de comentar datos a partir de una tabla o figura, se utilizan habitualmente tiempos de presente 2. Cuando se definen hechos observados en el análisis realizado, suele predominar el pasado simple como el tiempo verbal más usual 3. Cuando el comentario realizado sirve para comparar los resultados obtenidos con los detectados en estudios previos, el autor suele utilizar el presente 4. Cuando el comentario ofrece una posible explicación para los resultados obtenidos, se suele utilizar un verbo auxiliar léxico 5. Si lo que se pretende es generalizar información a partir de unos resultados concretos, se recomienda la utilización de expresiones del tipo «it appears that...», «it seems that...» o «it is likely that...» También aparecen expresiones introductorias del tipo «data seem to show...» o «there is some evidence that...», casi siempre seguidas de presente

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

utilizan el inglés como lengua habitual. En la tabla 7-5 se ofrecen algunas recomendaciones para la utilización de tiempos verbales en esta sección. La sección de «Resultados» suele presentar un elevado porcentaje de expresiones verbales en voz pasiva. El motivo se basa en el intento por parte de los autores de despersonalizar los resultados de la investigación, de mostrar su objetividad, intentando huir de las construcciones en voz activa, mucho más personalizadas y subjetivas. En líneas generales, la utilización de la pasiva prevalece en este tipo de sección.

%JTDVTJwO

© Elsevier. Fotocopiar sin autorización es un delito.

Esta sección única es siempre la más difícil de redactar en cualquier trabajo de investigación, puesto que tiene que ser clara y concisa, pero al mismo tiempo las conclusiones que se deriven del estudio deben ser presentadas con claridad. A diferencia de la sección de «Resultados», que es totalmente objetiva, limitándose a mostrar los hallazgos de la investigación desarrollada, el apartado de «Discusión» presenta una lectura individual (la del autor o autores de la investigación) acerca del trabajo desarrollado. Por lo tanto, el objetivo general de este tipo de sección es desarrollar una lectura adecuada de los resultados obtenidos en la investigación. La discusión se caracteriza por tener una estructura cíclica. Cada pregunta de investigación atraviesa un ciclo que acostumbra a estar compuesto por: a) un resumen de los resultados, a partir de los cuales se extraen las conclusiones y se hace referencia a investigaciones previas; b) una explicación de lo que se sugiere a partir de las averiguaciones del estudio, con referencia a resultados de investigaciones realizadas con anterioridad o a resultados obtenidos en el mismo trabajo de investigación, y c) alusión a cuestiones adicionales, algunas veces introduciendo posibles explicaciones y otras aportando referencias de algún tipo. Estos tres elementos constitutivos del ciclo no se hacen siempre explícitos para cada pregunta de investigación. Todo esto implica que los elementos constitutivos que componen un ciclo suelen repetirse más de una vez. Normalmente, un ciclo ocupa un párrafo. El número de ciclos aumenta proporcionalmente en función de las hipótesis que se desea probar a través de la investigación.

&TUJMP Conviene señalar la utilización de una serie de rasgos verbales propios, reiterados a la hora de presentar una lectura específica de la investigación. Cabe destacar que existen una serie de tiempos verbales simples (presente, pasado y, en menor medida, futuro) que tienden a usarse en esta sección. En general, los autores suelen utilizar con mayor frecuencia los tiempos de pasado para señalar un hallazgo específico de la investigación. Así, podríamos indicar que el pasado simple es el tiempo verbal recomendado a la hora de presentar el trabajo. Del mismo modo, la utilización del presente simple está mucho más relacionada con estudios anteriores a los que se hace algún tipo de referencia en el artículo. No obstante, algunos investigadores optan por utilizar el presente tan

&MBCPSBDJwOEFVONBOVTDSJUP

sólo para hacer referencia a la investigación actual. Este aspecto suele ser habitual si en la sección de «Discusión» no se hace referencia alguna a trabajos anteriores o si la comparación es generalizada con otros muchos trabajos al respecto. A pesar de la recomendación de utilizar el pasado simple como verbo habitual para introducir nuestro análisis actual, es conveniente comentar el frecuente uso del presente simple para introducir cálculos y análisis estadísticos relacionados con el estudio presentado («These values are significantly greater...»). Finalmente, y debido a su frecuente aparición en la sección de «Discusión» de los artículos de investigación, conviene hacer referencia a la utilización del presente simple para reflejar la aparición de afirmaciones genéricas y de aseveraciones basadas en verdades sabidas. Por lo que hace referencia a la interpretación de datos, conviene destacar que este subapartado del artículo suele ir introducido por la utilización del grupo léxico presente de indicativo + that o por pretérito imperfecto + that, dependiendo de si se hace referencia a datos de estudios previos o del estudio que se está presentando en el artículo en cuestión. Finalmente, el tiempo de futuro suele utilizarse para comentar lo que se pretende realizar en futuras investigaciones relacionadas con el campo de estudio en cuestión y que el investigador habrá de desarrollar en próximos trabajos. También se emplea este tiempo verbal para predecir lo que esperamos hallar en estos futuros esfuerzos investigadores.

-nYJDP Por lo que respecta a aquellas características léxicas observadas de forma más común en los artículos de investigación, y al margen del uso de tiempos verbales, hay un buen número de rasgos que aparecen de manera recurrente en el corpus de artículos estudiados para este trabajo. En ciertas ocasiones existe una reiterada utilización de adverbios y adjetivos calificativos, usados con la finalidad de resaltar la importancia de los hallazgos del investigador (o equipo) que presenta el artículo. Adicionalmente, también es usual comprobar la utilización de expresiones léxicas con la finalidad de señalar las limitaciones del estudio realizado o los problemas que hayan podido surgir a partir de él, como en el ejemplo: «However, two constraints should be recognized for future research in this area», o el ejemplo: «The present study has some limitations, and the recognition of these should help refine future research efforts». Finalmente, muchos autores tienden a plantear cierto tono defensivo a la hora de dar opiniones sobre sus hallazgos y suelen utilizar expresiones como «the results suggest», «data seem to show» o «it would appear that». Serán precisamente estos marcadores léxicos o hedging (v. tabla 7-2) los que confieran los matices textuales necesarios desde el punto de vista estilístico.

#*#-*0(3"'Ê"3&$0.&/%"%" Alcaraz E. El inglés profesional y académico. Madrid: Alianza Editorial; 2000. American Management Association. The AMA style for business writing. Nueva York: American Management Association; 1996.

&4$3*#*3&/*/(-c4/03."4(&/&3"-&4&*/5&3"$$*Î/$0/&-53"%6$503

© Elsevier. Fotocopiar sin autorización es un delito.

Bjork L, Raisanen C. Academic writing. A university writing course. Lund: Studentlitteratur; 1996. Browner W. Publishing and presenting clinical research. 2.ª ed. Filadelfia: Lippincott Williams & Wilkins; 2006. Dubois BL. The construction of noun phrases in biomedical journal articles. En: Hoedt J, Lundquist L, Picht H, Qvistgaard J, eds. Pragmatics and LSP. Copenhague: Copenhagen School of Economics; 1982. p. 49-67. Fortanet I. Cómo escribir un artículo de investigación en inglés. Madrid: Alianza Editorial; 2002. Gibaldi J. MLA handbook for writters of research papers. 4.a ed. Nueva York: The Modern Language Association; 1995. Hames I. Peer review and manuscript management in scientific journals: Guidelines for good practice. Oxford: Blackwell Publishing; 2007. Lester JD. Writing research papers. A complete guide. Nueva York: Harper Collins; 1993. Melander B. Culture or genre? Issues in the interpretation of cross-cultural differences in scientific papers. En: Col JF, Fortanet I, Palmer JC, Posteguillo S, eds. Genre studies in English for academic purposes. Castelló de la Plana: Universitat Jaume I; 1998. p. 214-6. Noble KA. Publish or perish: What 23 journal editors have to say. Studies in Higher Education. 1989;14:97-102. Nwogu KN. The medical research paper: Structure and functions. English for Specific Purposes. 1997;16:119-38. Posteguillo S. The schematic structure of computer science research articles. English for Specific Purposes. 1995;18:139-60. Salager-Meyer F. Hedges and textual communicative function in medical English written discourse. English for Specific Purposes. 1994;13:149-70. Weissberg R, Buker S. Writing up research. Experimental research report writing for students of English. Englewood Cliffs, Nj.: Prentice Hall Regents; 1990.

6OQBTFPFTUBErTUJDP QPSMBTHVrBT EFQVCMJDBDJwO +$PSUnTZ&$PCP

Este capítulo ofrece claves metodológicas y estadísticas que justifican los aspectos comunes y los específicos de las guías de publicación. El primer punto recuerda la finalidad de estas recomendaciones. El segundo repasa brevemente los diseños metodológicos más frecuentes y los relaciona con los objetivos clínicos fundamentales: diagnóstico, pronóstico e intervención. Posteriormente, en un orden libre, los siguientes puntos resaltan las razones estadísticas que justifican la importancia de algunas recomendaciones.

© Elsevier. Fotocopiar sin autorización es un delito.

'*/"-*%"%%&-"4(6Ê"4%&16#-*$"$*Î/ El objetivo de las «guías de publicación» (reporting guidelines) es la claridad y transparencia de los artículos científicos. En efecto, la preocupación por mejorar la calidad y la correcta emisión de las publicaciones científicas, unida a la preocupación de que los consejos editoriales en las revistas más prestigiosas no conseguían introducir los cambios deseados, provocó que científicos de primera línea iniciaran su elaboración. No pretenden ser normativas que establezcan ni tan siquiera el orden de presentación de los puntos. Pretenden ofrecer una recopilación de los «aspectos cuya insuficiente o incorrecta especificación suele ir asociada a publicaciones con mayor riesgo de ofrecer resultados sesgados»1. Entre las iniciativas adicionales destaca la red EQUATOR (Enhancing the QUAlity and Transparency Of health Research; disponible en: http://www. equator-network.org), que pretende ofrecer instrumentos, como las guías de publicación, para una buena comunicación de la investigación biomédica. Aunque su objetivo inmediato es la transparencia y la precisión del informe científico, al resaltar a los investigadores aquellos aspectos del mismo usualmente asociados a un resultado sesgado, estas guías de publicación ya han

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

mostrado el beneficioso efecto adicional de mejorar la calidad de la investigación subyacente2.

0#+&5*704$-Ê/*$04:5*104%&&456%*04$*&/5Ê'*$04 El método científico pretende proponer modelos que representen, a partir de la observación, el entorno que nos rodea. Esta capacidad de ser observado es fundamental, ya que para poder ser considerado científico, un modelo debe poder entrar en conflicto con datos observables en el futuro. Por ejemplo, «los marcianos existen» es una expresión hoy por hoy infalible, en el sentido de que, como es imposible recorrer todo el universo y demostrar que no existen, no puede entrar en conflicto con datos concebibles. En este sentido, la ciencia aspira a ser falible, ya que pretende contrastar sus modelos con observaciones posibles. Este contraste empírico implica que los modelos científicos son constantemente abandonados en beneficio de otros que los mejoran y matizan. En consecuencia, no se pretende que sean definitivamente ciertos, pero sí que sean útiles y ofrezcan claves para interpretar, mejorar y disfrutar nuestro entorno. Los modelos se pueden construir con dos objetivos claramente diferenciados. En primer lugar, por su ambición, tenemos los modelos de intervención, que pretenden cambiar la evolución de los pacientes y requieren una relación de causa-efecto que permitirá, mediante intervenciones en la variable causa, modificar el valor futuro de la variable efecto. Por otra parte, tenemos los modelos de relación o predictivos. A diferencia de los anteriores, éstos no precisan una conexión de causa-efecto. Se utilizan, por ejemplo, en el diagnóstico y en el pronóstico médicos.

5JQPTEFEJTFvPTFH|OMPTMBQTPTEFUJFNQPFOUSFWBSJBCMFT En un estudio para estimar la capacidad diagnóstica de un indicador, los datos sobre éste y sobre la referencia (gold standard) pueden recogerse simultáneamente, pero los estudios de predicción y los de intervención requieren un intervalo de tiempo. Cuando las dos variables en estudio se observan en el mismo momento, se habla de estudios transversales. En cambio, cuando una acontece previamente a la otra, se habla entonces de estudios longitudinales. En un estudio de intervención, estas dos variables serán la causa en estudio y la respuesta que se desea cambiar; mientras que, en un estudio sobre pronóstico, se tratará de los atributos predictivos y de la respuesta cuyos valores se desea anticipar. Por ejemplo, si cierto componente plasmático ha de predecir la enfermedad cardiovascular, debe ser previo en el tiempo a ésta, ya que si la determinación analítica se realizara simultáneamente (o incluso con posterioridad) a la aparición de la enfermedad, el valor de anticipación sería nulo. Más aún, si el objetivo es especular si hipotéticos cambios en dicho componente modificarían la enfermedad cardiovascular, se requiere este lapso de tiempo para que se manifiesten dichos efectos.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

© Elsevier. Fotocopiar sin autorización es un delito.

5JQPTEFEJTFvPTFH|OMBBTJHOBDJwO En los estudios experimentales, el investigador asigna el valor de la intervención a los voluntarios; sin embargo, en los estudios observacionales, los individuos se presentan con valor en las variables de estudio. Por ejemplo, si se quiere estudiar el efecto de la monitorización de los pacientes hipertensos en el control de su presión arterial, tendremos un estudio de carácter observacional cuando los médicos y los pacientes decidan el número y el momento de las visitas de forma espontánea, mientras que consideraremos que se trata de un estudio experimental si el investigador asigna un número de visitas a cada voluntario. La clave para diferenciar ambos estudios reside, precisamente, en esta asignación. Obsérvese que, por respeto al principio de no maleficencia, sólo las intervenciones que pretendan mejorar el estado de salud son, en principio, asignables a las personas. Por ejemplo, no se puede asignar un adolescente al grupo «Fumador de tabaco desde los 15 hasta los 50 años». Esto explica la predilección de la epidemiología por los métodos observacionales. En cambio, la pregunta habitual de la farmacología «¿Mejora este nuevo tratamiento la evolución?» permite la asignación del tratamiento y, por tanto, el diseño experimental. Para recurrir a la asignación, la epidemiología primero debe redefinir la causa en estudio de forma que los efectos negativos se conviertan en positivos: «¿Qué pasará si introduzco esta ayuda para dejar de fumar?». Es bien conocido que asignar la intervención a las unidades abre la posibilidad de utilizar todas las herramientas del diseño de experimentos para minimizar errores. Pero además, permite evaluar si, cuando se asigne la causa en estudio, las unidades seguirán el consejo. En el ejemplo anterior de la monitorización observacional de los pacientes hipertensos, la primera asunción que debe hacerse para poder aplicar sus resultados a una intervención futura es que los pacientes se visitarán con la frecuencia sugerida por el médico. En cambio, el estudio experimental permite también observar y cuantificar hasta qué punto los destinatarios de la intervención han seguido las recomendaciones. Sin embargo, los estudios experimentales no ofrecen ventajas cuando se persiguen las otras finalidades de la investigación sanitaria. Por ejemplo, en la predicción, si se desea establecer el pronóstico, un estudio observacional longitudinal prospectivo (cohortes) basado en un muestreo aleatorio será mejor que un ensayo clínico. Igualmente, si se desea valorar la capacidad diagnóstica de un indicador, el diseño transversal puede ser suficiente. En el estudio de relaciones de causa-efecto también conviene distinguir: si el objetivo es confirmar un efecto, el ensayo clínico aporta la evidencia de mayor calidad; pero si el objetivo es explorar posibles causas, como en la investigación etiológica, muchas evidencias provendrán de estudios de cohortes o de casos y controles bien diseñados. Así, el establecimiento de la relación causal suele comportar dos pasos sucesivos. Con el primero, dado un determinado efecto (p. ej., una enfermedad), se desea explorar sus posibles determinantes, sus causas. En el segundo paso, identificada una causa susceptible de ser intervenida, se desea confirmar y cuantificar el efecto que origina su modificación. Recordemos el ejemplo de las epidemias de asma en Barce-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

lona. La respuesta a la pregunta «¿Cuáles son las causas del asma?» fue la combinación de descarga de soja en silos defectuosos del puerto con un viento favorable. El estudio de aquello que era susceptible de intervención y aquello que no lo era, llevó a la segunda pregunta: «¿Conseguiremos reducir los brotes de agudización del asma reparando el silo y protegiendo la descarga de soja?». La pregunta exploratoria del primer paso es retrospectiva: «¿Cuáles son las causas de este efecto?». En cambio, la pregunta confirmatoria del segundo paso es prospectiva: «¿Qué efecto tiene en la respuesta esta intervención sobre la causa?». Hay que resaltar desde el primer momento que intervenir significa cambiar algo, lo que implica un mínimo de dos valores para la variable causa. Puede ser el cambio de una opción terapéutica A por otra B, cambiar el protocolo estándar añadiéndole un nuevo tratamiento C, o bien modificar los hábitos higiénico-dietéticos eliminando (o añadiendo) alguno. Hay que insistir en el término acción como intervención, puesto que atributos como la edad o el sexo pueden ser útiles para hacer un pronóstico o una predicción (p. ej., cabe esperar que una mujer viva alrededor de 5 años más que un hombre) pero no son modificables y, por tanto, no tiene sentido actuar —intervenir— sobre ellos («Cambie usted este hábito de ser hombre, hágase mujer y vivirá 5 años más»). En consecuencia, desde un punto de vista práctico, de intervención, es irrelevante preguntarse si el sexo o la edad tienen un efecto causal en, por ejemplo, la supervivencia. No todas las ideas especificadas en el modelo conceptual del estudio tienen la misma importancia. El nombre de hipótesis suele reservarse para las ideas más relevantes, y el de premisas, para las ideas acompañantes que son necesarias para poder contrastar las hipótesis. De esta forma, un investigador que desee establecer la hipótesis de que un nuevo tratamiento añade un cierto efecto adicional al del conjunto de intervenciones que definen el tratamiento previo, se verá obligado a asumir alguna premisa sobre el comportamiento de dicho efecto en toda la población de pacientes. Por ejemplo, en el caso de un fármaco cuya ficha técnica no establece una posología diferente para diversos tipos de pacientes, se está asumiendo implícitamente la premisa de que este efecto es el mismo en todos ellos. De forma similar, el diseño de un ensayo clínico se basa en la premisa de que el efecto de la intervención tiene esta homogeneidad en la población objetivo definida por los criterios de elegibilidad. Así, el objetivo principal de un estudio confirmatorio es contrastar la hipótesis con datos empíricos, aceptando o asumiendo como razonables las premisas. Eso sí, analizar el grado de verosimilitud de las premisas constituye uno de los objetivos secundarios. Por ejemplo, como se expone más adelante, la premisa de no interacción del efecto con diferentes condiciones puede ser analizada mediante el estudio de subgrupos. Asimismo, que su efecto en todos los casos sea homogéneo o constante (en lugar de variable o aleatorio) se traduce en una igualdad de varianzas entre los grupos, que también puede ser observada. Sin embargo, tan relevante o más que conocer si las premisas son ciertas, es saber si se hubiera llegado a la misma conclusión en caso de haber partido de otras premisas. Por ejemplo, asumir distribución normal permite recurrir a ciertas pruebas «paramétricas» que propor-

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

cionan medidas del efecto fáciles de interpretar y comunicar. En este punto, la pregunta clave no es si es cierta dicha normalidad, sino «si se hubiera llegado a la misma conclusión en caso de haber partido de otra premisa». Es decir, hasta qué punto las conclusiones alcanzadas dependen de («son sensibles a») las premisas.

(6Ê"4%&16#-*$"$*Î/ Las guías distinguen claramente entre los diferentes tipos de diseño. Un estudio experimental se rige por CONSORT (http://www.consort-statement.org) si es aleatorizado, o por TREND si la asignación no se decide al azar. En cambio, un estudio diagnóstico usará STARD y los diseños epidemiológicos emplearán STROBE (http://www.strobe-statement.org). Por último, los estudios que acumulan evidencia mediante el metaanálisis de ensayos clínicos lo harán por PRISMA (http://www.prisma-statement.org). En los siguientes apartados ofrecemos una visión global, conjunta, de las tres guías de publicación más relevantes para artículos que aportan datos originales: CONSORT, STROBE y STARD. Las recomendaciones que ofrecen han sido agrupadas y subclasificadas para su exposición didáctica, pero su orden no es en absoluto indicador del orden apropiado para una revista médica concreta.

© Elsevier. Fotocopiar sin autorización es un delito.

5rUVMP SFTVNFO JOUSPEVDDJwOZPCKFUJWPT Las tres declaraciones coinciden ampliamente en las recomendaciones para la introducción de un artículo científico (tabla 8-1). La mayor diferencia reside precisamente en resaltar lo antes posible el objetivo diferenciador de los artículos cubiertos por cada guía. Así, STROBE 3 permite hipótesis tanto previas como sugeridas por los datos, pero CONSORT 5 obliga a que las hipótesis que deben contrastarse sean previas, aspecto que es preciso poder documentar. Desde el año 2005, las principales revistas médicas exigen el registro previo del protocolo de los ensayos clínicos, como requisito para su consideración como posible publicación. Esta distinción entre objetivos previos y sugeridos por los datos se debe a los dos papeles que puede desempeñar la inferencia estadística. En el primero, el investigador explora la muestra con la intención de obtener nuevas ideas que le ayuden a interpretar el fenómeno en estudio. En el segundo, el investigador

Tabla 8-1. Recomendaciones de las listas de comprobación: especificaciones en los apartados iniciales CONSORT

STROBE

Título Resumen

Cómo se asignaron los participantes

Identifique el artículo como…

Introducción

Antecedentes y justificación racional del estudio

Objetivos

Objetivos, hipótesis, intenciones, etc.

STARD

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

desea confirmar una idea previamente concebida (fig. 8-1). Al finalizar un estudio exploratorio, el investigador afirmará, por ejemplo, que «... estos resultados sugieren...»; mientras que al final de un estudio confirmatorio, el investigador podrá afirmar «... se ha establecido, por tanto, que...». Así, un científico que se acerque a los datos desde una perspectiva exploratoria se preguntará: «¿Cuál es el modelo, más simple, que mejor se ajusta a los datos estudiados?». En cambio, para un investigador que desee confirmar sus ideas previas, la pregunta clave será: «Los datos estudiados, ¿permiten confirmar o rechazar la hipótesis previa?».

%JTFvP Todas las guías de publicación recomiendan explicar el diseño y, especialmente, los métodos de asignación y de selección empleados (tabla 8-2). En primer lugar porque, como ya se ha dicho, la asignación de la intervención marca la diferencia entre los estudios experimentales y los observacionales. En segundo lugar, porque si la asignación o la selección han sido aleatorias, y sin pérdidas posteriores, ello permite emplear los métodos estadísticos para cuantificar la incertidumbre asociada en el salto desde los casos que constituyen la muestra en estudio a sus futuros beneficiarios. Más crudamente y «en negativo»: en ausencia de un proceso aleatorio, los errores estándar y los intervalos de confianza, aunque consagrados por su uso, no disponen de justificación estadística formal. Un estudio que no se base en un proceso aleatorio, de selección o de asignación, primero calcula las medidas de incertidumbre como si los casos provinieran por un mecanismo de azar (premisa adicional) de una población denominada «muestrada aleatoriamente», y, posteriormente, discute las diferencias sistemáticas (sesgos) entre ésta y la auténtica población origen de la muestra3. Veremos, en la discusión, un ejemplo sobre cómo considerar ambas fuentes de error, aleatorias y sistemáticas (o sesgos).

Muestra A

Conocimiento previo Análisis exploratorio Hipótesis («nuestros resultados sugieren que...»)

Muestra B

Análisis confirmatorio

Teoría («hemos establecido que...»)

Figura 8-1. Las dos aportaciones de la evidencia empírica.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

Tabla 8-2. Recomendaciones de las listas de comprobación: especificaciones sobre el informe del diseño del estudio CONSORT

STROBE

Diseño

Método de asignación

Aspectos cruciales

Tamaño muestral

Cómo se predeterminó

Cómo se alcanzó

Variables

Especifique las intervenciones, las respuestas y los métodos para mejorar su calidad

Papel en el modelo Método y mejora de las determinaciones

STARD Muestreo

Referencia (gold standard), unidades, coste, reproducibilidad, experiencia de los evaluadores, etc.

Justificación de los puntos de corte

Enmascaramiento de los evaluadores

© Elsevier. Fotocopiar sin autorización es un delito.

5BNBvPEFMFTUVEJP Antes de iniciar un ensayo clínico confirmatorio debemos proporcionar garantías de que será capaz de demostrar el efecto en caso de que éste exista. Si no fuera así, las renuncias que se piden a los voluntarios no serían éticamente justificables. Como la información aportada por un estudio está directamente relacionada con el número de participantes, un mayor tamaño muestral ofrece más garantías para demostrar la existencia de un efecto (si existe). Por ello, CONSORT 7 pide que se especifique cómo se predeterminó el tamaño del estudio. En cambio, un estudio que desee explorar, por su propia concepción, no conoce ni la magnitud del fenómeno que desea estudiar ni la disponibilidad real de casos. Así, STROBE 10 pide explicar cómo se alcanzó el tamaño del estudio, pero no exige que éste haya sido predeterminado. Es habitual perseguir un estudio más informativo aumentando su tamaño muestral. Pero si la cantidad va en contra de la calidad, se puede provocar un error sistemático que no quedará cubierto por las medidas estadísticas de incertidumbre —como el error estándar o el intervalo de confianza—. El error aleatorio depende, además del tamaño, de la fiabilidad de la respuesta y del diseño del estudio y de su análisis. Así, en lugar de ampliar la muestra, conviene estudiar si la metodología estadística puede proporcionar diseños y análisis alternativos más eficientes que, con el mismo número de casos, aporten la precisión deseada. O si una recogida más fiable de la variable respuesta proporciona esta información adicional, como veremos en el siguiente punto.

7BSJBCMFT La especificación de las variables conlleva los tres objetivos que se desarrollan en los puntos siguientes. El primer objetivo persigue mejorar la interpretación de los resultados, y se facilita manifestando cuál es el papel que cada variable desempeña en el modelo. El segundo, que requiere especificar el proceso de medida, persigue permitir su reproducibilidad, es decir, hacer factibles tanto la ratificación científica como el uso clínico. Finalmente, el tercer objetivo re-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

quiere hacer explícitos los aspectos que permitirán valorar los dos determinantes de la calidad de su determinación: su fiabilidad (error aleatorio razonablemente pequeño) y su validez (ausencia de sesgos o errores sistemáticos). Así, la repetición de la medida pretende aumentar su validez al disminuir la variabilidad intracaso, mientras que el enmascaramiento persigue aumentar su validez al anular los sesgos en su determinación. Una variable puede desempeñar tres papeles en un estudio. En primer lugar, representemos por Y a la variable respuesta (outcome, endpoint), cuya evolución se desea predecir (pronóstico) o modificar (tratamiento, prevención). Ejemplos típicos de respuesta Y serían ciertos síntomas o signos clínicos, la cantidad y la calidad de vida, o el tiempo libre de complicaciones. En segundo lugar, se puede identificar con X a la variable en la que se pretende intervenir para modificar la respuesta. El consejo dietético o la prescripción de un fármaco serían ejemplos característicos. En tercer lugar, se puede notar por Z a las condiciones o atributos que podrían predeterminar la respuesta Y, pero que el investigador no puede asignar, ya que las unidades llegan al estudio con valor en estas variables. Típicos ejemplos de Z son el sexo, la edad o los hábitos higiénico-dietéticos previos. Estimar el tamaño del efecto en un estudio de intervención consiste en cuantificar los cambios en la respuesta Y que siguen a una intervención en la causa X, independientemente del valor de los atributos Z contemplados en los criterios de selección. En cambio, si el objetivo no es intervenir sino predecir, se deseará conocer cómo combinar los valores de estos atributos Z para hacer la «mejor» predicción de la respuesta Y. Por supuesto, una vez observada una relación entre una condición Z y una respuesta Y, aparece una nueva hipótesis, etiológica, sobre si futuros cambios en variables Z modificables irán seguidos de cambios en la respuesta Y. Los estudios contemplados en CONSORT, STROBE y STARD contienen variables de los tres tipos. Todos ellos contienen una variable Y respuesta. Obtenerla con el menor error posible de medida aumenta su fiabilidad y la precisión de los resultados del estudio, es decir, intervalos de confianza más estrechos. Por tanto, aumentar esta fiabilidad de la respuesta (p. ej., mediante la repetición de las determinaciones) tiene el mismo efecto que aumentar el tamaño del estudio. De este modo, las recomendaciones CONSORT 6b y STROBE 8 piden que se especifiquen los métodos empleados para mejorar la calidad de las determinaciones. En esta línea, STARD 10 requiere que se especifique el entrenamiento de los evaluadores. La recomendación CONSORT 4 pide especificar las intervenciones (variables X) con el objetivo de que puedan ser administradas de la misma forma en el futuro. Y STROBE 8 requiere que se diferencie claramente qué papel desempeña cada variable en el modelo: cuáles son las variables (X) cuyo efecto causal se desea explorar y cuáles son las Z que podrían ser confusoras o modificadoras del efecto y, por tanto, se desea tener controladas. El mismo punto abarca los estudios pronósticos, ya que requiere que se especifiquen las respuestas Y que se desea anticipar y las variables predictoras Z. Es bien conocido que las recomendaciones 11 de CONSORT y de STARD requieren el enmascaramiento de los evaluadores. Asimismo, STROBE 9 solicita especificar todas las medidas encaminadas a controlar el sesgo, y en su cua-

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

dro 3 hace explícita la necesidad del enmascaramiento. CONSORT va mucho más lejos. Pide que también estén enmascarados quienes: reclutan voluntarios (punto 9), asignan intervenciones (9), administran intervenciones (11), siguen a los participantes (11) y también los voluntarios que reciben las intervenciones (11). El enmascaramiento de quienes analizan e interpretan los resultados se consigue mediante la especificación completa y previa del método de análisis y sus reglas de decisión. El uso de términos como «doble ciego» se desaconseja por dos razones: no aclaran a quién se le oculta la intervención y dan por sentado que se consigue ocultarla. Por ejemplo, si un fármaco tiene un perfil muy característico de eventos adversos, un buen clínico quizá esté «enmascarado», pero difícilmente estará «cegado». En este caso, convendría que este clínico no pueda influir en la determinación de la variable respuesta, bien utilizando un proceso automático, sin matices, bien mediante la evaluación por terceros que sí que permanecen «cegados». Terminemos resaltando que CONSORT 11b pide que se estudie y se informe si realmente se ha logrado ocultar la intervención: por ejemplo, en un estudio de un quimioterápico frente a placebo, se puede pedir al investigador que intente adivinar el tratamiento asignado, para comprobar así en qué proporción de pacientes consiguió desvelarlo.

1BSUJDJQBOUFT El proceso de inferencia requiere especificar de los participantes: a) los criterios de elección; b) los lugares y fechas de reclutamiento; c) sus características, y d) las pérdidas durante el seguimiento (tabla 8-3). STARD 3 pide especificar los criterios de inclusión y de exclusión de pacientes, pero CONSORT 3a y STROBE 6a piden especificar los criterios de elegibilidad (o de selección o de elección) de pacientes, sin distinguir entre inTabla 8-3. Recomendaciones de las listas de comprobación sobre el informe de los participantes CONSORT

STROBE

Criterios de (s)elección

© Elsevier. Fotocopiar sin autorización es un delito.

Voluntarios

M

M Introducción R

Método de asignación

Método de selección

Lugares

Lugares y fechas

STARD Criterios de inclusión y exclusión Lugares

Fechas de reclutamiento Fechas de seguimiento (cantidad) Demográficas y clínicas

Características

Pérdidas

Exposiciones y variables confusoras

R

Gravedad

M

Estrategia para su inclusión en el análisis

R

Diagrama de flujo (elegibles, examinados, confirmados elegibles, invitados, que otorgan el consentimiento, incluidos, que completan por fases, analizados)

M: material y métodos; R: resultados.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

cluyentes y excluyentes, posiblemente para evitar la sensación de que existen criterios metodológicos que justifiquen la exclusión de un voluntario una vez empezado el estudio, ya que no se debe confundir «abandono del tratamiento» con «abandono del estudio»4. STARD proporciona un ejemplo en que el hecho de no obtener el consentimiento informado de un participante resulta en una causa de exclusión del estudio. Obsérvese que el orden lógico y ético consiste en comprobar los criterios de elegibilidad y obtener el consentimiento informado antes de la inclusión del paciente, no después. Por tanto, el único criterio para excluir los datos de un paciente del estudio sería que éste retirara el consentimiento sobre la difusión de los mismos, aspecto muy controvertido entre los especialistas en ética4. CONSORT y STROBE no contienen puntos dedicados a los aspectos éticos, aunque sí que hacen referencia a éstos. Así, la introducción de CONSORT recuerda que son requisitos indispensables la aprobación de un estudio por parte de un comité ético y la obtención del consentimiento de los participantes. Para situar el estudio en el contexto histórico, geográfico, clínico y humano, CONSORT 3, STROBE 5 y STARD 3 piden comunicar las fechas y los lugares donde se llevó a cabo el estudio, así como las características de los participantes (CONSORT y STARD 15); además, STROBE 14a insiste en la necesidad de informar de las exposiciones (X) y las variables confusoras (Z). Asimismo, CONSORT 14 y STROBE 3 piden que se proporcionen las fechas de reclutamiento, y STROBE 5, las de seguimiento. Las recomendaciones 13 de CONSORT y STROBE, y también STARD 16, exigen comunicar el número de casos de los sucesivos pasos: elegibles, examinados, confirmados elegibles, invitados, que aceptan participar, incluidos, que completan por fases y, finalmente, analizados. Dado que el proceso de inferencia estadística descansa en la representatividad de los participantes obtenida por el azar del proceso inicial (sea asignación o selección), sólo un seguimiento completo e idéntico de todos los casos permite mantener esta representatividad al final del estudio5. Así, cuanto menor sea el número de pérdidas de un estudio, mayor será la validez de sus conclusiones. Para destacar la importancia de este aspecto y facilitar la comprensión del número y las razones de los perdidos, las guías de publicación incentivan el uso de flujogramas de los que ofrecen ejemplos muy ilustrativos que pueden utilizarse como modelos.

%FOPNJOBEPSFT CONSORT 16 aconseja decir «10 de 20» o «10 de 20 (50%)» en lugar de «50%» a secas (tabla 8-4). Los denominadores no sólo informan de la cantidad de información aportada, sino también del significado de la proporción: «¿Estamos comunicando el porcentaje de fila o el porcentaje de columna?». Uno de los conceptos más básicos, pero más difíciles, en estadística es la distinción entre P(A|B) o porcentaje de A dentro de la condición B y P(B|A) o porcentaje de B condicionado a A. La distinción entre sensibilidad y valor predictivo positivo ilustra esta dificultad. En un estudio sobre las interrupciones voluntarias del embarazo en adolescentes, no es lo mismo el porcentaje de preservativos rotos condicionado a que la adolescente se haya quedado embarazada, que

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

Tabla 8-4. Recomendaciones de las listas de comprobación sobre el informe de los resultados CONSORT N.º casos Análisis principal MyR Análisis secundarios Eventos adversos

STROBE

STARD

Denominadores Tamaño del efecto

Capacidad predictiva

Medidas de incertidumbre (IC del 95%, EE) Opcional (2.º) Multiplicidad

Ajustada y sin ajustar

Subgrupos e interacciones Análisis de sensibilidad Todos los importantes

Cualquiera

EE: error estándar del estimador; IC: intervalo de confianza sobre el valor del parámetro; M: material y métodos; R: resultados.

el porcentaje de embarazos condicionado a que falló el preservativo. Convertir en palabras estos porcentajes es también difícil, por lo que en ocasiones el lector sólo tiene certeza de a qué se refiere el autor cuando confirma el denominador. La cantidad de seguimiento obtenida (CONSORT y STROBE, puntos 13 y 14) es especialmente importante cuando la respuesta estudiada es la aparición, a lo largo del tiempo, de cierto evento de interés, como en los estudios de supervivencia. En este caso, la información aportada por el estudio es el número de eventos observado, que depende no sólo del número de casos estudiado, sino también de la cantidad de tiempo durante la que han sido seguidos. STROBE 15 muestra un ejemplo que proporciona el número de eventos observado y el total de personas-año seguidas (suma de los tiempos para todos los participantes). Un buen gráfico de supervivencia mostrará también cuántos pacientes han alcanzado las fechas sucesivas del seguimiento.

© Elsevier. Fotocopiar sin autorización es un delito.

0CKFUJWPTZBOgMJTJTQSJODJQBM Los objetivos del estudio determinan el resultado principal que se debe notificar. En un estudio de intervención, se tratará del «tamaño del efecto» de la causa en estudio (CONSORT 17); por ejemplo, cierto fármaco podría bajar la presión arterial sistólica 10 mmHg. En cambio, en un estudio diagnóstico, se tratará del porcentaje de casos correctamente clasificados (STARD 21); por ejemplo, un método diagnóstico para el sida puede tener una capacidad para detectar al 99% de los enfermos (sensibilidad) y excluir al 98% de los sanos (especificidad). En cambio, los estudios cubiertos por STROBE abarcan ambas posibilidades. Pueden oscilar desde el extremo de desear construir un índice pronóstico, sin preguntarse por los mecanismos causales, hasta el otro extremo de explorar posibles causas para una cierta respuesta observada. En el primer caso, como los estudios diagnósticos, lo importante es el grado de acierto; mientras que en el segundo, como en los de intervención, interesa el posible «tamaño del efec-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

to» de los factores en la respuesta. La tabla 8-5 resume las propiedades de un índice predictivo de neumonía después de anestesia. Los autores desarrollan el índice en una parte de la cohorte y lo validan en otra. En función de los valores de 14 variables, proponen 5 categorías de riesgo creciente y observan si la cohorte de validación reproduce los resultados obtenidos en la cohorte empleada para construir el índice. Los resultados muestran que, en la categoría 1, menos de un caso de cada 400 (0,24%) desarrolla la neumonía, mientras que en la categoría 5 lo hacen casi uno de cada 6 (15,9%). La tabla 8-6 expone las odds ratio correspondientes a las variables que definen dicho modelo predictivo. Interpretar tentativamente los coeficientes de estas 14 variables inicia la investigación etiológica. En efecto, asumiendo: a) que el modelo expresa correctamente la relación entre cada variable y la respuesta; b) que contiene todas las variables relevantes, y c) que éstas se miden sin error, entonces cada uno de estos coeficientes estima el efecto de cada variable en la aparición de neumonía. Obsérvese que mientras la tabla 8-5 sobre la capacidad predictiva no tiene premisas adicionales («ésos son los casos predichos y ésos son los resultados»), las estimaciones etiológicas de los «tamaños del efecto» descansan en premisas muy exigentes. Tanto es así, que si la ciencia avanza y descubre una nueva variable, debería repetirse el estudio para investigar si, incluyendo dicha variable en el modelo, los «tamaños del efecto» de las restantes variables permanecen iguales. Por supuesto, este avance también permitirá «mejorar» la capacidad predictiva del modelo anterior, pero eso no significa que la capacidad anterior fuera incorrecta: era correcta, sólo que era mejorable. En cambio, el efecto estimado sí que era incorrecto: estábamos atribuyendo a una variable un efecto que finalmente otra nueva variable «le ha quitado». En resumen, como es bien conocido, los ensayos clínicos permiten confirmar efectos, mientras que los Tabla 8-5. Ilustración de la capacidad predictiva de un índice pronóstico

La correspondencia entre las probabilidades predichas y las frecuencias observadas en la cohorte de construcción del modelo y la prueba de H-L muestran la bondad del ajuste (calibrado) del modelo logístico empleado. La correspondencia entre ambas frecuencias observadas permite confirmar el modelo. El estadístico Co de Mann-Whitney-Wilcoxon se corresponde con el área bajo la curva ROC y estima que, de todas las posibles parejas formadas por casos con o sin neumonía, en el 79,26% (cohorte de validación) tenía un mayor valor del índice predictivo el caso con neumonía. Tomado de Arozullah AM, Khuri SF, Henderson WG, Daley J. Development and validation of a multifactorial risk index for predicting postoperative pneumonia after major noncardiac surgery. Ann Intern Med. 2001;135:847-57.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 8-6. Medidas de la intensidad de la asociación entre los predictores incluidos en el modelo y la variable respuesta «aparición de neumonía»

Tomado de Arozullah AM, Khuri SF, Henderson WG, Daley J. Development and validation of a multifactorial risk index for predicting postoperative pneumonia after major noncardiac surgery. Ann Intern Med. 2001;135:847-57.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

estudios pronósticos permiten confirmar capacidades predictivas y, además, proponen, tentativamente, posibles causas. En los estudios observacionales, las conclusiones dependen del modelo empleado, por lo que STROBE 11 y 12 requieren explicar claramente la forma de considerar cada variable en el modelo, y STROBE 16 pide análisis de sensibilidad de las conclusiones a las premisas. Es decir, realizar análisis alternativos bajo diferentes modelos y premisas, valorando incluso cuál podría ser el impacto de una variable omitida o de una determinación no perfecta de las variables incluidas en el modelo. El ensayo clínico no tiene esta debilidad, ya que la asignación al azar permite obtener grupos que provienen de una misma población y tienen, por tanto, equilibradas todas las terceras variables no observadas. Así, en el ensayo clínico la consideración de las terceras variables en el análisis no desempeña un papel tan crucial —dado que han sido consideradas en el diseño—. Aun así, si una variable con capacidad predictiva es observable, medible sin error y se conoce la forma de su relación con la respuesta, considerarla en el análisis es coherente y puede aumentar la eficiencia de las estimaciones. De este modo, en el ensayo clínico puede optarse por un análisis no ajustado, más legible, o por un análisis ajustado, más elegante pero con premisas adicionales6. Siempre que pueda documentarse que su elección ha sido previa a los datos, cualquiera de las dos opciones es aceptable como análisis principal.

0CKFUJWPTZBOgMJTJTTFDVOEBSJPT Podemos diferenciar dos grandes tipos de análisis secundarios: los destinados a explorar otras posibilidades y los que pretenden comprobar si la conclusión principal permanece cuando se cambian o las premisas o las condiciones del análisis. El mejor ejemplo de los primeros sería estudiar los efectos de la intervención en otras respuestas, además de la contemplada en el análisis principal. Se trata de proponer nuevas ideas y proporcionar estimaciones de los efectos en otras variables. Por supuesto, no pueden convertir en positivo un resultado negativo de un estudio, pero permite aprovechar el esfuerzo de la recogida de información. El segundo grupo de análisis secundarios pretende estudiar si las premisas pueden estar influyendo en las conclusiones. En el fondo, se desea que no aporten grandes novedades, de forma que no debamos matizar la conclusión principal. Esto es lo que esperamos cuando comparamos las estimaciones ajustadas y no ajustadas de un efecto: la mejor noticia es que, lo miremos como lo miremos, llegamos a la misma conclusión. La figura 8-2 muestra, en otro ejemplo, la magnitud del efecto en diversos grupos de pacientes para estudiar si la premisa de homogeneidad del efecto es razonable o no. Dado que el estudio está diseñado para demostrar el efecto en el conjunto de todos los casos, carece de potencia para establecerlos en cada uno de los subgrupos, de menor tamaño. Por tanto, debe valorarse con mucha prudencia, teniendo en cuenta la amplitud de los intervalos de confianza en ambos sentidos. Y, dado su carácter exploratorio, interpretar con cautela las

© Elsevier. Fotocopiar sin autorización es un delito.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

Figura 8-2. Análisis de subgrupos en un ensayo clínico. Se repite el análisis principal del estudio para estudiar si el efecto estimado de la intervención es razonablemente homogéneo en todos ellos. El solapamiento de los intervalos de confianza y la no significación de la prueba de interacción no arroja dudas sobre esta homogeneidad, si bien su potencia es siempre menor que la que se dispone para el objetivo principal del estudio. Tomado de Cleland JG, Daubert JC, Erdmann E, Freemantle N, Gras D, Kappenberger L, et al. The effect of cardiac resynchronization on morbidity and mortality in heart failure. N Engl J Med. 2005;352:1539-49.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

conclusiones. Afortunadamente, en este gráfico, todo parece apuntar en la misma dirección, ya que los intervalos de confianza se solapan. Análogamente, podemos estudiar si un conjunto de eventos no deseados contribuyen de forma similar en una evolución definida como la suma del conjunto de todos ellos (composite endpoint).

Figura 8-3. Estimación del efecto de la intervención en cada uno de los componentes de una variable compuesta (composite end-point). Los intervalos de confianza se solapan en gran parte y no cuestionan la homogeneidad del efecto, si bien éste parece ser nulo en los componentes 2 y 3. Ningún componente por separado alcanza la significación estadística, pero debe recordarse que el tamaño muestral y la potencia del estudio se fijan para el objetivo principal, que es la suma de todos los componentes. Tomado de Almendral J, Arribas F, Wolpert C, Ricci R, Adragao P, Cobo E, et al. Dual-chamber defibrillators reduce clinically significant adverse events compared with single-chamber devices: results from the DATAS (Dual chamber and Atrial Tachyarrhythmias Adverse events Study) trial. Europace. 2008;10:528-35.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

La figura 8-3 muestra que los componentes primero, cuarto y quinto son los que más positivamente contribuyen al efecto observado, mientras que el segundo y el tercero son entre neutros y muy ligeramente positivos. Este gráfico muestra que los intervalos se solapan, apoyando la homogeneidad del efecto en todos estos componentes (o, al menos, que ninguno apunta en dirección contraria). Obsérvese también que ninguno de ellos, por separado, habría alcanzado la significación estadística. Precisamente, el objetivo estadístico de combinarlos es sumar la información aportada por cada uno de ellos, de forma que la información total permita alcanzar los objetivos del estudio. La figura 8-4 muestra un ejemplo que estudia si la estrategia de análisis estadístico, en concreto, la elección del punto de corte, ha influido en las conclusiones. La parte inferior de la figura muestra cómo crece el porcentaje de casos declarados de alto riesgo si se diminuye el valor del dintel; y la parte superior, que la relación observada con la variable predictora permanece estable sea cual sea el valor escogido de este punto de corte.

.nUPEPFTUBErTUJDPEFJOGFSFODJB

© Elsevier. Fotocopiar sin autorización es un delito.

Posiblemente la novedad más importante de las guías de publicación es la recomendación que no hacen: «ponga un valor de p». En su lugar, piden que se acompañen las estimaciones del efecto o bien de su precisión (CONSORT 17 y STROBE 16), o bien de medidas de la incertidumbre de su estimación

Figura 8-4. Estudio de la sensibilidad de las conclusiones ante la elección del punto de corte de la variable respuesta (dintel a partir del cual se considera mala evolución). La parte superior de la figura muestra que la estimación de la intensidad de la asociación no depende de la elección del punto de corte. Tomado de Buyse M, Loi S, Van’t Veer L, Viali G, Delorenzi M, Glas AM, et al. Validation and clinical utility of a 70-gene prognostic signature for women with node-negative breast cancer. J Natl Cancer Inst. 2006;98:1183-92.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

(STARD 21). Todas se refieren a medidas como el error estándar del estimador o el intervalo de confianza sobre el valor del parámetro. Obsérvese que expresiones del tipo «la presión sistólica de los tratados con A fue menor que la de los controles (p < 0,01)» incumplen dos recomendaciones: no informan sobre el tamaño del efecto ni proporcionan información sobre la incertidumbre de esta estimación. En cambio, sí que cumple con ambas la sentencia: «Comparado con el tratamiento de referencia, A bajó la presión sistólica 5 mmHg adicionales (IC del 95%: 3 a 7 mmHg)». Es opcional añadir detrás «p < 0,001», pero ninguna guía lo reclama. El lector puede encontrar algunas razones para esta actitud en, por ejemplo, el artículo de Hubbard y Bayarri7 o en el libro Bioestadística para no estadísticos8.

%JTDVTJwO CONSORT y STROBE recomiendan (tabla 8-7) estructurar la discusión en: a) resumen de los hallazgos clave; b) interpretación cauta de la validez interna, resaltando las limitaciones en cuanto a error sistemático (sesgo) y aleatorio (imprecisión) y comentando las consecuencias de la multiplicidad de análisis realizados; c) validez externa, incluso con una revisión sistemática de todos los resultados, y d) valorando la aplicabilidad clínica en los entornos más relevantes. STROBE 19 recomienda cuantificar la magnitud de cualquier sesgo concebible. Por ejemplo, si se observa que 50 de los 100 casos de botulismo registrados en cierta comunidad y en cierto período sobrevivieron, son necesarios dos pasos para cuantificar la incertidumbre de esta estimación del 50% de mortalidad. Primero se asume que todos los habitantes de esa comunidad tienen la misma probabilidad de contraer botulismo. Aunque no es estrictamente necesario, si además se asume que dichas probabilidades son independientes entre sí, ya se dispone de los mecanismos que hubieran originado una muestra aleatoria simple, que permite análisis menos sofisticados. Por ejemplo, un cálculo basado en la distribución binomial, adecuado para muestras pequeñas, nos dice que si los 100 casos proceden al azar de una población, observar 50 muertes es compatible con probabilidades de fallecer en la población comprendidas entre 39,83 y 60,17%, con una confianza del 95%. El segundo paso consiste en cuestionar si todos los casos de botulismo fueron detectados. Si, por ejemplo, cabe esperar que la mitad de las muertes por botulismo no fue-

Tabla 8-7. Recomendaciones de las listas de comprobación sobre la discusión CONSORT

STROBE

Resumen hallazgos clave Interpretación cauta Limitaciones, sesgo, imprecisión, multiplicidad Cuantifique sesgo Generabilidad (validez externa) y aplicabilidad clínica Revisión sistemática

STARD

© Elsevier. Fotocopiar sin autorización es un delito.

6 / 1" 4 & 0 & 4 5" % Ê 4 5 * $ 0 1 0 3 - " 4 ( 6 Ê " 4 % & 1 6 # - * $ " $ * Î /

ran diagnosticadas como tales, deberíamos añadir 50 casos al numerador y al denominador, subiendo la mortalidad a 100 de 150 casos (66,6%). En cambio, si lo que cabía esperar es que los casos leves no se diagnosticaran y su número se estima igual al de los casos diagnosticados, ahora deben añadirse 50 casos, pero sólo al denominador, resultando en una mortalidad de 50 sobre 150 casos (33,3%). Este ejemplo muestra que la magnitud del error sistemático por imprecisiones en la recogida de los datos (del 33,33 al 66,67%) puede ser mayor que el error contemplado por un proceso aleatorio puro (IC del 95%: 39,83 al 60,17%). Finalmente, para interpretar correctamente los resultados hay que distinguir entre el objetivo científico de adquisición de conocimiento y el objetivo clínico que requiere tomar decisiones. Por un lado, la inferencia persigue el proceso de adquisición de conocimiento, valorando las pruebas científicas («evidencia») a favor o en contra de los modelos establecidos, para lo que puede utilizar los intervalos de confianza o, incluso, si el autor así lo considera (¡en contra de las guías de publicación!), el valor de p (pvalue). Por otro lado, el acto médico, la gestión de recursos o el permiso de comercializar un nuevo fármaco implican un proceso de decisión en un marco de incertidumbre, lo que requiere marcar límites para los riesgos asociados a las dos decisiones erróneas (errores de tipo I y tipo II). Aunque el proceso de decisión incluye la inferencia y el uso del conocimiento previo disponible, también debe abarcar las consecuencias (utilidad, coste, etc.) de las opciones alternativas en consideración. Así, la decisión de emprender una campaña preventiva sobre los efectos del tabaco depende no sólo del conocimiento disponible, sino también de las consecuencias y los riesgos de las posibles alternativas. Para Greenland9, al ver humo en un bosque, es mejor decisión enviar el cuerpo de bomberos para apagar un posible fuego aún no confirmado, que a un grupo de científicos para confirmar que la causa del humo es el fuego. O más crudamente, antes de usar el paracaídas en un salto desde mil metros de altura 10, nadie preguntaría por el ensayo aleatorizado y enmascarado que aporte las pruebas científicas sobre el efecto beneficioso del paracaídas. Por supuesto, las decisiones implícitas en el acto médico deben basarse en el conocimiento contrastado empíricamente que aportan los artículos científicos, pero también en las consecuencias (utilidades, beneficios, costes, etc.) de las alternativas en consideración —y su valoración por los destinatarios de la misma—. Como todas estas últimas pueden variar fácilmente de un entorno a otro, es difícil recomendar acciones comunes a todo el universo. Precisamente, la teoría de la decisión aporta los elementos para hacer racionalmente el paso desde un artículo científico, que es «universal» en el sentido de aplicar a todos los pacientes de la población objetivo, a una guía de práctica clínica «local». Por todo ello, conviene distinguir entre los «almacenes» de conocimiento (revistas científicas, bibliotecas o las colaboraciones Cochrane y Campbell) y los órganos de decisión (agencias reguladoras, departamentos de farmacia, agencias de salud pública), que deben priorizar sus acciones de acuerdo con sus probabilidades de error y las consecuencias de éstos. En resumen, el conocimiento en sí mismo no tiene implicaciones, pero las

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

acciones y las decisiones que se toman en base al mismo, sí. Por tanto, las reglas formales que la ciencia aporta para la adquisición de conocimiento no son las mismas que las que emplea la técnica en la toma de decisiones, como tan oportunamente recuerda el ejemplo del paracaídas.

#*#-*0(3"'Ê" 1. 2. 3. 4. 5. 6. 7. 8.

9. 10.

Fernández E, Cobo E, Guallar-Castillón P. La Declaración STROBE o cómo mejorar la presentación de los estudios observacionales. Gac Sanit. 2008;22:87-9. Altman DG, Moher D. Elaboración de directrices para la publicación de investigación biomédica: proceso y fundamento científico. Med Clin (Barc). 2005;125(Supl 1):8-13. Kleinbaum DG, Kupper L, Morgenstern H. Epidemiological research: Principles and quantitative methods. Nueva York: Wiley; 1982. Cobo E, Senn S, Elmore M. Withdrawing from the treatment does not mean from the study. Bull World Health Organ. 2008;86:737-816. Cobo E. Diseño y análisis de un ensayo clínico: el aspecto más crítico. Med Clin (Barc). 2004;122:184-9. Senn S. Baseline balance and valid statistical analyses: Common misunderstandings. Applied Clinical Trials. 2005;14:24-7. Hubbard R, Bayarri MJ. Confusion over measures of evidence (p’s) versus errors in classical statistical testing. American Statistician. 2003;57:171-82. Cobo E, Muñoz P, González JA. Prueba de significación y contraste de hipótesis. En: Cobo E, Muñoz P, González JA, eds. Bioestadística para no estadísticos. 1.ª ed. Barcelona: Elsevier; 2007. p. 157-92. Greenland S. Science versus public health action: Those who were wrong are... Am J Epidemiol. 1991;133:435-6. Smith GC, Pell J. Parachute use to prevent death and major trauma related to gravitational challenge: Systematic review of randomised controlled trials. BMJ. 2003;327:1459-61.

&OTBZPTDMrOJDPT BMFBUPSJ[BEPT "$PCPT

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ Los ensayos clínicos aleatorizados (ECA) bien diseñados y correctamente ejecutados proporcionan la mejor evidencia sobre el efecto de las intervenciones sanitarias, pero una metodología inadecuada puede resultar en estimaciones exageradas de este efecto1,2. Para poder evaluar la metodología de un ECA a partir de su publicación, es preciso que su diseño, ejecución y análisis se describan detalladamente, con exactitud y transparencia. Sin embargo, se ha constatado repetidamente que la información facilitada en las publicaciones es muchas veces insuficiente3-6, o inexacta (por abuso de términos como «análisis por intención de tratar»7 o «aleatorización»8), y que ciertos problemas metodológicos son frecuentes9-11. Con ánimo de mejorar la situación, a principios de los años noventa, dos grupos de editores, profesionales del ensayo clínico y metodólogos, elaboraron por separado recomendaciones para comunicar ensayos clínicos 12,13. Posteriormente, ambos grupos reunieron sus esfuerzos y consensuaron una propuesta conjunta que se publicó bajo el título de CONSORT statement, acrónimo de CONsolidated Standards Of Reporting Trials14. CONSORT es básicamente una lista-guía de los puntos que se consideran críticos y que, por tanto, deberían incluirse en todo informe o comunicación de un ensayo clínico, y un diagrama para ilustrar el flujo de individuos participantes a lo largo del ensayo. En principio, la guía CONSORT se desarrolló para ensayos clínicos de grupos paralelos, y aunque gran parte de su contenido es también válido para otros diseños, se trabaja en extensiones o adaptaciones para otro tipo de ensayos15,16. El objetivo de la guía CONSORT es facilitar la lectura crítica y la interpretación de los ECA, orientando a los autores, revisores y editores acerca de cómo debe comunicarse este tipo de estudios. Desde su publicación en 1996, diversas revistas y grupos editoriales (incluyendo el grupo de Vancouver) han

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Inclusión

Evaluados para inclusión (n = ...)

Excluidos (n = ...) Incumplen criterios (n = ...) No consienten (n = ...) Otras razones (n = ...)

Asignados a intervención (n = ...)

Recibieron intervención asignada (n = ...)

Recibieron intervención asignada (n = ...)

No recibieron intervención asignada (indicar motivos) (n = ...)

No recibieron intervención asignada (indicar motivos) (n = ...)

Seguimiento

Perdidos en el seguimiento (n = ...) (indicar motivos)

Perdidos en el seguimiento (n = ...) (indicar motivos)

Interrumpen la intervención (indicar motivos) (n = ...)

Interrumpen la intervención (indicar motivos) (n = ...)

Analizados (n = ...)

Analizados (n = ...)

Excluidos del análisis (indicar motivos) (n = ...)

Excluidos del análisis (indicar motivos) (n = ...)

Asignación

Asignados a intervención (n = ...)

Análisis

Aleatorizados (n=...)

Figura 9-1. Diagrama de flujo de participantes.

adoptado la guía CONSORT, y posteriormente se ha podido verificar un aumento en la calidad de la comunicación de los ECA17,18. Sin embargo, también se pusieron de manifiesto ciertas limitaciones19, por lo que en 1999 se emprendió la revisión de la versión inicial, dando lugar a una versión revisada que apareció publicada en 200120-22. En este capítulo se presentan los 22 puntos (tabla 9-1) y el diagrama de flujo (fig. 9-1) que constituyen la guía CONSORT, acompañados de breves comentarios. En una publicación previa23 y también en Internet (http://www. consort-statement.org) se puede consultar la justificación de los 22 puntos incluidos en la guía, así como ejemplos publicados de lo que se consideran comunicaciones correctas.

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4

Tabla 9-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo aleatorizado Punto n.º Título y resumen

Descriptor

1

Cómo se asignaron los pacientes a las intervenciones (p. ej., «asignación aleatoria» o «aleatorizado»)

2

Antecedentes científicos y razón de ser del estudio

Participantes

3

Criterios de selección de pacientes y ámbito y lugares en que se recogieron los datos

Intervenciones

4

Detalles precisos de las intervenciones pretendidas para cada grupo y cómo y cuándo fueron efectivamente administradas

Objetivos

5

Objetivos e hipótesis específicos

Resultados

6

Definición clara de las medidas de los resultados principal y secundarios y, cuando proceda, de cualquier método utilizado para mejorar la calidad de las medidas (p. ej., observaciones múltiples, entrenamiento de evaluadores)

Tamaño muestral

7

Cómo se determinó el tamaño muestral y, cuando proceda, explicación de cualquier análisis intermedio y reglas de interrupción del ensayo

Generación de la secuencia

8

Método utilizado para generar la secuencia de asignación aleatoria, incluyendo detalles sobre cualquier restricción (p. ej., bloques, estratificación)

Asignación oculta

9

Método utilizado para implementar la secuencia de asignación aleatoria (p. ej., contenedores de medicación numerados, aleatorización centralizada por teléfono), clarificando si la secuencia se mantuvo oculta hasta el momento de la asignación

Implementación

10

Quién generó la secuencia de asignación, quién incluyó a los participantes y quién los asignó a los grupos

Ciego (enmascaramiento)

11

Si los participantes, quienes administraron las intervenciones o quienes evaluaron los resultados conocían o no la intervención asignada. Si procede, cómo se evaluó el éxito del enmascaramiento

Métodos estadísticos

12

Métodos estadísticos empleados para comparar los grupos en cuanto al resultado principal; métodos utilizados en análisis adicionales, como análisis de subgrupos o análisis ajustados

13

Flujo de participantes a través de cada estadio (se recomienda un diagrama). Específicamente, para cada grupo, documentar los números de participantes asignados aleatoriamente, que recibieron el tratamiento pretendido, que completaron el protocolo del estudio y que fueron incluidos en el análisis del resultado principal. Describir las desviaciones del protocolo planificado, y los motivos

Informado en página número

Introducción Antecedentes Métodos

© Elsevier. Fotocopiar sin autorización es un delito.

Aleatorización

Resultados Flujo de participantes

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM Tabla 9-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo aleatorizado (cont.) Punto n.º

Descriptor

Reclutamiento

14

Fechas que limitan los períodos de reclutamiento y de seguimiento

Datos basales

15

Características demográficas y clínicas basales en cada grupo

Números analizados

16

Número de participantes (denominador) de cada grupo incluidos en cada análisis, y si el análisis se realizó «por intención de tratar». Expresar los resultados mediante números absolutos cuando sea factible (p. ej., «10/20» en lugar de «50%»)

Resultados y estimación

17

Para cada resultado principal y secundario, un resumen de resultados por grupo y el efecto estimado y su precisión (p. ej., IC del 95%)

Análisis auxiliares

18

Considerar la multiplicidad, informando sobre cualquier otro análisis realizado, incluyendo análisis de subgrupos y análisis ajustados, indicando los preespecificados y los exploratorios

Eventos adversos

19

Todos los eventos adversos o efectos colaterales importantes en cada grupo de intervención

Interpretación

20

Interpretación de los resultados, teniendo en cuenta las hipótesis del estudio, las fuentes de sesgo o imprecisión potenciales y los peligros asociados a la multiplicidad de análisis y de resultados

Generalización

21

Generalización (validez externa) de los hallazgos del ensayo

Evidencia global

22

Interpretación general de los resultados en el contexto de la evidencia actual

Informado en página número

Discusión

5Ê56-0:3&46.&/ 1VOUP5rUVMPZSFTVNFO Para facilitar su indexación como ECA en las bases de datos bibliográficas y su identificación en las búsquedas24, se recomienda mencionar el método de asignación de los individuos a los grupos de tratamiento tanto en el resumen como en el título del artículo.

*/530%6$$*Î/ 1VOUP"OUFDFEFOUFT Resumir y referenciar el conocimiento previo, y razonar la necesidad del ensayo, son condiciones para cumplir con el principio ético de evitar la exposición

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4

innecesaria de los individuos a los riesgos de una investigación poco justificada25. Algunos ensayos clínicos podrían haberse evitado haciendo una revisión sistemática de los previos26. Por ello, la introducción debe hacer referencia a los ensayos clínicos previos similares y a posibles revisiones sistemáticas de dichos ensayos, o hacer notar su ausencia.

.c50%04 1VOUP1BSUJDJQBOUFT En los ensayos clínicos, la población de individuos definida por la condición clínica de interés suele restringirse mediante criterios de selección tales como la edad, la ausencia de comorbilidad o de comedicación. Todos los criterios de selección (la distinción entre criterios de inclusión y de exclusión es innecesaria27) utilizados deben definirse explícitamente, así como los métodos utilizados para reclutar pacientes. Además de los criterios de selección, debe especificarse el ámbito y los centros en que se ha realizado el ensayo, porque pueden ser determinantes de la validez externa (posibilidad de generalización) de los resultados.

1VOUP*OUFSWFODJPOFT

© Elsevier. Fotocopiar sin autorización es un delito.

Deben describirse las características de todas las intervenciones, incluyendo las utilizadas como control (p. ej., placebo o práctica clínica habitual); en particular, aquellas características de las que, presumiblemente, pueda depender el efecto. Dada la diversidad de posibles intervenciones (fármacos, cirugía, programas educativos, etc.), es difícil estandarizar la descripción de las características relevantes. En algunos casos puede ser imprescindible describir el entrenamiento o la experiencia de quienes practicaron la intervención, además de la técnica empleada (p. ej., intervenciones quirúrgicas)28. Si se trata de intervenciones complejas, como combinaciones de tratamientos, hay que describir los distintos componentes.

1VOUP0CKFUJWPT Deben mencionarse explícitamente los objetivos (o las correspondientes hipótesis) específicos del ensayo y, en el caso de los ensayos confirmatorios, es necesario distinguir el principal de los secundarios.

1VOUP3FTVMUBEPT El término «resultados» se refiere aquí a las variables utilizadas para evaluar comparativamente las intervenciones. Es necesario definir las variables utilizadas y distinguir la principal de las secundarias. La variable principal debe ser la que se consideró más importante al diseñar el ensayo y se utilizó para determi-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

nar el tamaño muestral. Es fundamental que su definición sea inequívoca: cuando la misma variable se evalúa repetidamente (distintos tiempos o métodos), hay que aclarar cuál de ellas, o qué combinación de ellas, es la que se consideró principal. En general, es recomendable definir una única variable principal para evitar problemas de multiplicidad (v. el punto 18); pero si hay más de una, es necesario tenerlos en cuenta y discutirlos. Si los hay, deberían emplearse instrumentos (incluyendo escalas29, p. ej., de calidad de vida) y procedimientos de medida descritos previamente30, e idealmente consensuados, estandarizados o, al menos, de propiedades conocidas, describiendo sus propiedades31.

1VOUP5BNBvPNVFTUSBM Cuando se diseña un ensayo clínico, es ética y científicamente importante asegurar que el análisis principal tendrá una potencia adecuada, es decir, una probabilidad razonablemente alta de demostrar diferencias clínicamente relevantes si éstas existen. Por ello, es importante describir cómo se determinó el tamaño muestral, incluyendo las estimaciones utilizadas en los cálculos y los posibles ajustes para compensar pérdidas, y explicar cualquier discrepancia entre el tamaño muestral pretendido y el finalmente conseguido. No es particularmente interesante calcular a posteriori la potencia de un ensayo porque los intervalos de confianza (v. el punto 17) indican la imprecisión de las estimaciones32. En algunos estudios se realizan análisis intermedios para decidir si vale la pena continuar incluyendo pacientes o, por el contrario, interrumpir el ensayo. Estos estudios requieren métodos de análisis que tengan en cuenta la multiplicidad33-35, y es necesario describir los que se han utilizado y el número de análisis realizados.

1VOUP(FOFSBDJwOEFMBTFDVFODJBBMFBUPSJB En general, la asignación aleatoria se considera uno de los pilares fundamentales en que descansa la credibilidad de los resultados de un ensayo clínico (algunos autores preconizan un procedimiento de asignación, no necesariamente aleatorio, denominado minimización36). El término «aleatorio» tiene un significado técnico preciso que no siempre es bien comprendido37 y que a veces se utiliza con ligereza8. En ocasiones, la descripción de los métodos de asignación utilizados no permite juzgar si esta asignación fue realmente aleatoria38. Por ello, no basta con afirmar que la asignación fue aleatoria, sino que debe explicarse cómo se generó la secuencia de asignación (p. ej., mediante tablas de números aleatorios o mediante funciones generadoras de números aleatorios de programas informáticos), indicando la razón de asignación (p. ej., 3:1) y las restricciones impuestas en el esquema de aleatorización (p. ej., ninguna, bloques de tamaño constante o variable, estratificación). Si se utilizó una minimización, es necesario explicar cuáles fueron los factores de minimización y si se incluyó un componente aleatorio o fue enteramente determinista.

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4

1VOUP"TJHOBDJwOPDVMUB Para conseguir que la asignación de los tratamientos no sea sesgada, no basta con generar una secuencia de asignación de tratamientos aleatoria39. La forma en que se utilice esta secuencia es crítica. Si quien ha de decidir la inclusión o no de un individuo en el ensayo conoce la secuencia de asignación de tratamientos, la decisión de inclusión puede estar condicionada (consciente o inconscientemente) por el tratamiento que recibirá si lo incluye. Es extremadamente importante que el procedimiento de asignación garantice que el tratamiento asignado es impredecible para quien decide la inclusión de individuos40, lo que se consigue manteniendo oculta la secuencia de asignación (concealed allocation)1. Para ello, pueden utilizarse distintos procedimientos, como la aleatorización telefónica por terceros o sistemas de asignación automatizados41. Dada la importancia del proceso de asignación de los tratamientos, es necesario describir el método utilizado.

1VOUP*NQMFNFOUBDJwO Para que se pueda juzgar si la asignación pudo ser predecible o no, además de describir el método utilizado, es particularmente importante explicar quién preparó la secuencia de asignación, quién decidió la inclusión de los individuos y quién realizó la asignación de los tratamientos.

© Elsevier. Fotocopiar sin autorización es un delito.

1VOUP$JFHP FONBTDBSBNJFOUP

En un ensayo clínico, el término «ciego», o «a ciegas», se refiere a que los participantes ignoran qué tratamiento se ha asignado a cada individuo. Para conseguirlo, los distintos tratamientos deben enmascararse de forma que sean indistinguibles. Los ensayos sin enmascaramiento de los tratamientos se describen como ensayos abiertos. El desconocimiento del tratamiento asignado por parte de quienes lo reciben, de quienes lo administran, de quienes evalúan el resultado42 y de quienes analizan los datos43, imposibilita que el prejuicio influya en el resultado del ensayo. El término «doble ciego», muy utilizado en las publicaciones, es un tanto ambiguo: implica que quienes reciben y quienes administran el tratamiento ignoran cuál es éste, pero no revela lo que ocurre con los evaluadores y los estadísticos que analizan los datos 44, extremo que debería quedar claro. A diferencia de lo que ocurre con la asignación oculta (punto 9), el enmascaramiento de los tratamientos no siempre es posible, pero en los ensayos abiertos hay que justificar las razones por las que no se utilizó. En ocasiones, aunque los tratamientos se hayan enmascarado, sus efectos colaterales son demasiado reveladores. En estos casos es importante realizar la evaluación a ciegas (lo que suele ser posible, incluso en ensayos abiertos, si el evaluador es una persona distinta de la que trata y controla al paciente) o verificar el éxito del enmascaramiento preguntando a los participantes (individuos que reciben y/o médicos que administran el tratamiento y evalúan el resultado) cuál creen que

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ha sido el tratamiento administrado45,46. Asimismo, la evaluación a ciegas es especialmente importante cuando las medidas utilizadas son subjetivas.

1VOUP.nUPEPTFTUBErTUJDPT Los métodos estadísticos utilizados para analizar los datos deberían haberse predeterminado durante el diseño del estudio, y es importante indicar si realmente fue así, tanto para el análisis principal como para los secundarios, o bien si se decidieron tras disponer de los datos. La mayoría de los métodos de análisis estadístico proporcionan una estimación puntual del efecto (entendido como un contraste de los tratamientos comparados) y un intervalo de confianza (IC) para la estimación, que usualmente se determina con un nivel de confianza del 95%. El IC del 95%, que representa la incertidumbre sobre el efecto estimado, puede interpretarse como el conjunto de valores posibles que son compatibles con los datos del estudio. Los resultados del análisis pueden expresarse también mediante un grado de significación (p), que expresa la probabilidad de los resultados observados (o más extremos) bajo la hipótesis nula de la correspondiente prueba estadística. Es preferible indicar los valores exactos (p. ej., p = 0,008) en lugar de utilizar ciertos puntos de corte (p. ej., p < 0,05)47. Las pruebas estadísticas más usuales se basan en la suposición de que las observaciones son independientes. Cuando se dispone de múltiples observaciones para cada individuo (medidas en distintos tiempos o en distintos lugares del cuerpo), las distintas observaciones de un mismo individuo no son independientes, y es necesario utilizar estrategias o métodos de análisis que tengan en cuenta esta dependencia48-50. La dependencia de las observaciones puede ocurrir también en diseños en que los tratamientos se asignan a agregaciones (clusters) de individuos (como centros médicos, colegios, unidades geográficas), pero las observaciones se realizan en cada individuo51. Los análisis ajustados deberían incluir sólo variables de ajuste realmente importantes, señalando si éstas se han preespecificado. En cualquier caso, la decisión de ajustar (o no) no debería basarse en la constatación (o no) de diferencias basales significativas52,53. En cuanto a los análisis de subgrupos, es más recomendable ajustar un modelo lineal que incluya una variable indicadora del subgrupo y un término de interacción de ésta con el tratamiento, que analizar cada subgrupo por separado54.

3&46-5"%04 1VOUP'MVKPEFQBSUJDJQBOUFT Para facilitar la comprensión del ensayo18, el flujo de participantes a través de las distintas etapas (inclusión, seguimiento y análisis) debe ilustrarse mediante un diagrama como el de la figura 9-1. Idealmente, debería indicarse el número de individuos inicialmente evaluados para su inclusión en el ensayo (y el de

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4

los que no se incluyeron, junto con los motivos), aunque este dato, que permite juzgar la validez externa de los resultados, no siempre está disponible. Es necesario indicar el número total de individuos aleatorizados y, para cada intervención, los números de individuos que se asignaron a la intervención, que la recibieron (tal como estaba previsto), que completaron el estudio según lo estipulado en el protocolo y que fueron incluidos en el análisis principal, documentando las sucesivas exclusiones junto con los motivos. Esta información es crítica para juzgar la validez interna de un ECA, ya que las pérdidas y las exclusiones del análisis pueden introducir sesgos en los resultados, especialmente si se dan con diferente frecuencia en los distintos grupos55-57. El diagrama de la figura 9-1 puede requerir cierta adaptación según cuál sea la naturaleza de la intervención u otras características del ensayo23.

1VOUP3FDMVUBNJFOUP Las fechas en que se realizó el estudio son importantes para ubicarlo en su contexto histórico. Las fechas de inicio y final del reclutamiento permiten conocer su duración, dato que puede interesar a otros investigadores. En los ensayos con seguimiento de igual duración para todos los pacientes, la fecha de final del seguimiento permite conocer esta duración. En los ensayos en que la variable principal es el tiempo hasta un evento (p. ej., supervivencia), la duración del seguimiento no es la misma para todos los pacientes ya que el ensayo termina en una fecha concreta predeterminada. En estos casos debe indicarse esta fecha, así como la duración mediana del seguimiento. Si el ensayo se interrumpió como resultado de un análisis intermedio (punto 7), debe indicarse34.

© Elsevier. Fotocopiar sin autorización es un delito.

1VOUP%BUPTCBTBMFT Las características demográficas y clínicas basales de los individuos incluidos en un ensayo son importantes para evaluar hasta qué punto los resultados de este ensayo pueden aplicarse a un paciente determinado. Estas características deben describirse para cada uno de los grupos, y es recomendable hacerlo en una tabla. Las variables continuas pueden describirse mediante la media y la desviación estándar (mejor que errores estándar o intervalos de confianza) o mediante los tres cuartiles en caso de asimetría marcada. Las variables cualitativas y las cuantitativas discretas con un número limitado de valores pueden describirse mediante frecuencias. A pesar de que es una práctica común, no es útil realizar pruebas formales para comparar los grupos en cuanto a las características basales, y tales pruebas se han desaconsejado58,59. Aunque una asignación aleatoria correctamente implementada asegura la ausencia de sesgos de selección, no garantiza un equilibrio basal más o menos perfecto, pero si ocurren desequilibrios, serán debidos a fluctuaciones aleatorias (no a sesgo) y las pruebas estadísticas que se utilizarán en el análisis principal sirven, precisamente, para establecer una conclusión teniendo en cuenta las posibles fluctuaciones del azar. Por tanto, asumiendo que la aleatorización es correcta, las decisiones de realizar análisis ajustados por las características basales (p. ej., análisis

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

de covarianza) deben adoptarse en fase de diseño y no a resultas de constatar determinados desequilibrios en las mismas53,60.

1VOUP/|NFSPTBOBMJ[BEPT El número de casos incluidos en un análisis es un dato crítico para interpretar su resultado. Este número queda documentado en el diagrama de flujo para el análisis principal, pero puede ser distinto en otros análisis y debe quedar claro cuál fue en todos ellos. Para ello, es muy útil expresar los resultados de las variables dicotómicas en forma de fracción (p. ej., 10/20 en lugar de 50%). En principio, para evaluar la efectividad de las intervenciones, es aconsejable realizar los análisis por intención de tratar (ITT), es decir, incluyendo todos los casos aleatorizados y manteniéndolos en el grupo al que fueron asignados, porque así se evitan posibles sesgos debidos a pérdidas o exclusiones no aleatorias61. Sin embargo, la adopción de esta estrategia no siempre es sencilla: si hay pérdidas de pacientes a lo largo del ensayo, la evaluación final prevista no estará disponible, lo que obligará a utilizar técnicas de sustitución de datos ausentes para mantener estrictamente la estrategia de análisis por ITT. Por otra parte, las desviaciones del protocolo en lo que se refiere a la administración de las intervenciones pueden inducir una infraestimación del efecto, por lo que es recomendable realizar análisis adicionales incluyendo solamente los casos en que se administró la intervención tal como estaba previsto en el protocolo, lo que se denomina a veces análisis por protocolo (PP)62. A diferencia de lo que ocurre cuando se desea demostrar diferencias entre las intervenciones, cuando el objetivo de un ensayo es demostrar la equivalencia de ambas o la no inferioridad de una respecto de otra, la estrategia por ITT no es conservadora: ciertas desviaciones del protocolo (notablemente las relativas a la administración de la intervención) pueden sesgar los resultados a favor de la hipótesis de equivalencia o no inferioridad63-65. Por otro lado, la potencia de un análisis PP será inferior a la del análisis por ITT66. Por esta razón, en estos ensayos es particularmente importante ofrecer el resultado de ambos análisis, ITT y PP, junto con las definiciones de los conjuntos de individuos que los integran para evitar usos abusivos de esos términos, en particular, el de ITT7.

1VOUP3FTVMUBEPTZFTUJNBDJwO Todos los resultados (principal y secundarios) deben describirse para cada grupo de tratamiento (p. ej., medias y desviación estándar o frecuencias), junto con un estadístico adecuado que compare los resultados en ambos grupos (p. ej., diferencia de medias, diferencia de proporciones, riesgo relativo, odds ratio, NNT, etc.) y su IC. Aunque los IC se determinan casi siempre para una confianza del 95%, pueden utilizarse otros niveles de confianza, pero deben haberse prefijado. Un error frecuente que debe evitarse es ofrecer los IC de los resultados en cada grupo en lugar de hacerlo para el estadístico que los compara. También puede ofrecerse el grado de significación (p) obtenido en una prueba estadística, pero además (no en lugar) del IC67,68.

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4

Es importante facilitar el IC de todos resultados, principales y secundarios, no limitándose a los que reflejan diferencias estadísticamente significativas. Con ello se evitará tres fenómenos indeseables: el sesgo de publicación69,70, la errónea pero frecuente tendencia a considerar equivalentes intervenciones que no han mostrado diferencias estadísticamente significativas en ensayos infradimensionados71,72, y la tendencia a evaluar la significación estadística olvidando la relevancia clínica73.

1VOUP"OgMJTJTBVYJMJBSFT Es inevitable que en un ECA convenga realizar más de un análisis inferencial. Sin embargo, la multiplicidad de estos análisis conlleva un elevado riesgo de resultados falsos positivos, por lo que conviene resistirse a la tentación de analizar demasiadas cosas, especialmente subgrupos de casos74,75, y concentrarse en las cuestiones realmente importantes y previstas en el protocolo o en el plan de análisis. Como ya se ha comentado en el punto anterior, es imprescindible informar acerca de todos los análisis realizados aunque puede ser innecesario ofrecer detalles de todos ellos.

1VOUP&WFOUPTBEWFSTPT Además del efecto pretendido, la mayoría de las intervenciones tienen efectos indeseados, y a veces indeseables. El equilibrio entre los beneficios y los riesgos es lo que debe juzgarse para decidir si una intervención es aceptable o útil. Por tanto, es imprescindible facilitar datos sobre los efectos indeseados. Al menos debe describirse la frecuencia de individuos que presentaron acontecimientos adversos (AA) serios (proporcionando una definición operacional de lo que se entiende por AA serio76), y de los que interrumpieron prematuramente el tratamiento (incluyendo los motivos). Cuando un AA se ha presentado en más de una ocasión en el mismo individuo, es útil describir también la frecuencia de los AA.

© Elsevier. Fotocopiar sin autorización es un delito.

1VOUP*OUFSQSFUBDJwO Se ha señalado que, en las publicaciones científicas, la discusión de los resultados suele esmerarse más en justificarlos que en poner de manifiesto posibles limitaciones de estudio77,78. Para evitar esta tendencia, algunas revistas aconsejan estructurar la discusión79,80 presentando: a) un breve resumen de los resultados clave, enfatizando lo que añaden al conocimiento previamente disponible; b) posibles mecanismos y explicaciones de los resultados; c) la comparación con otros trabajos similares, incluyendo un metaanálisis cuando sea posible; d) las limitaciones del presente estudio y los métodos adoptados para compensarlas; e) las implicaciones para futuras investigaciones, y f) las implicaciones clínicas.

1VOUP(FOFSBMJ[BDJwO La validez externa del estudio, esto es, la posibilidad de generalizar los resultados a conjuntos de individuos más amplios que los incluidos en el ensayo, de-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

pende de diversos factores. En primer lugar, de la validez interna, que es un requisito previo para la validez externa: los resultados de un estudio sesgado son inválidos y ya no procede cuestionarse si son generalizables. Los criterios de selección, que usualmente hacen referencia a la edad, al sexo, a la gravedad de la enfermedad, a la comorbilidad y a las comedicaciones, condicionan en gran medida la generalización a otros pacientes. Por ello es imprescindible plantearse seriamente la necesidad y la conveniencia de cada uno de ellos durante el diseño del ensayo, y no imponerlos a menos que exista un buen motivo, ya sea legal, ético o científico. La imitación de estudios previos no es per se un buen motivo. Además de los criterios de selección, muchos otros aspectos del ensayo determinarán también hasta qué punto pueden generalizarse sus resultados, como el ámbito en que se realizó el ensayo (atención primaria, pacientes hospitalizados, etc.), los métodos utilizados para diagnosticar la indicación del ensayo y para realizar el seguimiento, la intensidad del seguimiento, y la propia intervención o las condiciones en las que se administra. Posiblemente se evitarían limitaciones en la validez externa de los ensayos si durante su diseño se tuviera muy presente la diferencia entre ensayos explicativos y ensayos pragmáticos81,82, y se decidiera explícitamente el objetivo principal en estos términos. En cualquier caso, decidir si los resultados de un ensayo son aplicables a un paciente concreto es una tarea tan difícil como importante para la práctica clínica 83, sobre la que se han desarrollado guías84.

1VOUP&WJEFODJBHMPCBM Los resultados de un ensayo deben juzgarse en el contexto de la información previa disponible. Aunque lo ideal sería metaanalizar los resultados del ensayo junto con los de ensayos previos similares85, esto es poco práctico, muy costoso, y sólo factible si existen tales ensayos. El requisito mínimo es la discusión de los resultados del ensayo en el contexto de la evidencia disponible, sin limitarla a los estudios que obtuvieron resultados similares al presente.

#*#-*0(3"'Ê" 1.

2.

3. 4. 5. 6.

Schulz KF, Chalmers I, Hayes RJ, Altman DG. Empirical evidence of bias. Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA. 1995;273:408-12. Kjaergård L, Villumsen J, Gluud C. Quality of randomised clinical trials affects estimates of intervention efficacy [Abstract]. En: Abstracts for Workshops and Scientific Sessions, 7th International Cochrane Colloquium, Roma, Italia, 1999. Adetugbo K, Williams H. How well are randomized controlled trials reported in the dermatology literature? Arch Dermatol. 2000;136:381-5. Kjaergård LL, Nikolova D, Gluud C. Randomized clinical trials in HEPATOLOGY: predictors of quality. Hepatology. 1999;30:1134-8. DerSimonian R, Charette LJ, McPeek B, Mosteller F. Reporting on methods in clinical trials. N Engl J Med. 1982;306:1332-7. Moher D, Dulberg CS, Wells GA. Statistical power, sample size, and their reporting in randomized controlled trials. JAMA. 1994;272:122-4.

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4 7. 8.

9. 10. 11. 12. 13.

14.

15. 16.

17.

18. 19. 20.

21.

© Elsevier. Fotocopiar sin autorización es un delito.

22.

23.

24. 25. 26. 27.

Hollis S, Campbell F. What is meant by intention to treat analysis? Survey of published randomised controlled trials. BMJ. 1999;319:670-4. Schulz KF, Chalmers I, Grimes DA, Altman DG. Assessing the quality of randomization from reports of controlled trials published in obstetrics and gynecology journals. JAMA. 1994;272:125-8. Gore SM, Jones IG, Rytter EC. Misuse of statistical methods: Critical assessment of articles in BMJ from January to March 1976. Br Med J. 1977;1:85-7. Pocock SJ, Hughes MD, Lee RJ. Statistical problems in the reporting of clinical trials. A survey of three medical journals. N Engl J Med. 1987;317:426-32. Altman DG. The scandal of poor medical research [Editorial]. BMJ. 1994;308:283-4. The Standards of Reporting Trials Group. A proposal for structured reporting of randomized controlled trials. JAMA. 1994;272:1926-31. Working Group on Recommendations for Reporting of Clinical Trials in the Biomedical Literature. Call for comments on a proposal to improve reporting of clinical trials in the biomedical literature. Ann Intern Med. 1994;121:894-5. Begg C, Cho M, Eastwood S, Horton R, Moher D, Olkin I, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA. 1996;276:637-9. Campbell MK, Elbourne DR, Altman DG, for the CONSORT Group. CONSORT statement: Extension to cluster randomised trials. BMJ. 2004;328:702-8. Moher D, Altman DG, Schulz KF, Elbourne DR. Opportunities and challenges for improving the quality of reporting clinical research: CONSORT and beyond. CMAJ. 2004;171:349-50. Moher D, Jones A, Lepage L. Use of the CONSORT statement and quality of reports of randomized trials: A comparative before-and-after evaluation. The CONSORT Group. JAMA. 2001;285:1992-5. Egger M, Jüni P, Bartlett C. Value of flow diagrams in reports of randomized controlled trials. The CONSORT Group. JAMA. 2001;285:1996-9. Meinert CL. Beyond CONSORT: Need for improved reporting standards for clinical trials. Consolidated Standards of Reporting Trials. JAMA. 1998;279:1487-9. Moher D, Schulz KF, Altman DG. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel group randomized trials. The CONSORT Group. Ann Intern Med. 2001;134:657-62. Moher D, Schulz KF, Altman DG. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel group randomized trials. The CONSORT Group. JAMA. 2001;285:1987-91. Moher D, Schulz KF, Altman DG. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel group randomised trials. The CONSORT Group. Lancet. 2001;357:1191-4. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Ann Intern Med. 2001;134:663-94. Dickersin K, Scherer R, Lefebvre C. Identifying relevant studies for systematic reviews. BMJ. 1994;309:1286-91. World Medical Association declaration of Helsinki. Recommendations guiding physicians in biomedical research involving human subjects. JAMA. 1997;277:925-6. Lau J, Antman EM, Jimenez-Silva J, Kupelnick B, Mosteller F, Chalmers TC. Cumulative metaanalysis of therapeutic trials for myocardial infarction. N Engl J Med. 1992;327:248-54. Fuks A, Weijer C, Freedman B, Shapiro S, Skrutkowska M, Riaz A. A study in contrasts: Eligibility criteria in a twenty-year sample of NSABP and POG clinical trials. National Surgical Adjuvant Breast and Bowel Program. Pediatric Oncology Group. J Clin Epidemiol. 1998;51:69-79.

28. 29. 30.

31. 32. 33. 34. 35. 36. 37. 38. 39. 40.

41. 42.

43. 44.

45.

46. 47.

48. 49. 50. 51. 52. 53.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM Roberts C. The implications of variation in outcome between health professionals for the design and analysis of randomized controlled trials. Stat Med. 1999;18:2605-15. McDowell I, Newell C. Measuring health: A guide to rating scales and questionnaires. 2nd ed. Nueva York: Oxford University Press; 1996. Marshall M, Lockwood A, Bradley C, Adams C, Joy C, Fenton M. Unpublished rating scales: A major source of bias in randomised controlled trials of treatments for schizophrenia. Br J Psychiatry. 2000;176:249-52. Sanders C, Egger M, Donovan J, Tallon D, Frankel S. Reporting on quality of life in randomised controlled trials: Bibliographic study. BMJ. 1998;317:1191-4. Goodman SN, Berlin JA. The use of predicted confidence intervals when planning experiments and the misuse of power when interpreting results. Ann Intern Med. 1994;121:200-6. Geller NL, Pocock SJ. Interim analyses in randomized clinical trials: Ramifications and guidelines for practitioners. Biometrics. 1987;43:213-23. Pocock SJ. When to stop a clinical trial. BMJ. 1992;305:235-40. Berry DA. Interim analyses in clinical trials: Classical vs. Bayesian approaches. Stat Med. 1985;4:521-6. Treasure T, MacRae KD. Minimisation: The platinum standard for trials? Randomisation doesn’t guarantee similarity of groups; minimisation does [Editorial]. BMJ. 1998;317:362-3. Martyn C. Not quite as random as I pretended. BMJ. 1996;347:70. Williams DH, Davis CE. Reporting of assignment methods in clinical trials. Control Clin Trials. 1994;15:294-8. Schulz KF. Subverting randomization in controlled trials. JAMA. 1995;274:1456-8. Chalmers TC, Levin H, Sacks HS, Reitman D, Berrier J, Nagalingam R. Meta-analysis of clinical trials as a scientific discipline. I: Control of bias and comparison with large cooperative trials. Stat Med. 1987;6:315-28. Haag U. Technologies for automating randomized treatment assignment in clinical trials. Drug Information Journal. 1998;32:11. Noseworthy JH, Ebers GC, Vandervoort MK, Farquhar RE, Yetisir E, Roberts R. The impact of blinding on the results of a randomized, placebo-controlled multiple sclerosis clinical trial. Neurology. 1994;44:16-20. Gøtzsche PC. Blinding during data analysis and writing of manuscripts. Control Clin Trials. 1996;17:285-90; discussion 290-3. Devereaux PJ, Manns BJ, Ghali WA, Quan H, Lacchetti C, Guyatt GH. Physician interpretations and textbook definitions of blinding terminology in randomized controlled trials. JAMA. 2001;285:2000-3. Prasad AS, Fitzgerald JT, Bao B, Beck FW, Chandrasekar PH. Duration of symptoms and plasma cytokine levels in patients with the common cold treated with zinc acetate. A randomized, double-blind, placebo-controlled trial. Ann Intern Med. 2000;133:245-52. Quitkin FM, Rabkin JG, Gerald J, Davis JM, Klein DF. Validity of clinical trials of antidepressants. Am J Psychiatry. 2000;157:327-37. Altman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines for contributors to medical journals. En: Altman DG, Machin D, Bryant TN, Gardner MJ, eds. Statistics with confidence: Confidence intervals and statistical guidelines. 2.ª ed. Londres: BMJ Books; 2000. p. 171-90. Altman DG, Bland JM. Statistics notes. Units of analysis. BMJ. 1997;314:1874. Bolton S. Independence and statistical inference in clinical trial designs: A tutorial review. J Clin Pharmacol. 1998;38:408-12. Greenland S. Principles of multilevel modelling. Int J Epidemiol. 2000;29:158-67. Kerry SM, Bland JM. Analysis of a trial randomised by clusters. BMJ. 1998;316:54. Assmann SF, Pocock SJ, Enos LE, Kasten LE. Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet. 2000;355:1064-9. Altman DG. Adjustment for covariate imbalance. En: Armitage P, Colton T, eds. Encyclopedia of Biostatistics. Chichester, Reino Unido: John Wiley; 1998. p. 1000-5.

& / 4 ": 0 4 $ - Ê / * $ 0 4 " - & "5 0 3 * ; " % 0 4 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70.

71.

© Elsevier. Fotocopiar sin autorización es un delito.

72.

73. 74. 75. 76. 77. 78. 79.

Matthews JN, Altman DG. Statistics notes. Interaction 2: Compare effect sizes not P values. BMJ. 1996;313:808. Altman DG. Randomisation [Editorial]. BMJ. 1991;302:1481-2. Sackett DL, Gent M. Controversy in counting and attributing events in clinical trials. N Engl J Med. 1979;301:1410-2. May GS, DeMets DL, Friedman LM, Furberg C, Passamani E. The randomized clinical trial: Bias in analysis. Circulation. 1981;64:669-73. Altman DG, Dore CJ. Randomisation and baseline comparisons in clinical trials. Lancet. 1990;335:149-53. Senn S. Base logic: Tests of baseline balance in randomized clinical trials. Clinical Research and Regulatory Affairs. 1995;12:171-82. Lee YJ, Ellenberg JH, Hirtz DG, Nelson KB. Analysis of clinical trials by treatment actually received: Is it really an option? Stat Med. 1991;10:1595-605. Lachin JL. Statistical considerations in the intent-to-treat principle. Control Clin Trials. 2000;21:526. Nagelkerke N, Fidler V, Bernsen R, Borgdorff M. Estimating treatment effects in randomized clinical trials in the presence of non-compliance. Stat Med. 2000;19:1849-64. ICH E9. Statistical principles for clinical trials, february 1998. Disponible en: http:// www.ich.org [acceso: 20/07/05]. Chadwich D. Monotherapy comparative trials: Equivalence and differences in clinical trials. Epilepsy Res. 2001;45:101-3. Jones B, Jarvis P, Lewis JA, Ebbutt AF. Trials to assess equivalence: The importance of rigorous methods. BMJ. 1996;313:36-9. Brittain E, Lin D. A comparison of intent-to-treat and per-protocol results in antibiotic non-inferiority trials. Stat Med. 2005;24:1-10. Gardner MJ, Altman DG. Confidence intervals rather than P values: Estimation rather than hypothesis testing. Br Med J (Clin Res Ed). 1986;292:746-50. International Committee of Medical Journal Editors. Uniform requirements for manuscripts submitted to biomedical journals. Ann Intern Med. 1997;126:36-47. Hutton JL, Williamson PR. Bias in meta-analysis due to outcome variable selection within studies. Applied Statistics. 2000;49:359-70. Hahn S, Williamson PR, Hutton JL, Garner P, Flynn EV. Assessing the potential for bias in meta-analysis due to selective reporting of subgroup analyses within studies. Stat Med. 2000;19:3325-36. Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ. 1995;311:485. Freiman JA, Chalmers TC, Smith H Jr, Kuebler RR. The importance of beta, the type II error and sample size in the design and interpretation of the randomized control trial. Survey of 71 «negative» trials. N Engl J Med. 1978;299:690-4. Luus HG, Muller FO, Meyer BH. Statistical significance versus clinical relevance. Part II. The use and interpretation of confidence intervals. S Afr Med J. 1989;76:626-9. Assmann SF, Pocock SJ, Enos LE, Kasten LE. Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet. 2000;355:1064-9. Oxman AD, Guyatt GH. A consumer’s guide to subgroup analyses. Ann Intern Med. 1992;116:78-84. Ioannidis JP, Lan J. Completeness of safety reporting in randomized trials. An evaluation of 7 medical areas. JAMA. 2001;285:437-43. Horton R. The rhetoric of research. BMJ. 1995;310:985-7. Purcell GP, Donovan SL, Davidoff F. Changes to manuscripts during the editorial process: Characterizing the evolution of a clinical paper. JAMA. 1998;280:227-8. Docherty M, Smith R. The case for structuring the discussion of scientific papers [Editorial]. BMJ. 1999;318:1224-5.

80. 81. 82. 83. 84.

85.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM Annals of Internal Medicine. Information for authors. Disponible en: http://www.annals. org [acceso: 22/07/05]. Schwartz D, Flamant R, Lellouch J. L’essai thérapeutique chez l’homme. París: Flammarion Médecine-Sciences; 1970. Roland M, Torgerson DJ. Understanding controlled trials: What are pragmatic trials? BMJ. 1998;316:285. Davey Smith G, Egger M. Who benefits from medical interventions? [Editorial] BMJ. 1994;308:72-4. Dans AL, Dans LF, Guyatt GH, Richardson S. Users’ guides to the medical literature: XIV. How to decide on the applicability of clinical trial results to your patient. Evidence-Based Medicine Working Group. JAMA. 1998;279:545-9. Gøtzsche PC, Gjørup I, Bonne´n H, Brahe NE, Becker U, Burcharth F. Somatostatin vs. placebo in bleeding oesophageal varices: Randomised trial and meta-analysis. BMJ. 1995;310:1495-8.

&OTBZPTEFFRVJWBMFODJB ZOPJOGFSJPSJEBE

© Elsevier. Fotocopiar sin autorización es un delito.

++JNnOF[Z+."SHJNPO

El ensayo clínico aleatorizado (ECA) es el diseño que proporciona las evidencias de mejor calidad acerca de la eficacia de una intervención sanitaria. Habitualmente se realiza con la finalidad de evaluar si un nuevo tratamiento es más eficaz que otra alternativa, ya sea ésta placebo u otro tratamiento activo, por lo que se denominan estudios de superioridad. Los requisitos metodológicos de este tipo de estudios (asignación aleatoria, ciego, análisis por intención de tratar, etc.) son bien conocidos por la mayoría de profesionales, y la forma en que deben ser comunicados en un artículo se ha comentado en el capítulo anterior. En muchas ocasiones, cuando en un ECA se obtiene un resultado estadísticamente no significativo, los autores pretenden concluir que los tratamientos comparados son equivalentes. Sin embargo, esta conclusión puede ser errónea1,2, y debe distinguirse entre un estudio que pretende demostrar la superioridad de un tratamiento con relación a otro, pero que no lo consigue (estudio «negativo»), y otro que está específicamente diseñado para demostrar la equivalencia entre dos intervenciones y lo consigue. De hecho, los ensayos de no inferioridad, cuya finalidad es evaluar si puede considerarse que un tratamiento no es inferior a otro ya existente para la misma enfermedad, y los ensayos de equivalencia, que buscan determinar si ambos tratamientos pueden considerarse equivalentes, presentan ciertas diferencias metodológicas en su diseño y en el análisis de sus resultados, no tan conocidas por la mayoría de profesionales, que hacen que la conclusión de equivalencia a partir de un resultado estadísticamente no significativo obtenido en un estudio de superioridad no pueda considerarse adecuada. Greene et al.3 identificaron 88 artículos originales publicados en inglés entre 1992 y 1996, indexados en Medline, que supuestamente evaluaban la equivalencia entre tratamientos, y observaron que sólo 19 de ellos (22%) cumplían los criterios metodológicos básicos relacionados con la equivalencia, poniendo en evidencia las importantes deficiencias existentes en la realización de este tipo de estudios. Posteriormente, Le Henanff et al. 4 evaluaron 162 artículos que presentaban 116 estudios de no inferioridad y 46 de equivalencia publicados en los años 2003 y 2004 e incluidos en las bases de datos Medline y Co-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

chrane Central Register of Controlled Trials, y encontraron resultados similares: sólo 33 artículos (20,3%) cumplían los requisitos específicos de publicación de este tipo de estudios, y, además, en cuatro de ellos, los autores concluían equivocadamente a favor de la no inferioridad o la equivalencia, a pesar de que los resultados no eran concluyentes. Esta falta de rigor metodológico en la realización y publicación de estos estudios comporta importantes riesgos para los pacientes, ya que tratamientos clínicamente inferiores pueden ser erróneamente considerados similares en eficacia a uno estándar, e incluso tratamientos potencialmente superiores pueden ser considerados simplemente equivalentes. Por este motivo, es importante conocer las principales características de este tipo de estudios y asegurar que se informan adecuadamente en los artículos, de forma que se eviten los riesgos de la mala interpretación y aplicación de sus resultados por los lectores5-7.

"41&$5045&3.*/0-Î(*$04 En los estudios de equivalencia, el objetivo principal es determinar si dos tratamientos pueden considerarse terapéuticamente equivalentes; es decir, que las respuestas a ambos difieren por una magnitud que carece de importancia clínica. Desde un punto de vista estadístico, es imposible demostrar la equivalencia completa, es decir, que la diferencia en las respuestas es cero. Por esta razón, en estos estudios se establece un margen de equivalencia (delta, Δ), que corresponde a la máxima diferencia que puede aceptarse entre dos tratamientos para poder considerarlos equivalentes desde el punto de vista clínico; de manera que, si la diferencia entre ellos sobrepasa este límite en cualquier dirección, puede decirse que no son equivalentes. En los estudios de no inferioridad, el objetivo principal es determinar si la respuesta al tratamiento que se investiga no es clínicamente inferior al usado como comparador; en otras palabras, se pretende demostrar que no es peor. Teniendo en cuenta que la demostración de la ausencia de toda diferencia entre dos tratamientos no es posible, y dado que el tratamiento en estudio ofrece alguna ventaja adicional con relación al comparador, puede aceptarse que su eficacia sea ligeramente menor. Por ello, en el diseño de estos estudios, los investigadores deben definir a priori la máxima diferencia que se puede aceptar entre los tratamientos para considerar que el que está en estudio no es inferior al de referencia, denominada margen de no inferioridad (delta, Δ). Los estudios de equivalencia y de no inferioridad son metodológicamente muy similares, con la diferencia de que se concluye equivalencia cuando la diferencia entre los tratamientos se encuentra entre – Δ y Δ; mientras que, en los estudios de no inferioridad, la cuestión no es simétrica y solamente interesa descartar una de las direcciones de la comparación, por lo que se concluirá a favor del nuevo tratamiento si es similar o mejor que el comparador, pero no si es peor. Aunque la mayoría de estudios que abordan preguntas de este tipo corresponden a ensayos de no inferioridad, dado que el margen que se define para decidir que el nuevo fármaco no es peor se corresponde habitualmente con el límite de equivalencia, ambos enfoques comparten características metodológi-

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

cas. Por ello, aunque en este capítulo se comentan principalmente los aspectos relacionados con la comunicación de los estudios de no inferioridad, los conceptos son aplicables también a los de equivalencia.

.05*7041"3"-"3&"-*;"$*Î/ %&&45&5*10%&&456%*04 El número de ensayos de no inferioridad y de equivalencia que se publican en la literatura biomédica está aumentando rápidamente. Su realización responde a diferentes motivos. Los estudios de no inferioridad tienen interés cuando un nuevo fármaco ofrece ventajas adicionales con relación al tratamiento estándar, como, por ejemplo: un menor número de efectos adversos, una administración más cómoda que facilite el cumplimiento de los pacientes o un coste inferior, o simplemente porque representa una nueva alternativa terapéutica. Dado el gran número y abanico de medicamentos eficaces disponibles actualmente, cada vez más los nuevos fármacos se desarrollan para indicaciones en las que la comparación con placebo no sería ética. En estas situaciones se recomienda el uso de un comparador activo. Si se desea demostrar la superioridad del nuevo fármaco, la situación es similar a la comparación con placebo. Pero si lo que se desea es demostrar que su eficacia no es menor que la del estándar, se trata de estudios de no inferioridad. También es frecuente la realización de ensayos de no inferioridad en el desarrollo de los llamados fármacos me-too, que simplemente pretenden competir con otros ya disponibles y compartir el mercado, sin ofrecer ninguna ventaja sustancial. Sin embargo, esta finalidad ha sido ampliamente criticada8.

© Elsevier. Fotocopiar sin autorización es un delito.

"41&$504.&50%0-Î(*$04 Los estudios de no inferioridad y de equivalencia a menudo presentan importantes deficiencias en la forma en que han sido diseñados y ejecutados: a) con frecuencia se han realizado con un número de pacientes relativamente reducido, a pesar de que requieren un tamaño de la muestra más elevado que los ensayos de superioridad; b) suelen presentar sesgos que tienden a dirigir la conclusión hacia la equivalencia, aunque sus estándares metodológicos son especialmente rigurosos; c) suelen manejar incorrectamente la inclusión y exclusión de sujetos del análisis, y d) suelen aplicar pruebas estadísticas de contraste de hipótesis al analizar e interpretar los datos, a pesar de que pueden conducir a conclusiones erróneas. A continuación, se comentan los principales aspectos metodológicos diferenciales de estos estudios con relación a los de superioridad5-7,9,10.

)JQwUFTJT En los estudios de superioridad, la hipótesis nula que se contrasta es la de que los tratamientos tienen la misma eficacia, mientras que la hipótesis alternativa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

es que existe una diferencia en su eficacia. Aunque esta hipótesis alternativa no se contrasta directamente, se acepta cuando se observa una diferencia estadísticamente significativa. En esta situación, el valor de p cuantifica el riesgo de cometer un error tipo I, es decir, de concluir que existe una diferencia cuando en realidad no existe. Sin embargo, una evidencia insuficiente para rechazar la hipótesis nula no proporciona la evidencia suficiente para aceptarla, de manera que un resultado estadísticamente no significativo no debe interpretarse como indicativo de la ausencia de diferencia1,2. Así, se comete un error tipo II cuando se concluye que no existe una diferencia, cuando en realidad sí existe. En los estudios de no inferioridad y de equivalencia, las hipótesis tienen un significado diferente. En el caso de los ensayos de equivalencia, la hipótesis nula es que la respuesta al tratamiento que se investiga es mejor o peor, en una determinada magnitud, que la respuesta al tratamiento estándar, de manera que se han invertido las hipótesis nula y alternativa con relación a los ensayos de superioridad. Dado que la hipótesis nula establece que la diferencia es mayor que o menor que − Δ, la hipótesis alternativa es que la diferencia entre ambos tratamientos se sitúa en el rango entre – Δ y Δ. Por ello, el análisis de estos estudios se basa en los intervalos de confianza, de manera que si éste queda enteramente entre los límites − Δ y Δ, puede concluirse equivalencia9. El caso de los ensayos de no inferioridad es similar al de los de equivalencia, pero se permite la posibilidad de que el tratamiento en estudio sea superior al estándar, aunque, antes de evaluar esta superioridad, debe haberse establecido la no inferioridad9.

%JTFvP Un aspecto clave en el diseño de los estudios de no inferioridad y equivalencia es la elección del comparador, que debe justificarse cuidadosamente y comprobando que su eficacia ha sido suficientemente establecida en estudios previos5,6,11. Si existen dudas acerca de dicha eficacia, algunos autores sugieren que puede ser adecuado utilizar una tercera rama placebo, ya que el hecho de que dos tratamientos sean equivalentes no significa necesariamente que sean eficaces. Por ello, el estudio debe diseñarse y ejecutarse de manera que se asemeje lo más posible a los métodos utilizados en los estudios previos que han demostrado la eficacia del comparador, ya que muestra que los métodos han sido validados en un contexto similar (criterios de selección, dosificación, tratamientos e intervenciones concomitantes, variable de respuesta, mediciones, etc.). Es fundamental que estos estudios se diseñen de manera que tengan la sensibilidad suficiente para detectar una diferencia entre los tratamientos que se comparan. En los estudios de superioridad, para calcular el tamaño de la muestra se decide cuál es la mínima diferencia clínicamente relevante que se desea detectar, definida ésta como la diferencia entre los resultados que induciría a adoptar la mejor de las dos terapias. En cambio, en los estudios de no inferioridad debe definirse el margen Δ que se puede aceptar entre ambos tratamientos para considerar que el fármaco en estudio no es inferior al comparador, mientras que en los de equivalencia se define la máxima diferencia Δ, o margen de

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

equivalencia, que se puede aceptar entre ambos tratamientos para considerar que son terapéuticamente equivalentes. El procedimiento que se sigue es el de utilizar este valor como la diferencia máxima que se desea detectar en el cálculo del número de sujetos 12. De esta forma, si la diferencia real es igual o mayor, el estudio tiene las suficientes garantías (potencia estadística) para detectarla y descartar la no inferioridad del nuevo tratamiento. Por consiguiente, uno de los aspectos clave de este tipo de estudios es, precisamente, establecer el margen de no inferioridad, o de equivalencia, que corresponde a la máxima diferencia entre ambos tratamientos que se considera clínicamente aceptable por su escasa relevancia clínica. Dado que este valor suele ser de una magnitud inferior a la mínima diferencia de relevancia clínica que se utiliza en los estudios de superioridad, el tamaño de muestra requerido en estos estudios es sensiblemente mayor que el necesario para demostrar la superioridad de un nuevo tratamiento6.

© Elsevier. Fotocopiar sin autorización es un delito.

&TUSBUFHJBEFBOgMJTJT Durante la realización de un ensayo clínico, algunos sujetos presentan situaciones, como, por ejemplo, el incumplimiento de la medicación que les había sido asignada, que pueden plantear dudas acerca de cómo deben tenerse en cuenta en el análisis. Aunque puede parecer lógico no incluirlos dado que no han recibido la intervención asignada, su exclusión puede sesgar los resultados. Los motivos por los que no han tomado la medicación suelen estar relacionados con el pronóstico, de manera que su exclusión del análisis supone una grave amenaza a la comparabilidad que se había conseguido con la asignación aleatoria. La estrategia de análisis denominada «por intención de tratar» supone analizar a los sujetos en el grupo al que han sido asignados, independientemente de qué tratamiento hayan recibido en realidad. Por ello, se conoce también como análisis según asignación aleatoria, y es uno de los principales requisitos de validez interna exigidos por la mayoría de las guías de lectura crítica de un ensayo clínico. Dado que la asignación conduce a la formación de grupos comparables, la posterior exclusión o cambio de grupo de algunos sujetos puede comprometer dicha comparabilidad, por lo que es importante prevenir que se produzcan este tipo de desviaciones del protocolo. Además de mantener la lógica de la asignación aleatoria, la estrategia de análisis por intención de tratar hace más difícil encontrar diferencias entre los grupos. En un estudio de superioridad, la mayoría de problemas que pueden presentarse, como las pérdidas de seguimiento o las desviaciones del protocolo, tienden a diluir las diferencias entre los tratamientos, de manera que, si a pesar de ello se observa una diferencia entre ellos, la conclusión queda «validada». Pero si el objetivo es demostrar la no inferioridad de un nuevo tratamiento, estos problemas, al diluir las diferencias, pueden llevar a una conclusión errónea favorable a la hipótesis de equivalencia o no inferioridad. Por ello, dado que la existencia de pérdidas y abandonos tiende a diluir el efecto del tratamiento, en los estudios de no inferioridad y equivalencia hay que ser todavía más estricto en la ejecución del estudio que en los de superioridad para evitar que se produzcan, ya que su impacto puede ser favorable a la hipótesis de trabajo.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Por consiguiente, la estrategia de análisis de los estudios de no inferioridad tiene algunos aspectos diferentes de los estudios de superioridad. En estos últimos, la estrategia de análisis por intención de tratar es la más conservadora, ya que la inclusión en el análisis de los sujetos que no han cumplido el protocolo tiende a hacer más similares los resultados de ambos grupos13, por lo que es la que más protege frente a la conclusión errónea de que un nuevo tratamiento es mejor que el de comparación, de manera que esta estrategia de análisis se considera la más adecuada para el análisis de los resultados de un ensayo de superioridad. Sin embargo, en los estudios de no inferioridad y equivalencia, de lo que se trata es precisamente de evitar cualquier influencia que pueda hacer que los grupos parezcan más similares de lo que son en realidad, por lo que la estrategia de análisis por intención de tratar, al favorecer llegar a conclusiones de equivalencia, no es la más conservadora en estas situaciones. Aunque la estrategia de análisis por protocolo tiende precisamente a resaltar cualquier diferencia entre los grupos, más que a disminuirla, no puede decirse que en estos estudios sea la estrategia más adecuada, ya que no está claro el sesgo que puede introducir y no permite distinguir entre los efectos del tratamiento y el sesgo debido a las diferencias en el pronóstico de los sujetos. Probablemente, lo más correcto es realizar ambos tipos de análisis (por intención de tratar y por protocolo): si coinciden razonablemente en los resultados, la conclusión será más consistente; pero si difieren de forma sustancial, probablemente será difícil obtener una conclusión convincente14. Así pues, la valoración de los ensayos de equivalencia y de no inferioridad no puede hacerse con los mismos criterios que la de los de superioridad. En los análisis de subgrupos deben aplicarse las mismas precauciones que en los estudios de superioridad. Los análisis intermedios en los estudios de no inferioridad presentan algunas particularidades. Si la no inferioridad se establece antes de que el estudio finalice, puede que no exista el requerimiento ético de parar el estudio debido a la falta de eficacia10. Sin embargo, otras ventajas (como el coste o los efectos adversos) pueden justificar la paralización del estudio, con el fin de poder disponer del nuevo tratamiento. Si un tratamiento es claramente inferior, entonces la paralización del estudio está plenamente justificada15.

*OUFSWBMPTEFDPOGJBO[B Como se ha comentado anteriormente, para evaluar la no inferioridad o la equivalencia entre dos tratamientos, los valores de significación estadística tienen poco interés, ya que un resultado no estadísticamente significativo no implica que los tratamientos sean equivalentes1,2,16; mientras que, por el contrario, una diferencia estadísticamente significativa pero de escasa magnitud puede ser compatible con la equivalencia clínica de ambos tratamientos. El análisis de estos estudios se basa en el uso del intervalo de confianza (IC) de la diferencia en la respuesta observada con las intervenciones que se comparan. La interpretación del resultado de un ensayo clínico de no inferioridad depende de si el efecto observado se encuentra entre el margen de no inferioridad y el valor de que indica la ausencia de efecto. En los estudios de equiva-

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

lencia, la interpretación es análoga, pero deben considerarse los dos márgenes – Δ y Δ: si todo el IC se sitúa dentro del rango de equivalencia, puede concluirse que las intervenciones son equivalentes. En el resto de situaciones, los resultados del estudio no son concluyentes17. La mayor utilidad del IC sobre el valor de p en la interpretación de los resultados de un ensayo clínico se ilustra en la figura 10-1, en la que se representan los posibles resultados de 12 ECA. Cuando el objetivo del ensayo es determinar la superioridad de un nuevo tratamiento con relación a un estándar, no se trata simplemente de demostrar que existe una diferencia estadísticamente significativa entre ambos, sino de que ésta es de la magnitud suficiente como para concluir que el nuevo tratamiento es clínicamente superior al estándar. Para ello, debe fijarse a priori la magnitud de la mínima diferencia de relevancia clínica necesaria para poder llegar a dicha conclusión, y evaluar los resultados obtenidos en consonancia con este criterio. Si la conclusión de cada ensayo mostrado en la figura 10-1 se basara exclusivamente en la significación estadística, cuatro estudios se considerarían «negativos» al no obtener una diferencia estadísticamente significativa (ensayos B, E, G y H), mientras que cinco serían positivos a favor del tratamiento (ensayos F, I, J, K y L) y tres lo serían en contra (ensayos A, C y D). En cambio, la valoración del IC permite obtener una conclusión que tome en consideración la magnitud de la diferencia observada y la precisión con que se ha estimado. De este modo, si se fijara a priori la magnitud de la mínima diferencia de relevancia clínica para considerar que el nuevo tratamiento es superior al estándar en el valor RC, entonces solamente el ensayo L sería concluyente a favor del mismo, ya que todo el IC queda por encima de dicho valor, mientras que los resultados de los ensayos H, J y K no lo serían

Margen de equivalencia

RC Mínima diferencia de relevancia clínica

A B C D E © Elsevier. Fotocopiar sin autorización es un delito.

F G H I J K L

-

0 EQUIVALENCIA

RC SUPERIORIDAD

NO INFERIORIDAD

Figura 10-1. Resultados de 12 ensayos clínicos hipotéticos.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

totalmente (valores superiores a RC son posibles), mientras que el resto de ensayos descartarían la superioridad del nuevo tratamiento ya que sus IC quedan por debajo del valor RC. Cuando el objetivo del ensayo es determinar la equivalencia entre ambos tratamientos, la situación es muy diferente. La equivalencia absoluta no puede demostrarse completamente, ya que cuando un estudio no encuentra una diferencia estadísticamente significativa entre dos tratamientos, puede deberse tanto a que ambos tengan una eficacia similar como a la incapacidad del estudio para detectar una diferencia entre ellos. Uno de los aspectos clave del diseño de este tipo de estudios es establecer el margen de equivalencia, y suele exigirse que sea inferior al valor RC de los estudios de superioridad. Si los ensayos presentados en la figura 10-1 se hubieran planteado como estudios de equivalencia, solamente tres estudios (ensayos D, E y F) podrían concluir la equivalencia de ambas intervenciones, ya que todo el IC queda incluido dentro del área definida por los límites ± Δ, indicando que estaríamos razonablemente convencidos de que la diferencia real entre los tratamientos se encuentra dentro de estos límites. Los ensayos A, K y L demostrarían la no equivalencia de las intervenciones (en A, por la inferioridad del nuevo tratamiento, y en K y L, por su superioridad), mientras que en el resto de ensayos los resultados no serían concluyentes. Cuando el objetivo del ensayo es determinar la no inferioridad del nuevo tratamiento con relación al estándar, la situación es similar a la de los estudios de equivalencia, con la diferencia de que solamente se toma en consideración el margen de no inferioridad (− Δ), de manera que únicamente los casos en que todo el IC queda por encima de dicho valor pueden concluir la no inferioridad. Si los ensayos de la figura 10-1 se hubieran planteado con este objetivo, todos ellos podrían concluir no inferioridad excepto el ensayo A, que concluiría inferioridad, y los ensayos B y C, que no podrían descartarla.

&WBMVBDJwOEFMBTVQFSJPSJEBEZMBOPJOGFSJPSJEBEFOVONJTNPFTUVEJP Cuando un ensayo clínico diseñado para evaluar la no inferioridad de un nuevo tratamiento concluye no inferioridad, puede plantearse la evaluación de la superioridad siempre que se cumplan algunos requisitos, como la aplicación de pruebas estadísticas específicas, la realización del análisis según la estrategia por intención de tratar o que, al interpretar los resultados, se tenga en cuenta la definición de la mínima diferencia de relevancia clínica (que debería haberse establecido a priori y especificado en el protocolo del estudio), y no basarse simplemente en la significación estadística18. Una situación distinta es la de un estudio de superioridad en el que no se confirma esta hipótesis. Si en el diseño del estudio sólo se contempló la hipótesis de superioridad, no es aceptable extraer la conclusión de no inferioridad simplemente porque no se ha podido demostrar la existencia de una diferencia estadísticamente significativa entre los tratamientos. Sólo podría obtenerse esta conclusión si la hipótesis de no inferioridad se hubiera planteado a priori y se hubiera fijado previamente el margen de no inferioridad, diseñando y ejecutando el estudio según los requisitos metodológicos más estrictos de los estu-

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

dios de equivalencia y no inferioridad (en cuanto al tamaño de la muestra, tratamiento de las pérdidas, etc.). Hay que tener en cuenta, además, que debería realizarse el análisis según las estrategias por intención de tratar y por protocolo18.

3&$0.&/%"$*0/&4%&-(3610$0/4035 Las diferencias metodológicas de un estudio de no inferioridad o de equivalencia respecto a uno de superioridad, comentadas anteriormente, deben reflejarse en el manuscrito, en el que debería presentarse información que permitiera la comparación de los criterios de inclusión y exclusión con los de los estudios previos que establecieron la eficacia del tratamiento de referencia, un diagrama con el flujo de los pacientes a lo largo del estudio, la justificación de la definición del margen de equivalencia, con referencias a la mínima diferencia clínicamente importante y a la eficacia establecida del estándar, el número mínimo de eventos requerido y la comparación de las tasas de respuesta del grupo control con las de los estudios previos en que se estableció su eficacia frente a placebo9. El grupo CONSORT19 ha elaborado unas directrices específicas para este tipo de artículos, que suponen una extensión de las recomendaciones para los ensayos clínicos en paralelo de superioridad (disponible en: www.consort-statement.org), cuyos elementos diferenciales se muestran en la tabla 10-1. En primer lugar, en el título del estudio debe constar explícitamente que se trata de un estudio de no inferioridad o de uno que trata de establecer la equiTabla 10-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico aleatorizado de no inferioridad o equivalencia

Título y resumen

Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos clínicos de no inferioridad

1

Cómo se asignaron los pacientes a las intervenciones (p. ej., «asignación aleatoria» o «aleatorizado»)

Especificar que se trata de un ensayo clínico de no inferioridad o de equivalencia

2

Antecedentes científicos y razón de ser del estudio

Incluir los motivos para usar un ensayo clínico de no inferioridad o de equivalencia

3

Criterios de selección de pacientes y ámbito y lugares en que se recogieron los datos

Especificar si los participantes son similares a los incluidos en los ensayos clínicos que establecieron la eficacia de los tratamientos y el emplazamiento donde se recogieron los datos

Introducción © Elsevier. Fotocopiar sin autorización es un delito.

Antecedentes

Métodos Participantes

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 10-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico aleatorizado de no inferioridad o equivalencia (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos clínicos de no inferioridad

Intervenciones

4

Detalles precisos de las intervenciones pretendidas para cada grupo y cómo y cuándo fueron efectivamente administradas

Detallar si el comparador es idéntico o muy similar a los usados en los ensayos clínicos que establecieron la eficacia de los tratamientos

Objetivos

5

Objetivos e hipótesis específicos

Incluir las hipótesis referentes a la no inferioridad o equivalencia

Resultados

6

Definición clara de las medidas de los resultados principal y secundarios y, cuando proceda, de cualquier método utilizado para mejorar la calidad de las medidas (p. ej., observaciones múltiples, entrenamiento de evaluadores)

Detallar si las variables de resultado en los estudios de no inferioridad o equivalencia son idénticas o muy similares a las usadas en los ensayos clínicos que establecieron la eficacia de los tratamientos

Tamaño muestral

7

Cómo se determinó el tamaño muestral y, cuando proceda, explicación de cualquier análisis intermedio y reglas de interrupción del ensayo

Detallar si se ha usado un margen de no inferioridad o de equivalencia en el cálculo justificando su elección

Generación de la secuencia

8

Método utilizado para generar la secuencia de asignación aleatoria, incluyendo detalle sobre cualquier restricción (p. ej., bloques, estratificación)

Asignación oculta

9

Método utilizado para implementar la secuencia de asignación aleatoria (p. ej., contenedores de medicación numerados, aleatorización centralizada por teléfono), clarificando si la secuencia se mantuvo oculta hasta el momento de la asignación

Implementación

10

Quién generó la secuencia de asignación, quién incluyó a los participantes y quién los asignó a los grupos

Ciego (enmascaramiento)

11

Si los participantes, quienes administraron las intervenciones o quienes evaluaron los resultados conocían o no la intervención asignada. Si no, cómo se evaluó el éxito del enmascaramiento

Aleatorización

Clarificar si la secuencia era desconocida hasta que se asignaron las intervenciones

Continúa

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

Tabla 10-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico aleatorizado de no inferioridad o equivalencia (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos clínicos de no inferioridad

12

Métodos estadísticos empleados para comparar los grupos en cuanto al resultado principal; métodos utilizados en análisis adicionales, como análisis de subgrupos o análisis ajustados

Especificar si los intervalos de confianza se calcularon usando una o dos colas

Flujo de participantes

13

Flujo de participantes a través de cada estadio (se recomienda un diagrama). Específicamente, para cada grupo, documentar los números de participantes asignados aleatoriamente, que recibieron el tratamiento pretendido, que completaron el protocolo del estudio y que fueron incluidos en el análisis del resultado principal. Describir las desviaciones del protocolo planificado, y los motivos

Reclutamiento

14

Fechas que limitan los períodos de reclutamiento y de seguimiento

Datos basales

15

Características demográficas y clínicas basales en cada grupo

Números analizados

16

Número de participantes (denominador) de cada grupo incluidos en cada análisis, y si el análisis se realizó «por intención de tratar». Expresar los resultados mediante números absolutos cuando sea factible (p. ej., «10/20» en lugar de «50%»)

Describir si se analizaron los datos siguiendo la estrategia de intención de tratar o según protocolo

Resultados y estimación

17

Para cada resultado principal y secundario, un resumen de resultados por grupo y el efecto estimado y su precisión (p. ej., IC del 95%)

Una figura mostrando los intervalos de confianza y los márgenes de no inferioridad o de equivalencia puede ser útil

Análisis auxiliares

18

Considerar la multiplicidad, informando sobre cualquier otro análisis realizado, incluyendo análisis de subgrupos y análisis ajustados, e indicando los preespecificados y los exploratorios

Métodos estadísticos

© Elsevier. Fotocopiar sin autorización es un delito.

Resultados

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 10-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico aleatorizado de no inferioridad o equivalencia (cont.) Punto n.º

Descriptor estándar CONSORT

Interpretación

20

Interpretación de los resultados, teniendo en cuenta las hipótesis del estudio, las fuentes de sesgo o imprecisión potenciales y los peligros asociados a la multiplicidad de análisis y de resultados

Generalización

21

Generalización (validez externa) de los hallazgos del ensayo

Evidencia global

22

Interpretación general de los resultados en el contexto de la evidencia actual

Extensión para los ensayos clínicos de no inferioridad

Discusión Además, hay que tener en cuenta la hipótesis de no inferioridad o de equivalencia

valencia terapéutica entre dos tratamientos, de manera que permita su rápida y fácil identificación. En la introducción hay que justificar la necesidad de llevar a cabo un estudio de no inferioridad o equivalencia, y citar las evidencias disponibles que demuestren la eficacia del tratamiento elegido como comparador, especificando el tamaño del efecto observado y su correspondiente IC. Si no existen ensayos clínicos que la demuestren, deben proporcionarse otras pruebas que la apoyen. Del mismo modo, hay que facilitar al lector del artículo las evidencias disponibles sobre las ventajas del nuevo tratamiento con relación al comparador, que justificarían la recomendación de su uso en el caso de que pueda demostrarse que no es inferior en cuanto a su eficacia al comparador. La hipótesis referente a la no inferioridad o a la equivalencia del nuevo tratamiento debe quedar claramente detallada, especificando para qué resultados se evalúa esta no inferioridad o equivalencia, y para cuáles la superioridad. Generalmente, la no inferioridad o la equivalencia se refieren al resultado principal, mientras que la evaluación de superioridad se aplica para resultados secundarios y para los que se espera que el nuevo tratamiento ofrezca alguna ventaja. En el apartado de los métodos destinado a la población de estudio, hay que detallar si los participantes se asemejan a aquellos que participaron en los ensayos clínicos que probaron la eficacia del tratamiento comparador. Sin embargo, es habitual que las poblaciones de estudio difieran, especialmente si ha pasado mucho tiempo desde que se estableció la eficacia del tratamiento comparador. Si existen diferencias notables, deben notificarse y argumentar si pueden afectar a la variable de respuesta. Es necesario proporcionar los suficientes detalles tanto del nuevo tratamiento como del comparador. Respecto a este último, debe especificarse si existe alguna diferencia con los estudios previos que demostraron su eficacia.

& / 4":0 4 % & & 2 6 * 7" - & / $ * " : / 0 * / ' & 3 * 0 3 * %" %

Cualquier cambio (p. ej., en la dosis administrada o en el manejo de los pacientes) puede resultar en una eficacia disminuida y, por tanto, favorecer sesgadamente a la hipótesis de no inferioridad. Al igual que sucede con la población y las intervenciones en estudio, cualquier diferencia entre la definición y la medición de las variables de respuesta propuestas en el estudio, y las que se usaron para valorar la eficacia del comparador, deben reflejarse en el artículo. En el apartado destinado al cálculo del tamaño de la muestra, los autores deben ofrecer detalles nuevamente sobre si el cálculo se efectuó usando un criterio de no inferioridad o de equivalencia, especificando el margen de no inferioridad o de equivalencia y la justificación para su elección. La definición de este margen debe basarse, preferiblemente, en criterios clínicos y no simplemente estadísticos. Hay que detallar qué estrategia de análisis (por intención de tratar o según protocolo) se usa para cada variable de respuesta. Al calcular el IC para comparar la variable de respuesta principal, los autores deben especificar si se trata de un análisis uni o bilateral. El límite superior del IC de la estimación del efecto del tratamiento debe estar por debajo del margen de no inferioridad para poder concluir que el nuevo tratamiento no es inferior al comparador. Al presentar los resultados, puede ser útil una figura como las comentadas en este capítulo, donde se muestren tanto el IC como el margen predefinido de no inferioridad o equivalencia para cada una de las variables de respuesta. Al interpretar los resultados, en el apartado destinado a la discusión, los autores deben concluir si los resultados confirman la hipótesis del estudio, teniendo en cuenta todos los posibles sesgos y errores debidos a la multiplicidad de análisis y variables de respuesta.

#*#-*0(3"'Ê"

© Elsevier. Fotocopiar sin autorización es un delito.

1.

Altman DG, Bland JM. Absence of evidence is not evidence of absence. BMJ. 1995; 311:485. 2. Argimon JM. La ausencia de significación estadística en un ensayo clínico no significa equivalencia terapéutica. Med Clin (Barc). 2002;118:701-3. 3. Greene WL, Concato J, Feinstein AR. Claims of equivalence in medical research: Are they supported by the evidence? Ann Intern Med. 2000;132:715-22. 4. Le Henanff A, Giraudeau B, Baron G, Ravaud P. Quality of reporting of non-inferiority and equivalence randomized trials. JAMA. 2006;295:1147-51. 5. Djulbegovic B, Clarke M. Scientific and ethical issues in equivalence trials. JAMA. 2001;285:1206-8. 6. Jones B, Jarvis P, Lewis JA, Ebbutt AF. Trials to assess equivalence: The importance of rigorous methods. BMJ. 1996;313:36-9. 7. Fleming TR. Design and interpretation of equivalence trials. Am Heart J. 2000;139: S171-6. 8. Pocock SJ. The pros and cons of non-inferiority (equivalence) trials. En: Guess HA, Kleinman A, Kusek JW, Engel LW, eds. The Science of placebo: Towards an interdisciplinary research agenda. Londres: BMJ Books; 2000. p. 236-48. 9. Gomberg-Maitland M, Frison L, Halperin JL. Active-control clinical trials to establish equivalence or non-inferiority: Methodological and statistical concepts linked to quality. Am Heart J. 2003;146:398-403.

10. 11.

12.

13.

14. 15.

16. 17. 18.

19.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM D’Agostino RB Sr, Massaro JM, Sullivan LM. Non-inferiority trials: Design concepts and issues – The encounters of academic consultants in statistics. Stat Med. 2003;22:169-86. ICH Steering Committee. Harmonised Tripartite Guideline: Choice of Control Group and Related Issues in Clinical Trials (E10). Ginebra: International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use; 2000. Disponible en: http://www.ich.org/LOB/media/MEDIA486.pdf. Fecha último acceso: 20 de mayo de 2009. Tamayo-Sarver JH, Albert JM, Tamayo-Sarver M, Cydulka RK. Advanced statistics: How to determine whether your intervention is different, at least as effective as, or equivalent: A basic introduction. Acad Emerg Med. 2005;12:536-42. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Ann Intern Med. 2001;134:663-94. Brittain E, Lin D. A comparison of intent-to-treat and per-protocol results in antibiotic non-inferiority trials. Stat Med. 2005;24:1-10. Chan FKL, Chung S, Suen BY, Lee YT, Leung WK, Leung VK, et al. Preventing recurrent upper gastrointestinal bleeding in patients with Helicobacter pylori infection who are taking low-dose aspirin or naproxen. N Engl J Med. 2001;344:967-73. Chow SC, Shao J. A note on statistical methods for assessing therapeutic equivalence. Control Clin Trials. 2002;23:515-20. Jiménez Villa J, Argimon Pallàs JM. Análisis e interpretación de un ensayo clínico. Formación Médica Continuada. 2009;16:261-71. Points to consider on switching between superiority and non-inferiority. Londres: European Medicines Agency (EMEA); 27 de julio de 2000. Disponible en: http://www.emea. eu.int/pdfs/human/ewp/048299en.pdf. Fecha último acceso: 20 de mayo de 2009. Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJW, on behalf of the CONSORT Group. Reporting of non-inferiority and equivalence randomized trials: An extension of the CONSORT statement. JAMA. 2006;295:1152-60.

&OTBZPTDMrOJDPT DPOBTJHOBDJwOBMFBUPSJB EFHSVQPT

© Elsevier. Fotocopiar sin autorización es un delito.

+."SHJNPO

La declaración CONSORT original se elaboró con la finalidad de mejorar la publicación de los ensayos clínicos controlados, aleatorizados y de grupos paralelos en los que se asignan participantes individuales a los diferentes grupos de intervención, y facilitar así su apropiada comunicación a los lectores1,2. Sin embargo, en algunas situaciones, la unidad de asignación más apropiada no es el individuo sino una agrupación de sujetos que comparten alguna característica en común como, por ejemplo, residir en la misma comunidad, ser atendidos por el mismo equipo de atención primaria, o pertenecer a una misma organización sanitaria. La asignación de grupos de participantes plantea algunas consideraciones metodológicas adicionales relacionadas con el cálculo del tamaño de la muestra o las pruebas de análisis estadístico, por ejemplo, que deben incluirse en la publicación de estos estudios. Con la finalidad de reflejar estas consideraciones, se publicó en British Medical Journal una ampliación de la declaración CONSORT para este tipo de estudios (Cluster randomized trials)3. La necesidad de esta ampliación se justificaba al revisar los resultados de los estudios que habían analizado la calidad de la publicación de los ensayos clínicos con asignación aleatoria de grupos de sujetos. En estudios realizados en los años noventa se observaron déficits metodológicos en la mayoría de estos artículos. Donner et al.4 concluyeron que en sólo 3 de los 16 estudios publicados entre 1979 y 1989 se había calculado correctamente el tamaño de la muestra necesario. Divine et al.5 concluyeron que cerca del 70% de los estudios tenían mal planteado el análisis estadístico, ya que tomaban como unidad de análisis al individuo y no al conjunto de individuos asignados. Revisiones más recientes indican que los problemas persisten, mostrando que en el 53% (52/98) de los estudios revisados no se tuvieron en cuenta en el diseño las características metodológicas diferenciales de estos diseños6; en el 42% (10/24) de los ensayos clínicos relacionados con sistemas de apoyo a la decisión clínica no se consideró de manera correcta la configuración de los grupos en su análisis (en ninguno de ellos se tomaron en cuenta los grupos para el cálculo del tamaño de la muestra)7; y, finalmente, en una revi-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

sión de 51 ensayos clínicos aleatorizados comunitarios se precisó que únicamente en diez de ellos se había observado el agrupamiento en los cálculos del tamaño de la muestra o de la potencia estadística, que en sólo 19 se había considerado el agrupamiento en el análisis, y que los efectos de los coeficientes de correlación intraclase y del diseño se contemplaron en sólo uno y tres ensayos clínicos, respectivamente8. Por último, en una revisión de 114 estudios, de los cuales 40 eran ensayos clínicos, la unidad de análisis era incorrecta en 19 estudios (48%)9.

$"3"$5&3Ê45*$"4&41&$*"-&4%&-04&/4":04 $-Ê/*$04$0/"-&"503*;"$*Î/%&(36104 En un ensayo clínico con aleatorización de grupos (también denominado ensayo clínico aleatorizado comunitario y, ocasionalmente, ensayo clínico de campo) se asignan al azar los participantes a las intervenciones en forma de grupos compactos. Estos grupos (o conjuntos de participantes) representan a menudo conjuntos de tipo administrativo o sanitario, y su tamaño puede ser el de familias10, hospitales11 o comunidades enteras12. Las observaciones que se realizan en los diferentes individuos de cada grupo suelen estar correlacionadas entre sí, lo que tiene importantes implicaciones respecto al diseño del estudio, su elaboración y el análisis de sus resultados, dado que en este caso no se pueden aplicar los métodos estadísticos convencionales. Al diseñar, analizar y publicar posteriormente este tipo de estudios, hay que considerar varias características clave. Las más importantes son: a) los motivos por los que se considera que el ensayo clínico aleatorizado comunitario es el diseño más apropiado; b) los métodos para determinar el tamaño de la muestra; c) los métodos para seleccionar los grupos y asignarlos a las distintas intervenciones, y d) los métodos de análisis de los datos. A continuación se comentan estas cuestiones.

$gMDVMPEFMUBNBvPEFMBNVFTUSBZEFDJTJwOEFVTBSVOEJTFvPEFHSVQPT La decisión de usar un diseño de asignación de grupos debe tomarse después de considerar las posibles ventajas y sus riesgos. En algunas ocasiones es el diseño más apropiado13, por ejemplo, cuando se estudian programas sanitarios o de formación que se implementan a nivel grupal o de toda una organización sanitaria. En otras circunstancias, el uso de una asignación individual puede comportar «contaminación» (la introducción no intencionada de la intervención activa en el grupo control) entre los individuos y diluir el efecto de la intervención. Por ejemplo, supongamos que se desea valorar la efectividad de enseñar los conocimientos y las habilidades necesarias para practicar la medicina basada en la evidencia a médicos residentes de medicina de familia, y se comparan dos métodos: las clases presenciales guiadas por un tutor y la enseñanza a distancia a través de Internet. Si los médicos residentes se asignan individualmente a los grupos de estudio, es probable que en un mismo centro haya médicos que reciban tanto una como otra intervención, y que puedan intercambiar experiencias, materiales, etc. Para evitar esta contaminación, se pueden asignar grupos de residentes, por ejemplo, aquellos que pertenecen a un mismo centro de salud. Fi-

& / 4":0 4 $ - Ê / * $ 0 4 $ 0 / " 4 * ( / "$ * Î / " - & "5 0 3 * " % & ( 3 6 1 0 4

nalmente, el ensayo clínico aleatorizado comunitario puede ser el único diseño factible que permita la evaluación en algunas circunstancias; por ejemplo, cuando las estrategias educativas para el adecuado control de los pacientes se dirigen hacia los profesionales sanitarios, la estrategia apropiada es la asignación aleatoria de los profesionales sanitarios más que de los pacientes individuales. Sin embargo, el uso de este tipo de diseño tiene un coste. Dado que las observaciones efectuadas en los diferentes individuos que componen cada grupo tienden a presentar cierta correlación, el ensayo clínico aleatorizado comunitario no es estadísticamente tan potente como el ensayo clínico en el que se realiza la asignación aleatoria individual de un mismo número de participantes a los distintos grupos. Por ello, en los ensayos clínicos aleatorizados comunitarios es necesaria la participación de un mayor número de individuos, y es importante que en el artículo se señale el ajuste del tamaño de la muestra debido al agrupamiento de los datos (tabla 11-1, punto 7 de la lista). Este ajuste depende de dos factores principales: el tamaño medio del grupo y el grado de correlación entre los individuos que constituyen los grupos. Una medida estadística de esta dependencia intragrupos es el coeficiente de correlación intragrupo (CCI) o ρ14. El CCI explica el hecho de que en un ensayo comunitario haya que considerar dos componentes distintos de la variación: a) la varianza entre los individuos, y b) la varianza entre los grupos. El CCI está fundamentado en la relación entre ambos componentes, y se define como la proporción de la varianza total del resultado que se puede atribuir a la diferencia existente entre los grupos 9. El CCI adopta un valor entre 0 y 1. Si se asume que m es el tamaño medio del grupo, entonces el factor de inflación apropiado de la muestra, también denominado efecto del diseño15, asociado a la asignación aleatoria de los grupos es:

© Elsevier. Fotocopiar sin autorización es un delito.

1 + (m – 1) ρ donde m es el número de individuos en cada grupo y ρ representa el CCI. El CCI es generalmente pequeño (a menudo, inferior a 0,05) y su importancia en el efecto del diseño puede ser irrelevante, en especial para aquellos casos en que el tamaño del grupo es pequeño. Por ejemplo, con un CCI muy pequeño (0,01), si el tamaño del grupo fuera 10, el tamaño de la muestra necesario en una asignación de grupos sería 1,09 veces mayor que el necesario si la asignación fuera individual (tabla 11-2). Ahora bien, incluso si el CCI es muy pequeño (0,01), en caso de que el tamaño del grupo fuera 100, la estimación estándar del tamaño de la muestra se tendría que duplicar para conseguir una potencia estadística equivalente a la que existiría en un ensayo clínico con asignación aleatoria de participantes individuales16-18. Por otro lado, como ya se ha comentado, una de las razones para emplear este tipo de diseño es evitar la contaminación que puede producirse entre los participantes si la asignación es individual. La consecuencia de la contaminación es la dilución de un efecto potencial, lo que puede disminuir la potencia estadística del ensayo y llevar a un error estadístico de tipo II. Si el tamaño de la muestra de un ensayo clínico con asignación individual se aumenta adecuadamente, se puede evitar el problema de la dilución del efecto y de la disminu-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 11-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico con asignación aleatoria de grupos Punto n.º Título y resumen

Descriptor estándar CONSORT

Extensión para los ensayos clínicos con asignación aleatoria de grupos*

1

Cómo se asignaron los pacientes a las intervenciones (p. ej., «asignación aleatoria» o «aleatorizado»)

Especificar que esta asignación es de grupos

2

Antecedentes científicos y razón de ser del estudio

Contexto científico y explicación del fundamento, incluido el fundamento para el uso de un diseño de grupos

Participantes

3

Criterios de selección de pacientes y ámbito y lugares en que se recogieron los datos

Criterios para la selección de los participantes individuales y de los grupos, así como contextos y localizaciones en los que se obtienen los datos

Intervenciones

4

Detalles precisos de las intervenciones pretendidas para cada grupo y cómo y cuándo fueron efectivamente administradas

Detalles precisos de las intervenciones pretendidas para cada grupo, tanto de las relativas al individuo como de las relativas al grupo o a ambos, así como de la manera con la que se realizaron realmente dichas intervenciones

Objetivos

5

Objetivos e hipótesis específicos

Objetivos e hipótesis específicos y su pertinencia respecto del individuo, el grupo o ambos

Resultados

6

Definición clara de las medidas de los resultados principal y secundarios, y, cuando proceda, de cualquier método utilizado para mejorar la calidad de las medidas (p. ej., observaciones múltiples, entrenamiento de evaluadores)

Presentación clara de los criterios de valoración principal y secundarios, de su pertinencia a nivel individual, grupal o a ambas, y –siempre que sea aplicable– de cualquier método utilizado para incrementar la calidad de las medidas (p. ej., observaciones múltiples, formación de evaluadores)

Tamaño muestral

7

Cómo se determinó el tamaño muestral y, cuando proceda, explicación de cualquier análisis intermedio y reglas de interrupción del ensayo

Forma de determinar el tamaño total de la muestra (incluidos el método de cálculo, el número de grupos, el tamaño de los grupos, el coeficiente de correlación intragrupo (CCI o κ2) y la indicación de su incertidumbre)

8

Método utilizado para generar la secuencia de asignación aleatoria, incluyendo detalles sobre cualquier restricción (p. ej., bloques, estratificación)

Introducción Antecedentes

Métodos

Aleatorización Generación de la secuencia

Continúa

& / 4":0 4 $ - Ê / * $ 0 4 $ 0 / " 4 * ( / "$ * Î / " - & "5 0 3 * " % & ( 3 6 1 0 4

Tabla 11-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico con asignación aleatoria de grupos (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos clínicos con asignación aleatoria de grupos* Métodos utilizados para implementar la secuencia de asignación aleatoria, con especificación de que la asignación aleatoria se realizó sobre grupos más que sobre individuos, y clarificando si la secuencia se mantuvo oculta hasta la asignación de las intervenciones

Asignación oculta

9

Método utilizado para implementar la secuencia de asignación aleatoria (p. ej., contenedores de medicación numerados, aleatorización centralizada por teléfono), clarificando si la secuencia se mantuvo oculta hasta el momento de la asignación

Implementación

10

Quién generó la secuencia de asignación, quién incluyó a los participantes y quién los asignó a los grupos

Ciego (enmascaramiento)

11

Si los participantes, quienes administraron las intervenciones o quienes evaluaron los resultados, conocían o no la intervención asignada. Si no, cómo se evaluó el éxito del enmascaramiento

Métodos estadísticos

12

Métodos estadísticos empleados para comparar los grupos en cuanto al resultado principal; métodos utilizados en análisis adicionales, como análisis de subgrupos o análisis ajustados

Métodos estadísticos utilizados para comparar los grupos en el análisis principal, indicando la forma con la que se tuvo en cuenta el agrupamiento de los pacientes; métodos para análisis adicionales como los análisis de subgrupos y los análisis ajustado

Flujo de participantes

13

Flujo de participantes a través de cada estadio (se recomienda un diagrama). Específicamente, para cada grupo, documentar los números de participantes asignados aleatoriamente, que recibieron el tratamiento pretendido, que completaron el protocolo del estudio y que fueron incluidos en el análisis del resultado principal. Describir las desviaciones del protocolo planificado, y los motivos

Flujo de grupos y de participantes individuales en cada fase (se recomienda especialmente el uso de un diagrama). Específicamente para cada grupo, señalar el número de grupos y el número de participantes asignados aleatoriamente que recibieron el tratamiento propuesto, que finalizaron el protocolo del estudio y que se incluyeron en el análisis del criterio principal de valoración. Describir las desviaciones respecto del protocolo planificado del estudio, junto con las razones de ello

Reclutamiento

14

Fechas que limitan los períodos de reclutamiento y de seguimiento

© Elsevier. Fotocopiar sin autorización es un delito.

Resultados

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 11-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico con asignación aleatoria de grupos (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos clínicos con asignación aleatoria de grupos*

Datos basales

15

Características demográficas y clínicas basales en cada grupo

Información inicial respecto de cada grupo, a nivel individual y de grupo, si fuera aplicable

Números analizados

16

Número de participantes (denominador) de cada grupo incluidos en cada análisis, y si el análisis se realizó «por intención de tratar». Expresar los resultados mediante números absolutos cuando sea factible (p. ej., «10/20» en lugar de «50%»)

El número de grupos y participantes (denominador) de cada grupo incluidos en cada análisis, con definición de si el análisis se realizó mediante «intención de tratar»

Resultados y estimación

17

Para cada resultado principal y secundario, un resumen de resultados por grupo y el efecto estimado y su precisión (p. ej., IC del 95%)

Para cada criterio de valoración principal y secundario, el resumen de los resultados de cada grupo a nivel individual o de grupo según lo aplicable, así como la magnitud estimada del efecto y su grado de precisión (p. ej., IC del 95%), junto con un coeficiente de correlación intragrupo (CCI o κ2) para cada criterio principal de valoración

Análisis auxiliares

18

Considerar la multiplicidad, informando sobre cualquier otro análisis realizado, incluyendo análisis de subgrupos y análisis ajustados, indicando los preespecificados y los exploratorios

Eventos adversos

19

Todos los eventos adversos o efectos colaterales importantes en cada grupo de intervención

Interpretación

20

Interpretación de los resultados, teniendo en cuenta las hipótesis del estudio, las fuentes de sesgo o imprecisión potenciales y los peligros asociados a la multiplicidad de análisis y de resultados

Generalización

21

Generalización (validez externa) de los hallazgos del ensayo

Evidencia global

22

Interpretación general de los resultados en el contexto de la evidencia actual

Discusión

La posibilidad de extrapolación (validez externa) de los resultados obtenidos en el estudio a individuos, grupos o ambos (según lo relevante)

*En cursiva aparecen las modificaciones aplicables a los ensayos clínicos con asignación de grupos.

& / 4":0 4 $ - Ê / * $ 0 4 $ 0 / " 4 * ( / "$ * Î / " - & "5 0 3 * " % & ( 3 6 1 0 4

ción de la potencia estadística. Slymen y Hovell19 proporcionaron un factor de ajuste del tamaño de la muestra en función del efecto de contaminación: Efecto de contaminación = 1/(1 – contaminación)2 donde contaminación = p1 + p2, siendo p1 la proporción de individuos del grupo de intervención no expuestos a la intervención, y p2, la proporción de individuos del grupo control expuestos a la intervención. En la tabla 11-3 se presenta este efecto en función de varios niveles de contaminación. Teniendo en cuenta la eficiencia estadística, los investigadores pueden tomar una decisión informada sobre la conveniencia o no de usar un diseño con asignación de grupos, calculando la razón entre el factor corrector del tamaño de la muestra y el efecto de contaminación (tabla 11-4). Una razón mayor de uno indica un menor tamaño de muestra para los ensayos clínicos con asignación individual y viceversa. La tabla 11-4 muestra que, cuando el número de individuos por grupo es pequeño, incluso con niveles elevados de contaminación, puede resultar todavía más eficiente, en términos de tamaño de la muestra, asignar más pacientes en un ensayo clínico con asignación individual y aceptar una dilución del efecto. Por consiguiente, es muy importante que los autores del estudio justifiquen adecuadamente la necesidad de emplear un diseño de asignación de grupos (v. tabla 11-1, punto 7 de la lista).

© Elsevier. Fotocopiar sin autorización es un delito.

4FMFDDJwOZBTJHOBDJwOEFMPTHSVQPTEFQBSUJDJQBOUFT Las posibilidades de incurrir en un sesgo en un ensayo con asignación de grupos también son distintas a las de un ensayo clínico aleatorizado individual. En concreto, en un ensayo con asignación de grupos pueden aparecer sesgos en dos facetas: de grupo o individual. Especialmente importante es el sesgo de selección20. La razón principal es que la asignación del tratamiento está predeterminada para cada miembro del grupo, de forma que el participante puede conocer la intervención que se le asignará y, por tanto, aumenta el riesgo de inclusión selectiva de los participantes procedentes de un mismo grupo. Los sesgos de selección se pueden introducir de varias maneras en los ensayos clínicos comunitarios; por ejemplo, mediante el método de asignación de los conjuntos de pacientes a los distintos grupos de intervención, por diferencias en las tasas de abandono del estudio por parte de los participantes de los distintos grupos, por desequilibrios en los grupos, por diferencias en los métodos para seleccionar a los pacientes individuales o para obtener su consentimiento dentro de cada grupo, y por diferencias en los criterios de inclusión y exclusión aplicados a los diferentes participantes individuales21-24. Por tanto, es importan-

Tabla 11-2. Factor corrector del tamaño de la muestra en función del coeficiente de correlación intragrupo (CCI), si el tamaño de los grupos fuera de 10 individuos cada uno CCI

0,01

0,02

0,05

0,10

0,20

Factor corrector

1,09

1,18

1,5

1,90

2,80

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 11-3. Efecto de contaminación en función de varios niveles de contaminación Contaminación (%)

0

5

10

15

20

Efecto de contaminación

1

1,11

1,23

1,38

1,56

te definir los métodos utilizados para evitar los sesgos en los ensayos clínicos de grupos (v. tabla 11-1, puntos 8, 9 y 10 de la lista). La asignación aleatoria de los grupos se debe considerar cuidadosamente en lo que se refiere a los métodos de enmascaramiento y a los métodos para seleccionar a los individuos que constituirán cada grupo. Hay varios métodos para minimizar el riesgo de sesgo de selección a escala individual: la enumeración e inclusión completa de todos los miembros de un grupo y la inclusión de una muestra aleatoria predefinida de un grupo de participantes. Sin embargo, estos métodos han planteado problemas de carácter ético respecto de la función que desempeña el consentimiento informado en los ensayos clínicos de grupos25-27.

"OgMJTJTFTUBErTUJDP Igual que ocurre con el tamaño de la muestra, el método estadístico convencional de análisis de resultados también asume la independencia de los datos individuales. Si se aplican procedimientos estadísticos convencionales a los datos obtenidos en un ensayo clínico con asignación aleatoria de grupos, se obtienen errores estándar del efecto muy pequeños e intervalos de confianza demasiado estrechos. Por tanto, es importante indicar el método de ajuste del análisis que toma en consideración la presentación en grupo de los participantes (v. tabla 11-1, punto 17 de la lista). Hay tres métodos principales para el análisis de los resultados obtenidos en los ensayos clínicos con asignación aleatoria de grupos: el ajuste de los métodos estándar, el análisis a nivel de grupo y las técnicas estadísticas avanzadas que utilizan los datos a nivel de grupo e individual28. El impacto del agrupamiento en el análisis está relacionado principalmente con la magnitud del CCI. Por consiguiente, en la publicación de un ensayo clínico de estas características se debe comunicar dicho factor. Se han publicado directrices para la presentación del CCI29. La publicación del CCI también le permite al lector evaluar la idoTabla 11-4. Razón entre el factor de corrección del tamaño de la muestra y el efecto de contaminación (número de individuos por grupo = 10) Contaminación (%) CCI

0

5

10

15

20

0,01

1,09

0,98

0,87

0,79

0,70

0,02

1,18

1,06

0,96

0,86

0,76

0,05

1,45

1,31

1,18

1,05

0,93

0,10

1,90

1,71

1,54

1,38

1,22

0,20

2,80

2,52

2,28

2,03

1,79

& / 4":0 4 $ - Ê / * $ 0 4 $ 0 / " 4 * ( / "$ * Î / " - & "5 0 3 * " % & ( 3 6 1 0 4

neidad de las premisas efectuadas respecto del tamaño original de la muestra, y ofrece información a los investigadores para la futura planificación de ensayos comunitarios en el contexto referido.

#*#-*0(3"'Ê" 1.

2

3. 4. 5. 6.

7. 8. 9. 10.

11.

12.

© Elsevier. Fotocopiar sin autorización es un delito.

13.

14. 15. 16. 17.

18.

Moher D, Schulz KF, Altman DG, on behalf of the CONSORT Group. The CONSORT statement: Revised recommendations for improving the quality of reports of parallelgroup randomised trials. Lancet. 2001;357:1191-4. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomised trials: Explanation and elaboration. Ann Intern Med. 2001;134:663-94. Campbell MK, Elbourne DR, Altman DG, on behalf of the CONSORT group. CONSORT statement: Extension to cluster randomised trials. BMJ. 2004;328:702-8. Donner A, Brown KS, Brasher P. A methodological review of non-therapeutic intervention trials employing cluster randomization, 1979-1989. Int J Epidemiol. 1990;19:795-800. Divine GW, Brown JT, Frazier LM. The unit of analysis error in studies about physicians’ patient care behaviour. J Gen Intern Med. 1992;7:623-9. MacLennan GS, Ramsay CR, Mollison J, Campbell MK, Grimshaw JM, Thomas RE. Room for improvement in the reporting of cluster randomized trials in behaviour change research. Control Clin Trials. 2003;24(Suppl 3):S69-70. Chuang JH, Hripcsak G, Jenders RA. Considering clustering: A methodological review of clinical decision support system studies. Proc AMIA Symp. 2000;146-50. Isaakidis P, Ioannidis JPA. An evaluation of cluster randomized controlled trials in subSaharan Africa. Am J Epidemiol. 2003;158:921-6. Calhoun AW, Guyatt GH, Cabana MD, Lu D, Turner DA, Valentine S, et al. Addressing the unit of analysis in medical care studies: A systematic review. Med Care. 2008;46:635-43. Farr BM, Hendley JO, Kaiser DL, Gwaltney JM. Two randomized controlled trials of virucidal nasal tissues in the prevention of natural upper respiratory infections. Am J Epidemiol. 1988;128:1162-72. Carmen WF, Elder AG, Wallace LA, McAulay K, Walker A, Murray GD, et al. Effects of influenza vaccination of health-care workers on mortality of elderly people in long-term care: A randomised controlled trial. Lancet. 2000;355:93-7. Hayes R, Mosha F, Nicoll A, Grosskurth H, Newell J, Todd J, et al. A community trial of the impact of improved sexually transmitted disease treatment on the HIV epidemic in rural Tanzania: 1. Design. AIDS. 1995;9:919-26. Cals JW, Butler CC, Hopstaken RM, Hood K, Dinant GJ. Effect of point of care testing for C reactive protein and training in communication skills on antibiotic use in lower respiratory tract infections: Cluster randomised trial. BMJ. 2009;338:b1374. Killip S, Mahfoud Z, Pearce K. What is an intracluster correlation coefficient? Crucial concepts for primary care researchers. Ann Fam Med. 2004;2:204-8. Donner A, Birkett N, Buck C. Randomization by cluster. Sample size requirements and analysis. Am J Epidemiol. 1981;114:906-14. Campbell MK, Fayers PM, Grimshaw JM. Determinants of the intracluster correlation coefficient in cluster randomised trials. Clin Trials. 2005;2:99-107. Turner RM, Thompson SG, Spiegelhalter DJ. Prior distributions for the intracluster correlation coefficient, based on multiple previous estimates, and their application in cluster randomized trials. Clin Trials. 2005;2:108-18. Turner RM, Prevost AT, Thompson SG. Allowing for imprecision of the intracluster correlation coefficient in the design of cluster randomized trials. Stat Med. 2004;23:1195-214.

19. 20. 21. 22.

23. 24. 25.

26. 27. 28.

29.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM Slymen DJ, Hovell MF. Cluster versus randomization in adolescent tobacco and alcohol studies: Illustrations for design decisions. Int J Epidemiol. 1997;26:765-71. Medical Research Council. Cluster randomized trials: Methodological and ethical considerations. MRC clinical trials series. Londres: Medical Research Council; 2002. Puffer S, Torgerson DJ, Watson J. Evidence for risk of bias in cluster randomized trials: Review of recent trials published in three general medical journals. BMJ. 2003;327:785-9. Farrin A, Russell I, Torgerson D, Underwood M. Differential recruitment in a cluster randomized trial in primary care: The experience of the UK Back pain, Exercise, Active management and Manipulation (UK BEAM) feasibility study. Clin Trials. 2005;2:119-24. Kerry SM, Cappucio FP, Emmett L, Plange-Rhule J, Eastwood JB. Reducing selection bias in a cluster randomized trial in West African villages. Clin Trials. 2005;2:125-9. Hahn S, Puffer S, Torgerson DJ, Watson J. Methodological bias in cluster randomised trials. BMC Med Res Methodol. 2005;5:10. Hutton J. Are distinctive ethical principles required for cluster randomised trials? En: Campbell MJ, Donner A, Elbourne D, eds. Design and analysis of cluster randomized trials. Stat Med. 2001;20:473-88. Edwards S, Braunholtz DA, Lilford RJ, Stevens A. Ethical issues in the design and conduct of cluster randomised trials. BMJ. 1999;318:1407-9. Eldridge FM, Ashby D, Feder GS. Informed patient consent to randomization in cluster randomized trials: An empirical exploration of trials in primary care. Clin Trials. 2005;2:91-8. Mollison J, Simpson J, Campbell MK, Grimshaw JM. Comparison of analytic methods for cluster randomised trials: An example from a primary care setting. J Epidemiol Biostat. 2000;5:339-46. Campbell MK, Grimshaw JM, Elbourne DR. Intracluster correlation coefficients in cluster randomised trials: Empirical insights into how should they be reported. BMC Med Res Methodol. 2004;4:9.

0USBTFYUFOTJPOFTEF MBEFDMBSBDJwO$0/4035 JOUFSWFODJPOFTOP GBSNBDPMwHJDBT FOTBZPT QSBHNgUJDPTZSFT|NFOFT EFFOTBZPTDMrOJDPT

© Elsevier. Fotocopiar sin autorización es un delito.

++JNnOF[

Gran parte de los artículos que presentan resultados de investigaciones clínicas todavía lo hacen de forma deficiente, de manera que los lectores no pueden evaluar adecuadamente la validez de los estudios ni la aplicabilidad de sus resultados, lo que limita la utilidad de la investigación. Además, la presentación inadecuada de los métodos utilizados en los ensayos clínicos y sus hallazgos supone un problema importante para la realización de revisiones sistemáticas de la evidencia científica. En un intento de mejorar la calidad de los artículos, se han elaborado diferentes guías y recomendaciones sobre la forma en que éstos deben ser redactados y la información que deben contener, siendo la declaración CONSORT (COnsolidated Standards of Reporting Trials), revisada en 20011, la iniciativa más conocida. Estas primeras directrices fueron elaboradas por investigadores clínicos, expertos en metodología y editores de revistas médicas con la finalidad de mejorar la publicación de los ensayos clínicos con dos grupos en paralelo1. Más de 300 revistas y diversos grupos editoriales, incluyendo el International Committee of Medical Journal Editors (ICMJE), han incorporado estas recomendaciones2, y se ha podido observar que, desde su publicación original en 1996, la calidad de la publicación de los ensayos clínicos ha mejorado3. Estas recomendaciones de la declaración CONSORT son necesariamente genéricas y no contemplan todas las situaciones que se plantean. Por ello, se han ido desarrollando extensiones de las directrices originales para los diversos tipos de

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ensayos clínicos, en función de su diseño (asignación por grupos4, estudios de no inferioridad y equivalencia5, ensayos pragmáticos6), el tipo de intervención que se evalúa (hierbas medicinales7, intervenciones no farmacológicas8,9), o los datos que se presentan (efectos perjudiciales10, resúmenes de ensayos clínicos11,12). En la página web del grupo CONSORT (http://www.consort-statement. org) pueden consultarse las listas de ítems de las diferentes extensiones, su justificación y explicación detalladas, y ejemplos ilustrativos de su uso. También puede consultarse la página web de la iniciativa EQUATOR (www.equator-network.org), que contiene múltiples recursos de interés relacionados con la publicación de la investigación clínica. Las extensiones para ensayos clínicos con asignación por grupos y los estudios de no inferioridad y equivalencia han sido comentadas en los capítulos anteriores. En éste se revisan las tres últimas: la de los ensayos clínicos que evalúan una intervención no farmacológica, la destinada a los ensayos clínicos pragmáticos, y las directrices cuya finalidad es mejorar la publicación de los resúmenes de los ensayos clínicos.

&/4":04$-Ê/*$04$0/53"5".*&/504 /0'"3."$0-Î(*$04 Son tratamientos no farmacológicos, entre otros, la cirugía, la rehabilitación, la psicoterapia, las terapias conductuales y las terapias alternativas. Aproximadamente el 25% de los ensayos clínicos que se publican evalúan una intervención no farmacológica13. La evaluación de la eficacia de este tipo de tratamientos entraña dificultades metodológicas, por ejemplo, en el uso de técnicas de ciego14,15. Además, suele tratarse de intervenciones complejas y, por consiguiente, difíciles de describir, estandarizar y administrar de forma consistente a todos los pacientes, de manera que la experiencia de los centros y los profesionales que las aplican puede tener una gran influencia sobre los resultados. Si no se tienen en cuenta al diseñar y ejecutar el estudio, todas estas variaciones pueden tener un impacto importante sobre la estimación del efecto del tratamiento. Por esta razón, el grupo CONSORT decidió elaborar una extensión de sus directrices para la publicación de los ensayos con tratamientos no farmacológicos. Con este fin, en febrero de 2006, se organizó una reunión de consenso con 33 expertos que recomendaron ampliar las guías en 11 ítems y añadir uno nuevo (tabla 12-1), así como modificar el diagrama de flujo de los pacientes (fig. 12-1).

3FDPNFOEBDJPOFTQBSBMBQVCMJDBDJwO La información que contienen el título y el resumen es esencial ya que es la que aparece en las bases de datos e índices, de manera que la difusión del artículo puede verse alterada si no refleja adecuadamente su contenido. Además, no debe olvidarse que el resumen es la sección más leída de un artículo, y a menudo la única que lo es. El resumen debe redactarse cuidadosamente y debe incorporar los aspectos más importantes del ensayo. Existen estudios que prueban que los resúmenes

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

Tabla 12-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico que evalúa una intervención no farmacológica Punto n.º Título y resumen

Descriptor estándar CONSORT

Extensión para los ensayos no farmacológicos

1

Cómo se asignaron los pacientes a las intervenciones (p. ej., «asignación aleatoria» o «aleatorizado»)

En el resumen, descripción del tratamiento experimental, el comparador, los profesionales que proporcionan el tratamiento, los centros y si existe enmascaramiento

2

Antecedentes científicos y razón de ser del estudio

Participantes

3

Criterios de selección de pacientes y ámbito y lugares en que se recogieron los datos

Cuando sea aplicable, describir los criterios de selección de los centros y de los profesionales que llevan a cabo la intervención

Intervenciones

4

Detalles precisos de las intervenciones pretendidas para cada grupo y cómo y cuándo fueron efectivamente administradas

Precisar los detalles tanto del tratamiento experimental como del comparador 4A. Describir los diferentes componentes de las intervenciones y, cuando se requiera, el procedimiento para personalizar las intervenciones 4B. Detallar cómo se estandarizaron las intervenciones 4C. Detallar cómo se evaluó o mejoró el cumplimiento del protocolo por parte de los profesionales

Objetivos

5

Objetivos e hipótesis específicos

Resultados

6

Definición clara de las medidas de los resultados principal y secundarios y, cuando proceda, de cualquier método utilizado para mejorar la calidad de las medidas (p. ej., observaciones múltiples, entrenamiento de evaluadores)

Tamaño muestral

7

Cómo se determinó el tamaño muestral y, cuando proceda, explicación de cualquier análisis intermedio y reglas de interrupción del ensayo

Introducción Antecedentes

© Elsevier. Fotocopiar sin autorización es un delito.

Métodos

Aleatorización

Generación de la secuencia

Cuando sea aplicable, describir cómo se aborda la posibilidad de que haya agrupaciones (clusters) de centros o profesionales Cuando sea aplicable, describir cómo los profesionales se asignaron a cada uno de los grupos

8

Método utilizado para generar la secuencia de asignación aleatoria, incluyendo detalle sobre cualquier restricción (p. ej., bloques, estratificación) Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 12-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico que evalúa una intervención no farmacológica (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos no farmacológicos

Asignación oculta

9

Método utilizado para implementar la secuencia de asignación aleatoria (p. ej., contenedores de medicación numerados, aleatorización centralizada por teléfono), clarificando si la secuencia se mantuvo oculta hasta el momento de la asignación

Implementación

10

Quién generó la secuencia de asignación, quién incluyó a los participantes y quién los asignó a los grupos

Ciego (enmascaramiento)

11

Si los participantes, quienes administraron las intervenciones o quienes evaluaron los resultados, conocían o no la intervención asignada. Si no, cómo se evaluó el éxito del enmascaramiento

Describir si los profesionales que administran tratamientos concomitantes desconocen el grupo al que están asignados 11B. Si hay enmascaramiento, describir el método usado y la similitud de las intervenciones*

Métodos estadísticos

12

Métodos estadísticos empleados para comparar los grupos en cuanto al resultado principal; métodos utilizados en análisis adicionales, como análisis de subgrupos o análisis ajustados

Cuando sea aplicable, describir los detalles de si se ha abordado y cómo la existencia de clusters de profesionales o centros

Flujode participantes

13

Flujo de participantes a través de cada estadio (se recomienda un diagrama). Específicamente, para cada grupo, documentar los números de participantes asignados aleatoriamente, que recibieron el tratamiento pretendido, que completaron el protocolo del estudio y que fueron incluidos en el análisis del resultado principal. Describir las desviaciones del protocolo planificado, y los motivos

Número de profesionales o centros que realizan la intervención en cada grupo y el número de pacientes tratados por cada profesional en cada centro

Implementación

ítem nuevo

Reclutamiento

14

Fechas que limitan los períodos de reclutamiento y de seguimiento

Datos basales

15

Características demográficas y clínicas basales en cada grupo

Resultados

Detalles de cómo se implementaron el tratamiento experimental y el comparador

Cuando sea aplicable, descripción de los profesionales (volumen de casos, experiencia) y centros (volumen de casos atendidos) en cada grupo Continúa

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

Tabla 12-1. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico que evalúa una intervención no farmacológica (cont.) Punto n.º

Descriptor estándar CONSORT

Extensión para los ensayos no farmacológicos

Números analizados

16

Número de participantes (denominador) de cada grupo incluidos en cada análisis, y si el análisis se realizó «por intención de tratar». Expresar los resultados mediante números absolutos cuando sea factible (p. ej., «10/20» en lugar de «50%»)

Resultados y estimación

17

Para cada resultado principal y secundario, un resumen de resultados por grupo y el efecto estimado y su precisión (p. ej., IC del 95%)

Análisis auxiliares

18

Considerar la multiplicidad, informando sobre cualquier otro análisis realizado, incluyendo análisis de subgrupos y análisis ajustados, indicando los preespecificados y los exploratorios

Eventos adversos

19

Todos los eventos adversos o efectos colaterales importantes en cada grupo de intervención

Interpretación

20

Interpretación de los resultados, teniendo en cuenta las hipótesis del estudio, las fuentes de sesgo o imprecisión potenciales y los peligros asociados a la multiplicidad de análisis y de resultados

Además, hay que tener en cuenta la elección del comparador, la falta de enmascaramiento total o parcial, y la distinta experiencia de los profesionales y centros de cada uno de los grupos

Generalización

21

Generalización (validez externa) de los hallazgos del ensayo

Generalización (validez externa) del estudio de acuerdo con la intervención, del comparador, de los pacientes, de los profesionales y de los centros que participan en el estudio

Evidencia global

22

Interpretación general de los resultados en el contexto de la evidencia actual

© Elsevier. Fotocopiar sin autorización es un delito.

Discusión

*Este ítem aparecerá en la próxima versión de las directrices estándar del grupo CONSORT.

en ocasiones omiten información clave para la comprensión de la investigación16,17. En los ensayos clínicos con tratamientos no farmacológicos, los resúmenes deben incluir información sobre la experiencia de los centros y los profesionales que aplican el tratamiento. Tanto la intervención en estudio como la que sirve de comparación deben estar claramente definidas. Por último, los

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Evaluados para inclusión (n = ...)

Excluidos (n = ...) Incumplen criterios (n = ...) No consienten (n = ...) Otras razones (n = ...)

Análisis

Seguimiento

Asignación de profesionales

Asignación de pacientes

Aleatorizados (n = ...)

Asignados a intervención (n = ...)

Asignados a intervención (n = ...)

Recibieron intervención asignada (n = ...)

Recibieron intervención asignada (n = ...)

No recibieron intervención asignada (indicar motivos) (n = ...)

No recibieron intervención asignada (indicar motivos) (n = ...)

Profesionales (n = ...)

Profesionales (n = ...)

Equipos (n = ...), centros (n = ...) que realizan la intervención

Equipos (n = ...), centros (n = ...) que realizan la intervención

Número de pacientes tratados por cada profesional, equipo y centro (mediana = ...)

Número de pacientes tratados por cada profesional, equipo y centro (mediana = ...)

[RIQ = min, max, ...]

[RIQ = min, max, ...]

Perdidos en el seguimiento (n = ...) (indicar motivos)

Perdidos en el seguimiento (n = ...) (indicar motivos)

Interrumpen la intervención (indicar motivos) (n = ...)

Interrumpen la intervención (indicar motivos) (n = ...)

Analizados (n = ...)

Analizados (n = ...)

Excluidos del análisis (indicar motivos) (n = ...)

Excluidos del análisis (indicar motivos) (n = ...)

Figura 12-1. Diagrama de flujo de participantes en un ensayo clínico que evalúa una intervención no farmacológica.

© Elsevier. Fotocopiar sin autorización es un delito.

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

autores deben especificar si se ha empleado alguna técnica de ciego y, si no fue posible, si al menos la evaluación de la variable de respuesta fue ciega. El ítem 3 de las directrices generales, que hace referencia a los criterios de selección de los participantes, debe ser ampliado. Existen evidencias que sugieren que, cuanto mayor es la experiencia de un centro o de un profesional, mejores resultados se obtienen18, de manera que si esta experiencia es diferente en cada uno de los grupos del ensayo, se puede sesgar la estimación del efecto. Por ello, en la sección de métodos, con la finalidad de ayudar a los lectores a realizar una valoración crítica de los resultados obtenidos, debe detallarse la experiencia de los centros, especificando el volumen de intervenciones que realizan. Por otro lado, los criterios de selección de los profesionales pueden referirse a su categoría profesional, años de experiencia, número de intervenciones practicadas, o entrenamiento específico antes de iniciar el estudio. Estos criterios deben estar adecuadamente justificados, ya que influyen directamente en la aplicabilidad de los resultados. Los tratamientos no farmacológicos suelen ser intervenciones complejas con múltiples componentes, pudiendo influir todos ellos sobre el efecto del tratamiento. Por este motivo, los autores deben describir con sumo detalle la intervención en su conjunto, y cada uno de sus componentes en particular (ítem 4). La información que se requiere depende de cada situación. Si se trata de una intervención quirúrgica o un procedimiento, debe proporcionarse información sobre los cuidados preoperatorios, los que se realizan durante el acto quirúrgico y los que reciben los pacientes en el postoperatorio. En el caso de un tratamiento de rehabilitación, terapia conductual, educación sanitaria o psicoterapia, los autores deben aportar información, tanto cualitativa como cuantitativa, sobre el mismo. La información cualitativa tiene que describir el contenido de cada sesión, cómo se realiza (individual o en grupo), el contenido de la información que recibe cada participante y que puede intercambiar con otros pacientes, así como los instrumentos utilizados para transmitir la información. Los datos cuantitativos se refieren al número de sesiones, duración de cada una, duración del componente principal de cada sesión y duración total de la intervención19. En un ensayo que evalúa un tratamiento no farmacológico, el grupo control puede recibir un placebo, otro tratamiento activo o los cuidados habituales. En este último caso, los autores deben describir, igualmente, todos los componentes de estos cuidados. Esta información permitirá a los lectores comparar la intensidad de los cuidados habituales con la del tratamiento en estudio, así como con la de los cuidados que se prestan habitualmente en su medio de trabajo. Al existir múltiples componentes y gran variabilidad entre los centros y los profesionales que prestan la atención, los investigadores deben tratar de estandarizar la intervención lo máximo posible, y sus esfuerzos para lograrlo es preciso que estén descritos en el artículo. En un ensayo clínico con una orientación pragmática, estos esfuerzos serán mínimos; mientras que si la actitud del estudio es explicativa, la estandarización será más estricta. Esta descripción es muy importante para que otros investigadores puedan replicar el estudio, o para que los lectores puedan poner en práctica la intervención. La publicación electróni-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ca permite publicar gran cantidad de información suplementaria, por lo que es recomendable remitir al lector interesado en todos los materiales a un apéndice de la propia revista o a una página web donde se encuentre esta información. Por último, deben describirse las técnicas empleadas, si las hay, para mejorar la adherencia de los profesionales a la intervención. Muchos de estos ensayos usan en el diseño alguna forma de agrupación de las unidades de asignación20. Como ya se ha comentado en el capítulo correspondiente a los ensayos clínicos con asignación por grupos, hay que tener en cuenta este tipo especial de asignación cuando se calcula el número de sujetos que es necesario incluir en el estudio. Por consiguiente, cuando un ensayo clínico con un tratamiento no farmacológico ha utilizado alguna agrupación de este tipo, debe especificarse cómo se ha abordado este hecho en el cálculo del tamaño de la muestra (ítem 7). El ítem 8 de la lista de comprobación está dedicado a la generación de la secuencia de asignación aleatoria. Además de describir los métodos usados para generarla, incluyendo los detalles sobre cualquier tipo de restricción (p. ej., estratificación o asignación por bloques), en los ensayos con intervenciones no farmacológicas hay que proporcionar información sobre cómo se asignaron los centros y los profesionales, cuando esta asignación se haya efectuado. La experiencia de los diferentes proveedores de cuidados sanitarios puede ser muy diferente, o un procedimiento puede ser más difícil de aplicar que otro. Si esto no se tiene en cuenta en la asignación, puede suceder que los grupos sean diferentes en cuanto a la experiencia de los profesionales o centros, pudiendo sesgar la estimación del efecto. Además, los profesionales suelen conocer qué intervención recibe cada paciente, y es posible que tengan preferencia por una de ellas, lo que también puede sesgar, de modo inconsciente, el resultado. La siguiente ampliación de las recomendaciones del grupo CONSORT hace referencia al empleo de técnicas de ciego (ítem 11). Además de especificar si se aplica alguna de estas técnicas a los participantes, a los que administran la intervención y a los que evalúan las variables de resultados, es necesario describir si las personas que han administrado alguna cointervención desconocían el grupo al que estaban asignados los participantes. Al igual que sucede al calcular el tamaño de la muestra, si se ha usado algún método de agrupación en la asignación de los participantes, profesionales o centros, este hecho condicionará el tipo de análisis estadístico. Si éste no tiene en cuenta este hecho, se producirá un sesgo en los resultados21. Por lo tanto, si se ha realizado alguna agrupación en la asignación, hay que especificar cómo se ha abordado este hecho en la fase de análisis (ítem 12). Entre las directrices del grupo CONSORT destaca la número 13, en la que se recomienda describir el flujo de pacientes a través del estudio mediante un diagrama. Se trata de describir el número de participantes asignados aleatoriamente a cada uno de los grupos, aquellos que reciben el tratamiento al que fueron asignados, los que completaron el protocolo de estudio, y los que fueron finalmente analizados. En el mismo gráfico hay que señalar el número de participantes que se desvían del protocolo, junto con los motivos. En la ampliación para los ensayos de tratamientos no farmacológicos se recomienda, además,

© Elsevier. Fotocopiar sin autorización es un delito.

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

especificar el número de profesionales o centros que realizan la intervención en cada grupo, así como el número de participantes tratados por cada profesional o en cada centro (v. fig. 12-1). En la ampliación para este tipo de estudios, los expertos consideraron necesario añadir un nuevo ítem relacionado con la forma en que se implementó tanto la intervención en estudio como la empleada en el grupo control. Aunque los investigadores hubieran tratado de estandarizar las intervenciones, posiblemente existan diferencias entre lo que se planificó y la forma en que finalmente se administraron. La información sobre cómo se administraron las intervenciones es crucial para poder evaluar los resultados. El ítem 15 se refiere a la información clínica y demográfica de los participantes al inicio del estudio. En los estudios con tratamientos no farmacológicos es importante, además, proporcionar información sobre los profesionales y centros que participan. Aunque parte de esta información puede estar contenida en los criterios de selección, es importante añadir información sobre los profesionales y centros donde se administra la intervención, que puede resumirse en una tabla. En la sección destinada a la discusión, además de interpretar los resultados en función de la hipótesis de partida, las posibles fuentes de sesgo o la imprecisión, en estos ensayos clínicos hay que tener en cuenta la elección del comparador, la falta total o parcial de enmascaramiento, y la diferente experiencia que puede haber entre centros y profesionales (ítem 20). En relación con la elección del comparador, debe tenerse en cuenta que el uso de placebo puede infravalorar el efecto del tratamiento. Tomemos como ejemplo un ensayo clínico sobre la eficacia de la acupuntura. El tratamiento tiene distintos componentes, además del uso de agujas, como el proceso de hablar con el paciente y escucharlo. Dentro de las sesiones de tratamiento, estos factores característicos son distintos, pero no distinguibles de otros elementos secundarios, como la empatía. Estos hechos tienen consecuencias importantes para el diseño de ensayos clínicos. Si se utiliza un placebo, una característica definitoria de los ensayos clínicos con una finalidad explicativa, se está asumiendo que el empleo de agujas es el único componente del tratamiento. Por lo tanto, los participantes en el grupo de control reciben todo excepto el uso de agujas. No obstante, si el tratamiento tiene otros componentes característicos, el uso de placebo puede subestimar el efecto terapéutico total. Un ensayo clínico con placebo sólo es apropiado para comparar dos técnicas de acupuntura, pero no para valorar el efecto total característico de la acupuntura22. Por último, la generalización de resultados debe discutirse a la luz de las diferencias entre este tipo de estudios y los que evalúan un tratamiento farmacológico. En un estudio sobre una intervención no farmacológica, el propio sistema sanitario, que puede suponer diferencias en el diagnóstico y manejo de los pacientes, la elección de los centros y profesionales participantes y la propia intervención son elementos determinantes de los resultados obtenidos, y, por tanto, también de su validez externa. Los autores deben especificar claramente en qué tipo de centros puede llevarse a la práctica la intervención evaluada, o bien si es aplicable en todos los centros.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

&/4":04$-Ê/*$0413"(.Ç5*$04 Al diseñar un ensayo clínico, deben tomarse múltiples decisiones, como cuál es el mejor comparador, qué criterios de selección deben utilizarse, cuál es la pauta de seguimiento más adecuada, etc. En general, en el diseño pueden adoptarse dos posturas: explicativa y pragmática (tabla 12-2). No se trata de actitudes contrapuestas, sino más bien de un continuum entre ellas. La actitud pragmática consiste en diseñar el estudio de tal modo que se favorezca la aplicabilidad de los resultados, mientras que los investigadores que adoptan una actitud explicativa tratan de evaluar si una intervención causa un determinado efecto en condiciones ideales23. La actitud explicativa consiste en establecer criterios de selección muy estrictos, que definan una población muy homogénea, con escasa variabilidad, con buen cumplimiento, en la que sea más fácil obtener datos de calidad y en la que haya una mayor probabilidad de encontrar un efecto o asociación si existe. Esta actitud tiene algunos inconvenientes, ya que si los criterios son muy estrictos, puede no encontrarse un número suficiente de sujetos, o no detectarse un efecto en un determinado subgrupo, al no haberse considerado antes. Además, dado que se ha incluido una población altamente seleccionada, se dificulta la generalización o extrapolación de los resultados. En concreto, ésta es una de las principales limitaciones de los ensayos clínicos, tal como se

Tabla 12-2. Actitud explicativa y actitud pragmática en el diseño de un ensayo clínico aleatorizado Actitud explicativa

Actitud pragmática

Finalidad

Aumentar el conocimiento científico

Ayudar en las decisiones

Objetivo

Eficacia

Efectividad

Condiciones de realización

«De laboratorio»

«De consulta»

Intervención de referencia

Habitualmente placebo

A menudo «cuidados habituales» u otra intervención activa

Dosis del tratamiento

Fija

A menudo variable

Tratamientos concomitantes

Se evitan

A menudo se permiten

Variable de respuesta

Acción farmacológica

Efecto terapéutico

Técnicas de enmascaramiento

Habitualmente el doble ciego es obligatorio

A menudo no, dependiendo de la naturaleza de la intervención. Suele ser recomendable la evaluación ciega de la respuesta

Muestra de sujetos

Homogénea Cumplidora

Heterogénea Representativa

Criterios de selección

Restrictivos

Amplios

Período de preinclusión

En ocasiones

No

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

realizan habitualmente, cuando quieren utilizarse como base para la elaboración de recomendaciones terapéuticas. En cambio, la actitud pragmática consiste en establecer unos criterios de selección amplios, que definan una población heterogénea, más representativa de la población general o de la que es atendida habitualmente. Su inconveniente es que se pierde cierto grado de control sobre la situación y puede diluirse o enmascararse una asociación o efecto existentes, por lo que se complica la interpretación de los resultados. La adopción de una u otra perspectiva dependerá de la propia actitud del investigador y del objetivo concreto que se desee alcanzar.

© Elsevier. Fotocopiar sin autorización es un delito.

3FDPNFOEBDJPOFTQBSBMBQVCMJDBDJwO Al igual que sucede con las otras extensiones elaboradas por el grupo CONSORT, las recomendaciones para la publicación de los ensayos clínicos pragmáticos son fruto de una reunión de consenso entre investigadores clínicos, epidemiólogos, estadísticos y editores de revistas. Los participantes en el consenso estuvieron de acuerdo en que no era necesario añadir ningún nuevo ítem ni modificar el diagrama de flujo de los pacientes, y que las recomendaciones originales del grupo CONSORT eran plenamente aplicables a los estudios pragmáticos, pero debían ampliarse ocho ítems (tabla 12-3). También decidieron no hacer ninguna referencia a la actitud pragmática del ensayo ni en el título ni en el resumen, ya que ello supondría reforzar la creencia de que existe una dicotomía entre los estudios con orientación explicativa y los que tienen una orientación más pragmática. En los antecedentes y justificación del estudio (ítem 2) se debe describir el problema de salud o de organización de servicios sanitarios que la intervención aborda, y qué otras intervenciones están al alcance de los profesionales sanitarios para tratar este problema. Esta descripción debe incorporar el emplazamiento y el contexto en el que se realiza el estudio. Esto permitirá a los lectores valorar si el problema y la situación que se presenta son similares. Es conveniente que los autores especifiquen en la introducción que la orientación del estudio es pragmática y que justifiquen esta elección. Los criterios de selección deben explicitar hasta qué punto se incluyen pacientes típicos y, cuando sea necesario, si los profesionales y centros que atienden a estos pacientes también son típicos (ítem 3). Para los lectores, esta información es necesaria porque, si los criterios son muy restrictivos, y los profesionales y centros son muy seleccionados, los resultados serán poco aplicables en su entorno24. En relación con las intervenciones (ítem 4), conviene describirlas con detalle, tanto la de estudio como la utilizada como comparación, indicando los esfuerzos realizados para estandarizarlas, o bien si las intervenciones y la forma en cómo se administraron podían variar en función de los pacientes, los profesionales o los centros25. Las variables de resultado han de ser relevantes para los participantes y para los clínicos y gestores que deben tomar las decisiones. Es preciso describir con sumo detalle estas variables, así como los métodos utilizados para aumentar la calidad de las mediciones (ítem 6). La ampliación propuesta para este ítem

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 12-3. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico pragmático Punto n.º Título y resumen

Descriptor estándar CONSORT

Extensión para los ensayos pragmáticos

1

Cómo se asignaron los pacientes a las intervenciones (p. ej., «asignación aleatoria» o «aleatorizado»)

2

Antecedentes científicos y razón de ser del estudio

Describir el problema o el servicio sanitario que la intervención trata de analizar y otras intervenciones que pueden ser útiles para abordar este problema

Participantes

3

Criterios de selección de pacientes y ámbito y lugares en que se recogieron los datos

Criterios de selección explícitamente dirigidos a mostrar el grado en que se incluyen participantes típicos y/o, si es aplicable, profesionales, instituciones y emplazamientos típicos

Intervenciones

4

Detalles precisos de las intervenciones pretendidas para cada grupo y cómo y cuándo fueron efectivamente administradas

Describir los recursos que se han añadido (o retirado) a los emplazamientos habituales con el fin de implementar la intervención. Indicar los esfuerzos realizados para estandarizar la intervención o bien si se permitió que existiera variabilidad en la intervención y la forma en que se administró Describir el comparador con el mismo grado de detalle

Objetivos

5

Objetivos e hipótesis específicos

Resultados

6

Definición clara de las medidas de los resultados principal y secundarios y, cuando proceda, de cualquier método utilizado para mejorar la calidad de las medidas (p. ej., observaciones múltiples, entrenamiento de evaluadores)

Tamaño muestral

7

Cómo se determinó el tamaño muestral y, cuando proceda, explicación de cualquier análisis intermedio y reglas de interrupción del ensayo

8

Método utilizado para generar la secuencia de asignación aleatoria, incluyendo detalle sobre cualquier restricción (p. ej., bloques, estratificación)

Introducción Antecedentes

Métodos

Si se calculó usando la mínima diferencia clínicamente relevante, informar de dónde procede la información sobre esta diferencia

Aleatorización Generación de la secuencia

Continúa

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

Tabla 12-3. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico pragmático (cont.) Punto n.º

Descriptor estándar CONSORT

Asignación oculta

9

Método utilizado para implementar la secuencia de asignación aleatoria (p. ej., contenedores de medicación numerados, aleatorización centralizada por teléfono), clarificando si la secuencia se mantuvo oculta hasta el momento de la asignación

Implementación

10

Quién generó la secuencia de asignación, quién incluyó a los participantes y quién los asignó a los grupos

Ciego (enmascaramiento)

11

Si los participantes, quienes administraron las intervenciones o quienes evaluaron los resultados conocían o no la intervención asignada. Si no, cómo se evaluó el éxito del enmascaramiento

Métodos estadísticos

12

Métodos estadísticos empleados para comparar los grupos en cuanto al resultado principal; métodos utilizados en análisis adicionales, como análisis de subgrupos o análisis ajustados

Flujo de participantes

13

Flujo de participantes a través de cada estadio (se recomienda un diagrama). Específicamente, para cada grupo, documentar los números de participantes asignados aleatoriamente, que recibieron el tratamiento pretendido, que completaron el protocolo del estudio y que fueron incluidos en el análisis del resultado principal. Describir las desviaciones del protocolo planificado, y los motivos

Reclutamiento

14

Fechas que limitan los períodos de reclutamiento y de seguimiento

Datos basales

15

Características demográficas y clínicas basales en cada grupo

Extensión para los ensayos pragmáticos

Si no se realizó enmascaramiento, o no fue posible, explicar los motivos

© Elsevier. Fotocopiar sin autorización es un delito.

Resultados Informar sobre el número de participantes o unidades a las que se ha ofrecido participar, el número que cumplía con los criterios de selección y los motivos para no participar

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 12-3. Lista-guía de puntos que deben incluirse en el informe de un ensayo clínico pragmático (cont.) Punto n.º

Descriptor estándar CONSORT

Números analizados

16

Número de participantes (denominador) de cada grupo incluidos en cada análisis, y si el análisis se realizó «por intención de tratar». Expresar los resultados mediante números absolutos cuando sea factible (p. ej., «10/20» en lugar de «50%»)

Resultados y estimación

17

Para cada resultado principal y secundario, un resumen de resultados por grupo y el efecto estimado y su precisión (p. ej., IC del 95%)

Análisis auxiliares

18

Considerar la multiplicidad, informando sobre cualquier otro análisis realizado, incluyendo análisis de subgrupos y análisis ajustados, indicando los preespecificados y los exploratorios

Eventos adversos

19

Todos los eventos adversos o efectos colaterales importantes en cada grupo de intervención

Interpretación

20

Interpretación de los resultados, teniendo en cuenta las hipótesis del estudio, las fuentes de sesgo o imprecisión potenciales y los peligros asociados a la multiplicidad de análisis y de resultados

Generalización

21

Generalización (validez externa) de los hallazgos del ensayo

Evidencia global

22

Interpretación general de los resultados en el contexto de la evidencia actual

Extensión para los ensayos pragmáticos

Discusión

Describir los puntos clave del emplazamiento que determinó los resultados del estudio. Discutir posibles diferencias con otros emplazamientos, profesionales o recursos

consiste en explicar y justificar la elección de estas variables y, cuando sea relevante, la duración del seguimiento. El ítem 7 aborda los métodos usados para calcular el número de pacientes necesario para llevar a cabo el estudio. En el supuesto de que se haya hecho

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

usando la mínima diferencia considerada clínicamente importante, hay que informar a los lectores sobre cómo se determinó este valor. Dado que su magnitud puede variar según el emplazamiento del estudio, es necesario que los lectores conozcan quién tomó la decisión sobre el valor de esta diferencia y en función de qué información. En los estudios pragmáticos puede ser difícil enmascarar los tratamientos (ítem 11). Además, en la práctica habitual, ni los pacientes ni los médicos desconocen el tratamiento que están tomando o prescribiendo y, por tanto, si no se emplea ninguna técnica de enmascaramiento, el estudio se acerca más a las condiciones reales de aplicación del tratamiento. De todos modos, en los estudios pragmáticos es posible, casi siempre, enmascarar a las personas que evalúan la(s) variable(s) de respuesta. Los investigadores deben informar del número de personas a las que se les ofreció participar en el estudio, el número de las que resultaron elegibles, y los motivos para no participar (ítem 13). De hecho, esta información ya se solicita en las recomendaciones de otros ensayos clínicos, pero los participantes en la reunión de consenso quisieron enfatizar que, en este tipo de estudios, es todavía más importante proporcionar dicha información. Al interpretar los resultados, y en concreto su aplicabilidad (ítem 21), los autores deben describir las características del emplazamiento donde se ha efectuado el estudio y que pueden influir sobre los resultados. Deben discutir las posibles diferencias que se observarían en los resultados si la intervención se aplicara en otros entornos con una formación diferente de los recursos humanos o con una distinta organización de los servicios sanitarios.

© Elsevier. Fotocopiar sin autorización es un delito.

3&4Ò.&/&4%&&/4":04$-Ê/*$04 Aunque la declaración CONSORT describe la información que debe constar en cada uno de los apartados de un artículo que presenta un ensayo clínico1, confiere escasa atención al resumen, indicando tan sólo que debe indicar el método de asignación de los participantes a los grupos de estudio para facilitar su indexación e identificación como ensayo clínico, y recomendando que siga un formato estructurado. El resumen de un ensayo clínico es muy importante. La mayoría de los lectores suelen basar su evaluación inicial del estudio en la información presentada en el resumen, antes de decidir buscar y leer en profundidad el artículo completo. Incluso en muchas ocasiones, por falta de tiempo o por problemas de disponibilidad y accesibilidad del texto completo, pueden tomar una decisión en su práctica clínica utilizando exclusivamente la información del resumen. Por otro lado, los resúmenes de las comunicaciones presentadas en conferencias, congresos y jornadas científicas son frecuentemente la única información disponible sobre algunos estudios para la mayoría de profesionales. Aunque es habitual que tanto las revistas como las publicaciones de los resúmenes de los congresos científicos utilicen resúmenes estructurados, si bien con un número y denominación variables de los epígrafes, la calidad de la información que contienen suele ser bastante deficiente.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

3FDPNFOEBDJPOFTQBSBMBQVCMJDBDJwO Los resúmenes deberían elaborarse cuidadosamente e incluir la información necesaria sobre la metodología, la ejecución y los resultados de los ensayos clínicos —y, en general, de cualquier estudio— para permitir la evaluación de su validez y de la aplicabilidad de sus resultados, así como facilitar la identificación y recuperación de los artículos en las bases de datos. Hopewell et al.11 tuvieron la iniciativa de desarrollar una extensión de la declaración CONSORT para los resúmenes de los ensayos clínicos, tanto de los correspondientes a artículos originales como de las comunicaciones presentadas en congresos científicos. Esta extensión consiste en una lista formada por los ítems principales relacionados con las características y resultados del ensayo que los autores deberían incluir en el resumen (tabla 12-4). Para confeccionarla, partieron de una amplia lista previa de los ítems posibles, que fue posteriormente reducida mediante un proceso de consenso que utilizó la metodología Delphi, en el que participaron profesionales de diferentes perfiles relacionados con la realización y publicación de la investigación clínica. Los resultados de esta selección fueron después discutidos en una reunión de trabajo del grupo CONSORT con la finalidad de obtener una lista final bastante reducida y limitada a los aspectos más relevantes, que deberían poder ser incluidos en las 250-300 palabras en que habitualmente se fija la extensión máxima de los resúmenes. Esta lista se refiere a la comunicación de un ensayo clínico aleatorizado paralelo, que es el diseño más habitual. Si el estudio tiene otras características (ensayo de equivalencia o no inferioridad, asignación por grupos, ensayo factorial, utilización de variables compuestas o combinadas, etc.), lógicamente se requerirá información adicional. Como es lógico, en líneas generales, los ítems incluidos en la lista forman parte de los recomendados en la declaración CONSORT. Sin embargo, existen algunos aspectos específicos de la información de los resúmenes que cabe resaltar (v. tabla 12-4). El título debe identificar el estudio como ensayo clínico aleatorizado para permitir su indexación y recuperación adecuadas en las bases de datos electrónicas. Cuando el resumen corresponde a una comunicación presentada en un congreso o jornada científica, es importante que se incluyan los datos de contacto del autor responsable de la correspondencia. Dado que, aproximadamente en la mitad de los casos, estos ensayos no son publicados en forma completa26, en muchas ocasiones este resumen puede ser la única información disponible sobre el estudio. Por ello, es necesario disponer de los datos que permitan contactar con el investigador para poder obtener información adicional o complementaria sobre los diferentes aspectos del ensayo. La descripción del diseño también es importante, informando si se trata de un ensayo paralelo, cruzado o factorial, si es un estudio de superioridad, de equivalencia o de no inferioridad, o si se ha realizado una asignación por grupos, por ejemplo. Esta descripción ha de facilitar la correcta indexación del estudio en las bases de datos y ayudar a los lectores a interpretar adecuadamente los resultados.

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

Tabla 12-4. Lista-guía de puntos que deben incluirse en el resumen de un ensayo clínico Ítem

Descripción

Título

Identificación del estudio como ensayo clínico aleatorizado

Autores*

Datos de contacto del autor responsable de la correspondencia

Diseño del ensayo

Descripción del diseño del ensayo (p. ej., paralelo, asignación por grupos, no inferioridad, etc.)

Métodos Participantes

Criterios de elección de los participantes, así como dispositivos y servicios donde se recogieron los datos

Intervenciones

Intervenciones para cada grupo

Objetivo

Objetivo específico o hipótesis

Variable de resultado

Definición clara de la medida principal de los resultados para este informe

Asignación aleatoria

Método usado para asignar los participantes a las intervenciones

Ciego (enmascaramiento)

Si los participantes, los que administraron la intervención, y los que evaluaron los resultados fueron ciegos a la asignación de los grupos

Resultados Números aleatorizados

Número de pacientes asignados aleatoriamente a cada grupo

Reclutamiento

Situación del ensayo

Números analizados

Número de pacientes analizados en cada grupo

Resultados

Para la variable primaria, resultado en cada grupo, así como el tamaño estimado del efecto y su precisión

Eventos adversos

Efectos adversos o colaterales importantes

Conclusiones

Interpretación general de los resultados

Registro del ensayo

Número de registro y nombre del registro de ensayos

Financiación

Fuente de financiación

© Elsevier. Fotocopiar sin autorización es un delito.

*Ítem específico para los resúmenes de comunicaciones a congresos y jornadas científicas.

La descripción de la metodología debe incluir los principales criterios de selección de los participantes, así como el emplazamiento en que se ha realizado el estudio, aspectos importantes para evaluar la validez externa de los resultados y su aplicabilidad a diferentes contextos. También debe describir la intervención que recibe cada uno de los grupos, y el objetivo e hipótesis del ensayo. Asimismo, debe identificarse con claridad la variable que se ha utilizado como medida del resultado principal del ensayo. Si los resultados corresponden a análisis intermedios o a variables secundarias, como suele ocurrir en comunicaciones a congresos, debe informarse explícitamente, indicando el marco temporal a que se refieren y recordando cuál es la variable principal del estudio. Los resúmenes suelen describir insuficientemente los aspectos relacionados con el método de asignación de los participantes a las intervenciones que se comparan, la ocultación de la secuencia de aleatorización o el uso de procedi-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

mientos de enmascaramiento, tanto de los participantes y/o los investigadores como de las personas que evalúan la respuesta27. Estos aspectos son muy importantes para la evaluación de la validez interna del ensayo, por lo que deben describirse cuidadosamente. Entre los ítems relacionados con los resultados del estudio, dado que el resumen no incluye la figura con el flujo de participantes del ensayo, es necesario indicar claramente el número total de pacientes que han sido asignados a cada uno de los grupos, así como el de los que son analizados, para que los lectores puedan evaluar si se ha tenido en cuenta el grupo al que fueron inicialmente asignados y si se ha utilizado la estrategia de análisis adecuada. Estos aspectos pueden ser especialmente importantes en los resúmenes de conferencias y congresos, dado que con frecuencia presentan resultados de análisis intermedios. Por ello, también es importante, especialmente en este último caso, informar con claridad de la situación del ensayo, indicando si todavía está en marcha, si se ha finalizado el reclutamiento, si todavía no ha acabado el seguimiento o si se ha finalizado el ensayo prematuramente. Deben describirse los principales hallazgos del estudio, presentando un resultado sintético de cada grupo y de la comparación entre grupos, con la estimación de la magnitud del tamaño del efecto observado y su precisión. En caso de que los resultados se refieran a variables secundarias, deberían presentarse los suficientes datos de la variable principal para permitir su interpretación en el contexto adecuado. Es importante incluir también una descripción sintética de los efectos adversos e inesperados observados, y si no se han producido, informar explícitamente de ello. La conclusión debe ser compatible con los hallazgos del estudio y tomar en consideración tanto los beneficios como los perjuicios de las intervenciones, así como comentar los aspectos relacionados con su aplicación clínica. Los dos ítems finales son especialmente importantes. En primer lugar, debe aportarse información sobre el registro del ensayo. Debido a los problemas relacionados con la publicación incompleta de los ensayos28, la publicación múltiple, redundante o fragmentada, o la omisión de datos en los artículos, especialmente si pasan inadvertidos al realizar las revisiones sistemáticas, se ha insistido en la necesidad de registrar la información básica de los protocolos de los ensayos clínicos y de asignarles un número de registro único. De hecho, desde 2004, el ICMJE recomienda que solamente se consideren para la publicación los ensayos que hayan sido adecuadamente registrados antes de incluir el primer paciente29. La información sobre el registro puede ser especialmente importante en los resúmenes de comunicaciones a congresos, ya que puede ayudar a los lectores a obtener información más detallada del estudio, a la vez que permite identificar las publicaciones posteriores de resultados del mismo ensayo evitando que los datos sean considerados en más de una ocasión en las revisiones sistemáticas. Finalmente, es necesario aportar información sobre la fuente de financiación para ayudar a los lectores a evaluar los ensayos. Esta información es importante ya que los ensayos financiados por la industria farmacéutica obtienen resultados favorables al promotor con mucha mayor frecuencia que los financiados por otras fuentes30.

053"4&95&/4*0/&4%&-"%&$-"3"$*Î/$0/4035

#*#-*0(3"'Ê" 1.

2. 3.

4. 5.

6.

7.

8.

9.

10.

11.

12. 13.

© Elsevier. Fotocopiar sin autorización es un delito.

14.

15.

16. 17. 18. 19.

Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne DG, et al. The revised CONSORT statement for reporting randomized trials: explanation and elaboration. Ann Intern Med. 2001;134:663-94. Davidoff F. News from the International Committee of Medical Journal Editors. Ann Intern Med. 2000;133:229-31. Plint AC, Moher D, Morrison A, Schulz K, Altman DG, Hill C, et al. Does the CONSORT checklist improve the quality of reports of randomised controlled trials? A systematic review. Med J Aust. 2006;185:263-7. Campbell MK, Elbourne DR, Altman DG. CONSORT statement: Extension to cluster randomised trials. BMJ. 2004;328:702-8. Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ. Reporting of non-inferiority and equivalence randomized trials: An extension of the CONSORT statement. JAMA. 2006;295:1152-60. Zwarenstein M, Treweek S, Gagnier JJ, Altman DG, Tunis S, Haynes B, et al., on behalf of the CONSORT and Pragmatic Trials in Healthcare (Practihc) groups. Improving the reporting of pragmatic trials: An extension of the CONSORT statement. BMJ. 2008;337:a2390. Gagnier JJ, Boon H, Rochon P, Moher D, Barnes J, Bombardier C. Reporting randomized, controlled trials of herbal interventions: An elaborated CONSORT statement. Ann Intern Med. 2006;144:364-7. Boutron I, Moher D, Altman DG, Schulz KF, Ravaud P, the CONSORT Group. Reporting of non-pharmacological treatment interventions: An extension of the CONSORT statement. Ann Intern Med. 2008;w60-66. Boutron I, Moher D, Altman DG, Schulz KF, Ravaud P, the CONSORT Group. Extending the CONSORT statement to trials reporting non-pharmacological treatments: Extension and elaboration. Ann Intern Med. 2008;148:295-309. Ioannidis JP, Evans SJ, Gotzsche PC, O’Neill RT, Altman DG, Schulz K, et al. Better reporting of harms in randomized trials: An extension of the CONSORT statement. Ann Intern Med. 2004;141:781-8. Hopewell S, Clarke M, Moher D, Wager E, Middleton P, Altman DG, et al., and the CONSORT Group (2008). CONSORT for reporting randomized controlled trials in journal and conference abstracts: Explanation and elaboration. PLoS Med. 2008;5(1):e20. doi:10.1371/journal.pmed.0050020. Hopewell S, Clarke M, Moher D, Wager E, Middleton P, Altman DG, et al. CONSORT for reporting randomised trials in journal and conferences abstracts. Lancet. 2008;371:281-3. Chan AW, Altman DG. Epidemiology and reporting of randomised trials published in PubMed journals. Lancet. 2005;365:1159-62. Boutron I, Tubach F, Giraudeau B, Ravaud P. Blinding was judged more difficult to achieve and maintain in non-pharmacologic than pharmacologic trials. J Clin Epidemiol. 2004;57:543-50. Boutron I, Guittet L, Estellat C, Moher D, Hróbjartsson A, Ravaud P. Reporting methods of blinding in randomized trials assessing non-pharmacological treatments. PLoS Med. 2007;4:61. Hopewell S, Clarke M. Abstracts presented at the American Society of Clinical Oncology conference: How completely are trials reported? Clin Trials. 2005;2:265-8. Hopewell S, Clarke M, Askie L. Reporting of trials presented in conference abstracts needs to be improved. J Clin Epidemiol. 2006;59:681-4. Halm EA, Lee C, Chassin MR. Is volume related to outcome in health care? A systematic review and methodologic critique of the literature. Ann Intern Med. 2002;137:511-20. Glasziou P, Meats E, Heneghan C, Shepperd S. What is missing from descriptions of treatment in trials and reviews? BMJ. 2008;336:1472-4.

20. 21. 22. 23. 24.

25. 26.

27. 28.

29.

30.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM Roberts C, Roberts SA. Design and analysis of clinical trials with clustering effects due to treatment. Clin Trials. 2005;2:152-62. Lee KJ, Thompson SG. Clustering by health professional in individually randomised trials. BMJ. 2005;330:142-4. Paterson C, Dieppe P. Characteristic and incidental (placebo) effects in complex interventions such as acupuncture. BMJ. 2005;330:1202-5. Argimon JM, Jiménez-Villa J. Métodos de investigación clínica y epidemiológica. 3.ª ed. Madrid: Elsevier; 2004. Van Spall HG, Toren A, Kiss A, Fowler RA. Eligibility criteria of randomized controlled trials published in high-impact general medical journals: A systematic sampling review. JAMA. 2007;297:1233-40. Hawe P, Shiell A, Riley T. Complex interventions: How «out of control» can a randomised controlled trial be? BMJ. 2004;328:1561-3. Scherer RW, Langenberg P, von Elm E. Full publication of results initially presented in abstracts (Cochrane Methodology Review). The Cochrane Database of Methodology Reviews. Art. No.: MR000005.pub2. DOI:10.1002/14651858.MR000005.pub2. Hopewell S, Clarke M. Abstracts presented at the American Society of Clinical Oncology conference: How completely are trials reported? Clin Trials. 2005;2:265-8. Chan AW, Hrobjartsson A, Haahr MT, Gotzsche PC, Altman DG. Empirical evidence for selective reporting of outcomes in randomized trials: Comparison of protocols to published articles. JAMA. 2004;291:2457-65. De Angelis CD, Drazen JM, Frizelle FA, Haug C, Hoey J, Horton R, et al. Is this clinical trial fully registered? A statement from the International Committee of Medical Journal Editors. Lancet. 2005;365:1827-9. Lexchin J, Bero LA, Djulbegovic B, Clark O. Pharmaceutical industry sponsorship and research outcome and quality: Systematic review. BMJ. 2003;326:1167-70.

&TUVEJPTFQJEFNJPMwHJDPT &'FSOgOEF[

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ En una definición ya clásica, se define la epidemiología como «el estudio de la distribución de la enfermedad y de los determinantes de su prevalencia en el hombre»1. No es ésta, sin embargo, la única definición, pues casi cada autor en su correspondiente manual ha elaborado una definición de epidemiología. La más reciente edición del Diccionario de Epidemiología define la disciplina como «el estudio del acontecimiento y distribución de estados relacionados con la salud o sucesos en poblaciones específicas, incluyendo el estudio de los determinantes que influyen sobre dichos estados, y la aplicación de este conocimiento para el control de los problemas de salud»2. La epidemiología es un cuerpo cambiante de conocimientos, una metodología y una forma de pensar. La epidemiología como disciplina científica dispone de un conjunto de sistemas de hipótesis y conocimientos (el método epidemiológico y la secuencia epidemiológica3) y sirve como ciencia básica para la salud pública, para la medicina preventiva y para la medicina clínica. El denominador común en la epidemiología es el continuo salud-enfermedad en la población. Una población puede definirse tanto en términos geográficos (los habitantes de una ciudad) como de otra naturaleza, como, por ejemplo, un grupo específico de trabajadores, o de pacientes con una determinada enfermedad, o ciudadanos nacidos en un determinado año, o unos determinados usuarios de los servicios sanitarios. La epidemiología y sus métodos se han utilizado y se siguen utilizando de muchas formas4. Los estudios epidemiológicos han servido para conocer las causas de las enfermedades, tanto de las transmisibles (que fueron el principal objeto de estudio de la epidemiología en la primera mitad del siglo XX) como de las denominadas «enfermedades crónicas» (el cáncer y las enfermedades cardiovasculares, principalmente, durante la segunda mitad del siglo XX). La epidemiología no sólo ha tratado de identificar los agentes causales de multitud de enfermedades, sino también las pertinentes intervenciones preventivas encaminadas a la promoción de la salud. El estudio de la etiología de las enfermedades ha ido de la mano del estudio de la evolución y el resultado final de las enfermedades (es decir, la «historia natural» de la enfermedad), tanto en las personas como en los grupos de perso-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

nas (poblaciones). En este sentido, se ha definido la epidemiología clínica como la aplicación de los conocimientos, la metodología y el razonamiento epidemiológicos a los problemas de la medicina clínica5, con el objetivo de ayudar al médico a resolver los problemas de salud de sus pacientes, interpretar la información clínica y mejorar la calidad de su investigación6. La epidemiología se utiliza para describir el estado de salud de la población. Para las autoridades sanitarias es muy importante conocer la carga de enfermedad en la población, para la planificación, la priorización y la asignación de recursos sanitarios. Además, la epidemiología se está utilizando para evaluar la efectividad y eficiencia de los servicios sanitarios en su más amplio sentido (desde la efectividad de un programa de cribado, la eficiencia de un determinado tratamiento o el impacto sobre la salud pública de una determinada política social). Las aplicaciones de la epidemiología tienen como objeto proporcionar respuestas válidas y oportunas a las cuestiones sobre la comprensión y mejora de los problemas de salud de la población. Las preguntas que se pueden intentar responder desde, o a través de la epidemiología, se refieren a la importancia de los problemas de salud y a la posibilidad de modificarlos: qué frecuencia y qué tendencia presenta una determinada enfermedad, qué características de utilización y de accesibilidad presentan las prestaciones sanitarias, qué intervenciones preventivas son efectivas, qué beneficio para el sistema sanitario representa la modificación de una determinada pauta diagnóstica o terapéutica, etc. Para responder a estas preguntas, la epidemiología ha desarrollado una metodología propia basada, no en la experimentación, sino en la observación, puesto que «experimentar», en el sentido estricto de la palabra, con poblaciones (p. ej., asignar una potencial exposición cancerígena a un grupo de personas y a otro grupo no, para medir la incidencia de un determinado tipo de tumor) no es ético. Los diseños epidemiológicos definen, por tanto, estudios observacionales (o no experimentales) basados en el tipo de muestreo que se hace de las poblaciones. El tipo de diseño epidemiológico responderá por tanto a la pregunta o preguntas que los investigadores se hagan de la población y de la condición (enfermedad, factor de riesgo o preventivo, actividad asistencial, etc.) objeto de estudio7. En la tabla 13-1 se resumen algunas de las preguntas contestables y los diseños epidemiológicos más apropiados para hacerlo, y en la tabla 13-2 se presentan las ventajas e inconvenientes de los tres principales diseños observacionales en epidemiología. Por todo ello, los estudios epidemiológicos per se están sujetos a diferentes tipos de errores sistemáticos o sesgos que afectan a su validez interna, y también pueden presentar el fenómeno de la confusión. Por estos y otros factores puede verse afectada la generabilidad de los resultados. En demasiadas ocasiones se ha sacralizado «la letra impresa», es decir, se da por válido y relevante cualquier información que venga avalada por el peer review de una prestigiosa (o no tan prestigiosa) revista. Puede tratarse tanto de investigación epidemiológica como clínica, que en muchas ocasiones puede suponer cambios para la práctica clínica, para la provisión de servicios sanitarios o para la salud pública en general. Es más que evidente que no se puede «dudar» de todo lo

&456%*04&1*%&.*0-Î(*$04

Tabla 13-1. Los objetivos de las investigaciones y los tipos de diseño epidemiológicos para su investigación Objetivos del estudio

Diseño(s) más apropiado(s)

Generar hipótesis sobre la influencia de factores protectores de la salud

Estudios ecológicos Estudios transversales y longitudinales (cohortes)

Contrastar hipótesis estadísticas simples (de conformidad) sobre la frecuencia de problemas de salud y de sus determinantes

Estudios transversales

Contrastar hipótesis de asociación entre variables explicables y explicativas

Estudios longitudinales Estudios de casos y controles

Contrastar potencialmente hipótesis teóricas (causales) etiológicas y evaluativas

Estudios experimentales Estudios longitudinales Estudios de casos y controles

Asesorar sobre el impacto de una intervención sobre la salud de una población diana

Estudios cuasi experimentales Estudios ecológicos

Asesorar sobre las necesidades de servicios sanitarios en una población diana

Estudios transversales Estudios ecológicos repetidos

Tabla 13-2. Principales ventajas e inconvenientes de los estudios transversales, de cohortes, y de casos y controles

© Elsevier. Fotocopiar sin autorización es un delito.

Diseño

Ventajas

Inconvenientes

Estudio transversal

Representatividad de la población Metodología estándar, elevada validez interna y repetibilidad Coste-efectivo

Adimensionalidad temporal que imposibilita la interpretación en términos de causalidad Poco eficiente cuando las exposiciones o las condiciones estudiadas tienen una baja prevalencia

Estudio longitudinal o de cohortes

Clara secuencia temporal causaefecto Permite evaluar múltiples exposiciones y condiciones Medida de la exposición previa a la medida del efecto Informa de la densidad de incidencia y permite el cálculo de diferentes medidas de asociación

Necesita de un elevado número de participantes seguidos durante un largo período de tiempo Poco adecuado para condiciones que tengan una baja incidencia Necesita de numerosos recursos económicos

Estudio de casos y controles

Puede realizarse con un relativo pequeño tamaño muestral Apropiado para enfermedades o condiciones raras Permite evaluar múltiples exposiciones Ejecución relativamente rápida y económica

Sesgos en la selección de los grupos de controles (y de casos) Sesgos en la información recogida sobre las exposiciones Característica retrospectiva de la información sobre las exposiciones

que cae en nuestras manos, pero sería incluso más peligroso aceptarlo todo sin evaluación crítica. Cuando tengamos en nuestras manos un artículo (original) que vayamos a incorporar a nuestro «cuerpo de conocimiento» —porque lo vamos a utilizar como antecedente de nuestra investigación, porque

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

puede determinar nuestra práctica profesional— es acertado plantearse una duda razonable y ser sistemáticos y críticos en la lectura de ese artículo. Debemos utilizar, en la medida de lo posible, una serie de criterios que nos ayuden a discernir acerca de si los resultados o las evidencias presentadas son válidos, es decir, próximos a la verdad, y para decidir si los resultados son importantes. La comunicación errónea, incompleta o poco adecuada de la investigación en la literatura médica es un importante problema para la interpretación y traslación de los resultados de la investigación en la práctica de la medicina y de la salud pública basada en evidencias. La investigación se debe comunicar de manera transparente y de forma que los lectores puedan seguir todo el proceso de la investigación, incluyendo cómo fue planificada, cómo se realizó, qué se encontró y cuáles fueron las conclusiones que se derivaron del estudio. La credibilidad de la investigación depende de la evaluación crítica realizada por otros expertos acerca de las fortalezas y debilidades del diseño, de la realización del estudio y del análisis. Sin embargo, en los estudios observacionales publicados a menudo falta información importante, o bien no queda suficientemente clara.

%&$-"3"$*Î/4530#&0#+&5*704:"1-*$"$*Î/ La preocupación por mejorar la comunicación de los estudios epidemiológicos con el referente del impacto positivo de la declaración CONSORT llevó a un grupo de epidemiólogos, metodólogos y bioestadísticos a configurar las bases de la declaración STROBE (STrengthening the Reporting of OBservational studies in Epidemiology). La declaración STROBE (http://www.strobe-statement. org) está constituida por una lista de 22 puntos esenciales que hay que tener en cuenta en la publicación de estudios observacionales realizados con los tres diseños más importantes de la epidemiología analítica observacional: los estudios de cohortes, los estudios de casos y controles y los estudios transversales. En este capítulo recogemos la declaración STROBE, que es de libre acceso en inglés8-11 y en castellano12,13. Existe también una explicación exhaustiva de la declaración publicada por sus autores14,15. Sus objetivos son, pues, facilitar una correcta valoración de las aportaciones del estudio al lector, pero también a los editores y a los revisores implicados en el proceso editorial. No pretende ser un instrumento de medida de la calidad de la publicación —como sí lo son las escalas recopiladas por Sanderson16—, sino de ayuda a mejorar la comunicación científica de los estudios observacionales.

%&$-"3"$*Î/4530#&-*45"%&$0.130#"$*Î/ %&16/504&4&/$*"-&4 La lista de comprobación STROBE se refiere a artículos publicados con los resultados derivados de estudios de cohortes, estudios de casos y controles y estudios transversales, que son los principales tipos de estudios observaciona-

&456%*04&1*%&.*0-Î(*$04

les. La lista de comprobación (tabla 13-3) contiene, para cada uno de los tres diseños, 22 ítems organizados según la estructura ya clásica «IMRD» (Introducción, Métodos, Resultados y Discusión) de los artículos científicos, además de un primer apartado dedicado al título y el resumen. Como ya hemos comentado, no se trata de una guía para diseñar estudios (de eso se ocupan los textos de epidemiología), ni de unas recetas para mejorar Tabla 13-3. Declaración STROBE: lista de puntos esenciales que deben ser descritos en la publicación de estudios epidemiológicos Punto

Recomendación

Título y resumen 1

(a) Indique, en el título o en el resumen, el diseño del estudio con un término habitual (b) Proporcione en el resumen una sinopsis informativa y equilibrada de lo que se ha hecho y lo que se ha encontrado

Introducción Contexto/ fundamentos

2

Explique las razones y el fundamento científicos de la investigación que se comunica

Objetivos

3

Indique los objetivos específicos, incluyendo cualquier hipótesis preespecificada

Diseño del estudio

4

Presente pronto los elementos clave del diseño del estudio

Contexto

5

Describa el marco, lugares y fechas relevantes, incluyendo los períodos de reclutamiento, exposición, seguimiento y recogida de datos

Participantes

6

(a) Estudios de cohortes: proporcione los criterios de elegibilidad así como las fuentes y el método de selección de los participantes. Especifique los métodos de seguimiento Estudios de casos y controles: proporcione los criterios de elegibilidad así como las fuentes y el proceso diagnóstico de los casos y el de selección de los controles. Proporcione las razones para la elección de casos y controles Estudios transversales: proporcione los criterios de elegibilidad y las fuentes y métodos de selección de los participantes

© Elsevier. Fotocopiar sin autorización es un delito.

Métodos

(b) Estudios de cohortes: en los estudios apareados, proporcione los criterios para la formación de parejas y el número de participantes con y sin exposición Estudios de casos y controles: en los estudios apareados, proporcione los criterios para la formación de las parejas y el número de controles por cada caso Variables

7

Defina claramente todas las variables: respuestas, exposiciones, predictoras, posibles confusoras y modificadoras del efecto. Si procede, proporcione los criterios diagnósticos

Fuentes de datos/ medidas

8*

Para cada variable de interés, proporcione las fuentes de datos y los detalles de los métodos de valoración (medida). Si hubiera más de un grupo, especifique la comparabilidad de los procesos de medida

Sesgos

9

Especifique todas las medidas adoptadas para afrontar fuentes potenciales de sesgo Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 13-3. Declaración STROBE: lista de puntos esenciales que deben ser descritos en la publicación de estudios epidemiológicos (cont.) Punto

Recomendación

Tamaño del estudio

10

Explique cómo se determinó el tamaño del estudio

Variables cuantitativas

11

Explique cómo se trataron las variables cuantitativas del análisis. Si procede, explique qué grupos se definieron y por qué

Métodos estadísticos

12

(a) Especifique todos los métodos estadísticos, incluyendo los usados para controlar factores de confusión (b) Especifique todos los métodos utilizados para analizar subgrupos e interacciones (c) Explique el tratamiento de los datos ausentes (missing data) (d) Estudio de cohortes: si procede, explique cómo se afrontan las pérdidas en el seguimiento Estudios de casos y controles: si procede, explique cómo se aparearon casos y controles Estudios transversales: si procede, especifique cómo el análisis considera la estrategia de muestreo (e) Especifique los análisis de sensibilidad

Resultados Participantes

13*

(a) Describa el número de participantes en cada fase del estudio; por ejemplo: cifras de los participantes potencialmente elegibles, los analizados para ser incluidos, los confirmados elegibles, los incluidos en el estudio, los que tuvieron un seguimiento completo y los analizados (b) Describa las razones de la pérdida de participantes en cada fase (c) Valore proporcionar un diagrama de flujo

Datos descriptivos

14*

(a) Describa las características de los participantes en el estudio (p. ej., demográficas, clínicas, sociales) y la información sobre las exposiciones y los posibles factores de confusión (b) Indique el número de participantes con los datos perdidos en cada variable de interés (c) Estudios de cohortes: resuma el período de seguimiento (p. ej., promedio y total)

Datos de evolución

15*

Estudios de cohortes: describa la cifra de eventos resultado, o bien proporcione medidas resumen a lo largo del tiempo Estudios de casos y controles: describa la cifra de participantes en cada categoría de exposición, o bien proporcione medidas resumen de exposición Estudios transversales: describa la cifra de eventos resultado, o bien proporcione medidas resumen

Resultados principales

16

(a) Proporcione estimaciones no ajustadas y, si procede, ajustadas por factores de confusión, así como su grado de precisión (p. ej., intervalos de confianza del 95%). Especifique los factores de confusión por los que se ajusta y las razones para incluirlos (b) Si categoriza variables continuas, describa los límites de los intervalos (c) Si fuera pertinente, valore acompañar las estimaciones del riesgo relativo con estimaciones del riesgo absoluto para un período de tiempo relevante Continúa

&456%*04&1*%&.*0-Î(*$04

Tabla 13-3. Declaración STROBE: lista de puntos esenciales que deben ser descritos en la publicación de estudios epidemiológicos (cont.) Punto Otros análisis

Recomendación

17

Describa otros análisis efectuados; por ejemplo, análisis de subgrupos, de interacciones o de sensibilidad

Resultados clave

18

Resuma los resultados principales de los objetivos del estudio

Limitaciones

19

Discuta las limitaciones del estudio, teniendo en cuenta las posibles fuentes de sesgo o de imprecisión. Razone tanto sobre la dirección como sobre la magnitud de cualquier posible sesgo

Interpretación

20

Proporcione una interpretación global prudente de los resultados considerando objetivos, limitaciones, multiplicidad de análisis, resultados de estudios similares y otras pruebas empíricas relevantes

Posibilidad de extrapolación

21

Discuta la posibilidad de generalizar los resultados (validez externa)

22

Especifique la financiación y el rol de los patrocinadores del estudio y, si procede, del estudio previo en el que se basa el presente artículo

Discusión

Otra información Financiación

*Proporcione esta información por separado para casos y controles en los estudios con diseño de casos y controles. Si procede, también de los grupos con y sin exposición en los estudios de cohortes y en los transversales. Nota: La lista original en inglés está disponible en http://www.strobe-statement.org y ha sido publicada en inglés8-11 y castellano (de donde ha sido tomada)12.

la aceptabilidad y publicabilidad de los manuscritos (aunque pueda servir para ello), sino de una lista de comprobación para aumentar la calidad de la publicación de los correspondientes informes (generalmente artículos originales) y, por ende, para valorar la calidad o para hacer una buena lectura crítica de este tipo de publicaciones.

5rUVMPZSFTVNFO QVOUP

© Elsevier. Fotocopiar sin autorización es un delito.

El título o el resumen deben incluir una indicación de qué tipo de estudio se trata, y el resumen debería ser una síntesis estructurada muy informativa del artículo, sin descuidar los ítems que se comentan a continuación.

*OUSPEVDDJwO QVOUPTZ

El apartado de «Introducción», que comprende el primer o los primeros párrafos del artículo, debe aportar los antecedentes científicos y la justificación del estudio, así como sus objetivos e hipótesis. Estos ítems son comunes a cualquiera de los tres tipos de estudios incluidos en la declaración STROBE.

.nUPEPT QVOUPTB

En la sección de «Métodos» deben mostrarse los elementos clave del diseño del estudio, incluyendo el objetivo general en caso de que el artículo se corresponda

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

con un estudio más amplio del que se derivan numerosos artículos. Es preciso identificar el ámbito de la investigación, el lugar y las fechas de los períodos de obtención de datos. Según el tipo de estudio (v. tabla 13-2), deben describirse con claridad los criterios de inclusión y exclusión de los participantes. Dado que se trata de trabajos que generalmente cuentan con diferentes variables de estudio, es necesario describir todas las de interés, tanto las de resultados (variables dependientes) como sus potenciales predictores y potenciales variables de confusión (variables independientes), así como los subgrupos definidos a priori. De manera similar, hay que describir cómo se miden cada una de estas variables, así como la comparabilidad de los procedimientos entre los grupos (de expuestos y no expuestos, de casos y controles, de subgrupos, etc.). Respecto a la presencia de sesgos o errores sistemáticos, se deben describir las medidas tomadas para prevenirlos y controlarlos. De manera general para los tres tipos de estudio, es preciso describir la justificación del tamaño del estudio, incluyendo tanto consideraciones prácticas como estadísticas. Respecto a los métodos estadísticos, y de acuerdo con la naturaleza de cada tipo de estudio, se deben exponer todos los métodos utilizados, incluyendo las técnicas para el control del fenómeno de la confusión, cómo se han manejado las variables con información incompleta (missing data), las pérdidas en el seguimiento, el emparejamiento o los efectos de diseños muestrales complejos. En la sección de «Métodos» también se debe dar una explicación de cómo se analizan las exposiciones cuantitativas (cómo se hacen las categorías y por qué).

3FTVMUBEPT QVOUPTB

En esta sección, las particularidades de cada tipo de estudio son más relevantes. Los puntos tienen que ver con los participantes (p. ej., detallar con precisión el número de potenciales participantes, el número de personas contactadas, el número de negativas a participar, el número de personas incluidas, el número de participantes analizados, etc.). En cualquier caso, sin embargo, es necesario explicar las razones de no participación en cada fase del proceso. La declaración STROBE recomienda mostrar las características «basales» o descriptivas de las características sociales, demográficas o clínicas de los participantes en los tres tipos de estudios, incluyendo, cuando el tipo de estudio lo requiera, algo de información en las exposiciones principales y la distribución de los potenciales confusores. Además, se recomienda indicar la frecuencia de las variables de resultado para los diferentes grupos de estudio (expuestos y no expuestos en los estudios de cohortes, casos y controles en este tipo de estudios, o por subgrupos, recomparación en los estudios transversales). Respecto a los principales resultados, la declaración STROBE recomienda dar tanto los resultados crudos como los ajustados de las medidas de asociación, así como su precisión, y publicar las medidas relativas de riesgo complementadas con las diferencias absolutas de riesgo. Finalmente, los artículos deberían informar de otros análisis realizados, como pueden ser análisis de subgrupos.

%JTDVTJwO QVOUPTB

Los cuatro ítems de este apartado se corresponden con la estructura clásica que debería tener la discusión de cualquier artículo científico. En primer lugar, en la

&456%*04&1*%&.*0-Î(*$04

discusión se debe informar, de manera resumida, de los resultados más importantes en relación con las hipótesis del estudio. La declaración STROBE recomienda discutir las limitaciones del estudio, teniendo en cuenta las fuentes de sesgo potencial, los problemas derivados de la multiplicidad de análisis, de exposiciones y de variables de resultado. El penúltimo punto de la lista hace referencia a la interpretación de los resultados en el contexto de la evidencia existente y las limitaciones del estudio, con recomendación explícita a una interpretación prudente de los resultados. Además, tras estos puntos sobre la validez interna del artículo, un punto con entidad propia es el que hace referencia a la generabilidad o validez externa de los resultados del estudio.

0USBJOGPSNBDJwO QVOUP

La declaración STROBE incluye como último punto la explicación de las fuentes de financiación y del papel de los financiadores en el estudio, si bien es muy frecuente que este punto se aborde en la sección de «Agradecimientos» o, cada vez más, en una sección específica al final del manuscrito.

$0.&/5"3*0'*/"-

© Elsevier. Fotocopiar sin autorización es un delito.

Mejorar cómo comunicamos los resultados de la investigación debe traducirse en una mejor difusión de ésta. Un buen artículo revela las fortalezas y las debilidades de un estudio, y facilita las interpretaciones sensatas y la aplicación de sus resultados. La declaración STROBE también puede ayudar en la planificación de los estudios observacionales, y guiar a los revisores y editores en la evaluación de los manuscritos. Hasta la fecha (noviembre de 2008), la declaración STROBE ya ha sido adoptada de forma explícita por 50 revistas científicas del ámbito biomédico (http://www.strobe-statement.org/Support.html), incluyendo diferentes disciplinas y publicadas en diversas lenguas. Estas revistas han encontrado en la declaración STROBE un instrumento óptimo para la sistematización de los elementos clave que esperamos encontrar en un buen artículo sobre investigación con los tres diseños básicos epidemiológicos.

"(3"%&$*.*&/504 A los compañeros del Comité Editorial de Gaceta Sanitaria y a Antoni Plasència, Ana M. García, Erik Cobo y Miquel Porta por las vivencias en el mundo de la edición biomédica. A Fèlix Bosch y Josep Maria Domènech por estimular y apoyar la docencia sobre escritura científica, que tanto tiene que ver con la declaración STROBE. A Erik von Elm y el resto de colaboradores de la colaboración STROBE por permitir y alentar la traducción de la declaración al castellano y su publicación en Gaceta Sanitaria. Este capítulo se ha basado en los artículos publicados en Medicina Clínica [Med Clín (Barc). 2005;125(Supl 1):43-8] y Gaceta Sanitaria [Gac Sanit. 2008;22:144-50 y Gac Sanit. 2008;22:87-9].

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

#*#-*0(3"'Ê" 1. 2. 3.

4. 5. 6. 7. 8.

9.

10.

11.

12.

13. 14.

15.

16.

MacMahon B, Pugh TF. Principios y métodos de epidemiología. México D.F.: La Prensa Médica Mexicana; 1976. Porta M, ed. A Dictionary of Epidemiology. Oxford: Oxford University Press & International Epidemiological Association; 2008. p. 81. Last JM, Wallace RB. Maxcy-Rosenau-Last Public Health and Preventive Medicine. En: Tyler CW Jr, Last MJ, eds. Epidemiology. 13.ª ed. East Norwalk: Appleton & Lange; 1992. p. 11-39. Beaglehole R, Bonita R, Kjellström T. Epidemiología básica. Ginebra: Organización Mundial de la Salud; 1993. p. 3-4. Porta Serra M. La observación clínica y el razonamiento epidemiológico. Med Clin (Barc). 1986;87:816-9. Vanderbroucke JP. On the new clinical fashion in epidemiology. Epidemiol Infect. 1989;102:191-8. Álvarez-Dardet C, Bolúmar F, Porta Serra M. Tipos de estudios. Med Clin (Barc). 1987;89:296-301. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP, on behalf of the STROBE Initiative. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) Statement: Guidelines for reporting observational studies. PLoS Med. 2007;4:e296. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP, on behalf of the STROBE Initiative. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) Statement: Guidelines for reporting observational studies. Epidemiology. 2007;18:800-4. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: Guidelines for reporting observational studies. Bull World Health Organ. 2007;85:867-72. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP, on behalf of STROBE Initiative. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: Guidelines for reporting observational studies. Prev Med. 2007;45:247-51. Von Elm, Altman DG, Egger M, Pocock SJ, Gotzsche PC, Vandenbroucke JP, en nombre de la Iniciativa STROBE. Declaración de la Iniciativa STROBE (Strengthening the Reporting of Observational studies in Epidemiology): directrices para la comunicación de estudios observacionales. Gac Sanit. 2008;22:144-50. Fernández E, Cobo E, Guallar-Castillón P. La Declaración STROBE o cómo mejorar la presentación de los estudios observacionales. Gac Sanit. 2008;22:87-9. Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, et al., on behalf of STROBE Initiative. Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): Explanation and elaboration. Epidemiology. 2007;18:805-35. Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ, et al., on behalf of STROBE Initiative. Mejorar la comunicación de estudios observacionales en epidemiología (STROBE): Explicación y elaboración. Gac Sanit. 2009;23:158.e1-158.e28. Sanderson S, Tatt ID, Higgins JP. Tools for assessing quality and susceptibility to bias in observational studies in epidemiology: A systematic review and annotated bibliography. Int J Epidemiol. 2007;36:666-76.

&TUVEJPTEFQSFDJTJwO EJBHOwTUJDBZEFQSPOwTUJDP MBTEJSFDUSJDFT45"3% Z3&."3, %3JHBV 1"MPOTPF*4PMh

El desarrollo de guías o directrices para la publicación científica correcta se basa en dos principios sencillos. El primero es que, para comprender los resultados de cualquier investigación, debemos conocer y entender cómo se ha realizado, y el segundo, que esto sólo es posible si los investigadores responsables garantizan la total transparencia en la divulgación del trabajo. En el presente capítulo se exponen las características que deben tener los estudios de diagnóstico y de pronóstico, además de las directrices existentes para su correcta publicación.

&456%*04%&13&$*4*Î/%*"(/Î45*$"

© Elsevier. Fotocopiar sin autorización es un delito.

&TUVEJPTEFEJBHOwTUJDP La realización de un diagnóstico clínico implica la clasificación de un problema de salud en función del conocimiento actual. En la práctica clínica habitual esto se lleva a cabo a través de técnicas que se conocen como pruebas diagnósticas. Éstas pueden consistir en la identificación de signos, síntomas o antecedentes personales, en los resultados proporcionados por un laboratorio clínico o en la evaluación de imágenes obtenidas a través de distintas técnicas, así como en la combinación de varias de estas pruebas, en lo que se denomina un proceso diagnóstico. Las pruebas diagnósticas pueden consistir en confirmar o excluir una determinada patología, en seleccionar una como la más probable entre muchas otras o en llegar a la conclusión de que varias de ellas están presentes de manera si-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

multánea. Las pruebas también pueden estar destinadas a establecer la gravedad de una patología o al seguimiento de la evolución clínica de un proceso concreto. Otra utilidad de las pruebas diagnósticas es la documentación de la existencia, la localización exacta o la extensión de una patología ya previamente conocida. Finalmente, también sirven para la evaluación del estado físico cuando se llevan a cabo determinadas actividades deportivas o laborales. No hay que olvidar que el fin último de un proceso diagnóstico es mejorar el pronóstico de los pacientes, al permitir al clínico seleccionar la estrategia terapéutica más adecuada para el tratamiento de la patología de interés, teniendo en cuenta su correcto grado de gravedad y el alcance de su extensión. Un error en la correcta clasificación de una patología puede conllevar, en la mayoría de los casos, la elección de un tratamiento inadecuado. A su vez, una terapia inadecuada puede empeorar el pronóstico del paciente al recibir un tratamiento que no era necesario, pudiendo causar efectos adversos sin beneficio alguno, o recibir un tratamiento ineficaz para el tratamiento de una patología de una gravedad o extensión determinadas. Además, el pronóstico puede empeorar por el retraso en la obtención de un correcto diagnóstico que puede deberse a un error en la clasificación inicial. Establecer la precisión o el grado de certidumbre de una prueba diagnóstica determinada es el primer paso indispensable, a pesar de que el objetivo de la mejoría en el pronóstico debería ser el fin último de toda la investigación. Antes de su introducción en la práctica clínica, las nuevas pruebas diagnósticas que se van desarrollando requieren de una evaluación detallada, de forma similar a la que se someten las tecnologías sanitarias o los medicamentos. Esta evaluación tiene que ser rigurosa y estar orientada a establecer los potenciales beneficios y riesgos, así como los costes, tanto directos como indirectos, de su aplicación (al evitar la realización de pruebas innecesarias). Las publicaciones sobre la evaluación de la precisión diagnóstica de las distintas pruebas y procesos han aumentado de forma exponencial en los últimos años. Aun así, la investigación que permite dar respuesta a las preguntas en este campo se encuentra menos avanzada que la relacionada con la terapéutica clínica. Las consideraciones metodológicas para la realización de los estudios de diagnóstico, aunque son conocidas, se han aplicado de forma poco homogénea dando lugar, a menudo, a la publicación de estudios con un diseño deficiente y, por tanto, con un alto riesgo de potenciales sesgos. Los elementos para la interpretación crítica de los estudios de diagnóstico tampoco están tan difundidos como sus equivalentes en terapéutica1,2. Diversas publicaciones recientes han destacado que la calidad metodológica de los estudios de diagnóstico es escasa y que, por tanto, existen importantes oportunidades para la mejora en los próximos años. No se puede descartar que algunas de las deficiencias detectadas en la metodología empleada en los estudios de diagnóstico se deban a una deficiente información disponible en las publicaciones y, por tanto, que los defectos intrínsecos de los estudios no expliquen la totalidad de estos resultados tan poco alentadores. No obstante, esto parece bastante improbable. De forma parecida a la investigación en otros campos, en la investigación sobre la precisión de pruebas diagnósticas se debe establecer en un primer

© Elsevier. Fotocopiar sin autorización es un delito.

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

momento la pregunta de investigación, para posteriormente definir el diseño de estudio más apropiado para responder a ella y, finalmente, delimitar aquellos aspectos metodológicos como la población, las variables, los valores de referencia, el análisis estadístico o cómo evitar los sesgos específicos a los estudios de diagnóstico. El diseño óptimo consiste en la aplicación de la prueba cuya precisión se pretende evaluar, denominada prueba índice, y de una prueba de referencia, o patrón oro (gold standard), a todo un grupo de pacientes representativos de la población de interés. La prueba de referencia debe ser la mejor prueba o proceso diagnóstico disponible para establecer el diagnóstico (presencia, ausencia, gravedad, extensión o localización) de una patología, y puede consistir tanto en un conjunto de pruebas como en su ausencia (si no existe aún diagnóstico posible). Tanto la prueba que se evalúa como la de referencia deben aplicarse a todos los pacientes y, si es posible, de forma simultánea, e interpretarse sin que el evaluador o los evaluadores conozcan el resultado de la otra prueba, es decir, de manera independiente y enmascarada. Este tipo de procedimiento difiere de la práctica clínica habitual en que las pruebas se solicitan e interpretan tras conocer los resultados de las pruebas previas. Existen, sin embargo, otros planteamientos de estudio también válidos para la evaluación de las pruebas diagnósticas, de los que deben considerarse sus ventajas e inconvenientes en relación con los objetivos del estudio, la disponibilidad de pacientes o el uso eficiente de los recursos2-4. La definición de la población de estudio es un punto clave en este tipo de investigaciones. Para un clínico que ha de utilizar una determinada prueba diagnóstica, es importante conocer hasta qué grado dicha prueba distingue entre los sujetos sanos y aquellos con la enfermedad. De forma intuitiva, se puede comprender que una prueba tiene más posibilidades de detectar los casos más severos que aquellos con enfermedad menos avanzada o menos evidente. Paralelamente, no es necesaria una prueba diagnóstica en los sujetos con una presentación clínica tan clara que no ofrece dudas de la presencia de la enfermedad de interés. Por ello, una selección y definición deficientes de la población o espectro de enfermedad en estudio es una causa frecuente de sesgo. Como espectro de enfermedad se entiende la composición cualitativa de los sujetos de estudio en relación con características como el sexo, la edad, la comorbilidad, la gravedad de la enfermedad o su presentación clínica. Más complejo es, a veces, aplicar con independencia tanto la prueba que se pretende evaluar como el patrón oro a todos los participantes en el estudio. Este problema se refleja claramente en el ejemplo de la evaluación de la mamografía para el diagnóstico del cáncer de mama. Si aplicáramos el criterio de independencia, éste nos llevaría a realizar una mamografía y el patrón oro a todas las participantes. En esta caso concreto habría que realizar una punciónbiopsia a todas las participantes sin conocer los resultados de la mamografía. En la mayoría de ocasiones, el patrón oro se termina aplicando en estos casos sólo en las personas con un resultado (una imagen) sospechoso en la mamografía, aunque esta verificación parcial es una posible fuente de sesgo. El enmascaramiento de la evaluación de las pruebas diagnósticas parte de las mismas consideraciones que en los ensayos clínicos con medicamentos. Se sabe

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

que la falta de enmascaramiento, sobre todo en el caso de pruebas en que su interpretación tiene un componente subjetivo como son las de diagnóstico por la imagen, puede sobrestimar los resultados obtenidos en el estudio. La variable independiente consiste habitualmente en el resultado de la prueba en estudio, mientras que la variable dependiente corresponde a la presencia o no de la patología o condición objeto de estudio determinada por la prueba de referencia. La relación o concordancia entre estas variables es lo que se conoce como precisión diagnóstica. Las formas de expresar numérica o gráficamente esta concordancia son diversas, e incluyen la determinación de la sensibilidad, la especificidad, los valores predictivos y el área bajo la curva de eficacia diagnóstica (también conocida como curva ROC). Finalmente, otra fuente posible de sesgo en los resultados es la ausencia de definición a priori de un valor de referencia (o punto de corte) adecuado para la comparación entre las pruebas. Esto conduce a que los resultados, de forma sistemática, favorezcan más a la prueba en estudio o al patrón oro5. No es infrecuente la omisión de ciertos aspectos clave de los métodos en las publicaciones de las investigaciones, aunque éstas, realmente, estuvieran correctamente realizadas. Esta observación es especialmente relevante en el caso de los estudios de diagnóstico. La ausencia de información clave respecto al diseño y de cómo estos estudios se han llevado a cabo es también un problema importante debido a que sólo la comunicación completa y detallada permite al lector detectar los posibles sesgos del estudio y juzgar su influencia en los resultados6,7.

%JSFDUSJ[45"3% Durante las últimas décadas han aparecido numerosas directrices destinadas a mejorar la calidad de la comunicación científica para los diferentes tipos de estudios. Todas las iniciativas parten de la consideración de que es un deber moral de todos los investigadores publicar lo más claramente posible los resultados (así como la forma de llegar a éstos) para permitir su mejor y más fácil interpretación y aplicación. Se trata de un deber moral porque los pacientes (o voluntarios) han consentido participar libremente en el estudio para contribuir al conocimiento científico, incluso si dicha participación no genera beneficio alguno para ellos, y porque en muchas ocasiones se han destinado fondos públicos para su realización. Hay, no obstante, otras utilidades de las directrices, como servir de herramienta para ayudar a los autores a redactar sus trabajos, especialmente a los menos experimentados, y generar manuscritos de mayor calidad. Asimismo, las publicaciones que se ajusten a estas directrices mostrarán una mayor uniformidad en la presentación de los resultados, lo que contribuye a facilitar, en ocasiones, el análisis conjunto de los estudios (metaanálisis). Estas directrices, por el contrario, no sirven para valorar la validez interna (calidad metodológica) o validez externa de los estudios, existiendo otros instrumentos específicos y validados para este propósito8. Ante esta proliferación de directrices no es de extrañar la reciente aparición de la iniciativa internacional EQUATOR (Enhancing the QUality and Transparency of health Research), que tiene como objetivo difundir y monito-

© Elsevier. Fotocopiar sin autorización es un delito.

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

rizar el uso de estas directrices destinadas a mejorar la calidad de la comunicación científica9-11. Los impulsores de la iniciativa STARD (Standards for Reporting of Diagnostic Accuracy Studies) comparten el mismo objetivo que el resto de directrices: contribuir a que la comunicación y la divulgación de los estudios —en este caso, los de diagnóstico— sean completas y rigurosas. De esta manera, los lectores podrán evaluar de manera más adecuada las potenciales fuentes de sesgo (la validez interna) y si los resultados se pueden generalizar y aplicar a otros contextos diferentes (la validez externa). Esta iniciativa se remonta al año 1999, durante el coloquio de la Colaboración Cochrane que tuvo lugar en Roma, en que el grupo de trabajo metodológico en diagnóstico y cribado, ante la decepcionante calidad de las publicaciones, consideró una necesidad prioritaria la creación de una comisión destinada a investigar este problema y proponer posibles soluciones. Inevitablemente, en la mente de muchos de los componentes de la comisión estaba presente la aceptación general que tuvo la pionera directriz CONSORT (COnsolidated Standards Of Reporting Trials) para la publicación de ensayos clínicos; por lo tanto, desarrollar una directriz, en la misma línea de CONSORT, que contuviera un listado de elementos que se deberían incluir en las publicaciones de estudios de diagnóstico, empezó a convertirse en una realidad en ese mismo momento. El trabajo de la comisión empezó con una búsqueda sistemática de las publicaciones sobre diagnóstico clínico en diferentes bases de datos e incluso de forma manual. La revisión y lectura de las publicaciones relevantes condujo a la elaboración de un amplio listado de potenciales elementos que la directriz debería contener. En una reunión de consenso celebrada en 2001, con la presencia de investigadores, editores, expertos en metodología y organizaciones profesionales, se acotó este listado y se discutió sobre su redacción. Adicionalmente, un grupo de potenciales usuarios probaron, en condiciones reales, el documento resultante, y éste se puso a disposición del público a través de un portal web para recoger comentarios adicionales. Tras considerar cada uno de los comentarios recibidos, la comisión elaboró un listado final con 25 elementos que conforman la directriz STARD definitiva (tabla 14-1). La comisión elaboradora desarrolló también un algoritmo con la finalidad de que los estudios informen sobre el orden de realización de las pruebas y el número de sujetos evaluados con cada prueba diagnóstica. En la figura 14-1 se muestra un algoritmo sobre un ejemplo real de estudio de diagnóstico, traducido de la publicación original12. La versión original en inglés se puede consultar de manera gratuita en el portal web de la iniciativa STARD (http://www.stard-statement.org). La publicación definitiva de la directriz STARD se realizó en enero de 2003 de forma conjunta en 7 revistas biomédicas de elevado factor de impacto y relevantes en el campo de los métodos diagnósticos (Clinical Chemistry, Annals of Internal Medicine, Radiology, British Medical Journal, American Journal of Clinical Pathology, Clinical Biochemistry, Clinical Chemistry y Laboratory Medicine). Para facilitar su uso, aclarar su significado y exponer el razonamiento subyacente en cada uno de los elementos de la directriz, ese mismo año se publicó

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 14-1. Lista de los elementos incluidos en la directriz STARD para la publicación de estudios sobre precisión diagnóstica Punto n.º Título/ resumen/ palabras clave

Descripción

1

Identifica el artículo como un estudio de precisión diagnóstica (epígrafe MeSH recomendado: «sensibilidad y especificidad»)

2

Especifica los objetivos del estudio, como la estimación de la precisión diagnóstica o la comparación de la precisión entre distintos grupos

3

Población estudiada: criterios de inclusión y exclusión, contexto y centros en que se obtuvieron los datos

4

Reclutamiento de los participantes: ¿se basó en los síntomas iniciales, en los resultados obtenidos en pruebas previas o en el hecho de que los participantes se hubiesen evaluado mediante la prueba índice o estándar de referencia?

5

Selección de los participantes: ¿la población de pacientes estudiada constituyó una serie consecutiva según los criterios de selección de los puntos 3 y 4? En caso negativo, especifica el método de selección empleado

6

Recogida de datos: ¿se había planificado antes (estudio prospectivo) o después (estudio retrospectivo) de la realización de las pruebas índice y de referencia?

7

Prueba estándar de referencia y su fundamento

8

Especificaciones de carácter técnico sobre materiales y métodos para la realización de las pruebas, incluyendo cómo y cuándo se realizaron las mediciones, así como referencias bibliográficas sobre las pruebas índice y de referencia

9

Definición y fundamento de las unidades de medida, valores umbral (puntos de corte) y categorías de los resultados de las pruebas índice y de referencia

10

Número, entrenamiento y experiencia de las personas que realizan e interpretan las pruebas índice y de referencia

11

Especifica si los investigadores que interpretan las pruebas índice y de referencia estaban cegados (enmascarados) a los resultados de la otra prueba y describe cualquier otra información clínica relevante

12

Métodos para calcular o comparar las medidas de precisión diagnóstica, y métodos estadísticos utilizados para cuantificar la incertidumbre (p. ej., intervalos de confianza del 95%)

13

Si procede, métodos para calcular la reproducibilidad y fiabilidad de la prueba

Informado en página n.º

Introducción Antecedentes

Métodos Participantes

Realización de la prueba

Métodos estadísticos

Continúa

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

Tabla 14-1. Lista de los elementos incluidos en la directriz STARD para la publicación de estudios sobre precisión diagnóstica (cont.) Punto n.º

Descripción

Informado en página n.º

Resultados Participantes

Resultados de la prueba

© Elsevier. Fotocopiar sin autorización es un delito.

Estimaciones

14

Cuándo se realizó el estudio, especificando las fechas de comienzo y finalización del reclutamiento

15

Características clínicas y demográficas de los participantes en el estudio (p. ej., edad, sexo, espectro de síntomas iniciales, comorbilidad, tratamientos actuales, centros de reclutamiento)

16

Número de pacientes que cumplen los criterios de selección del estudio a los que se han realizado o no las pruebas índice y de referencia; describe los motivos por los que no se realizó alguna de las pruebas a los pacientes (se recomienda el uso de un diagrama de flujo)

17

Intervalo de tiempo transcurrido entre la realización de la prueba índice y la de referencia, así como cualquier tratamiento utilizado entre ellas

18

Distribución de los pacientes con la enfermedad según su gravedad (definir los criterios), y de los otros diagnósticos en los que no la presentan

19

Tabla de los resultados obtenidos con la prueba índice (incluyendo los indeterminados y los ausentes) según los resultados de la prueba estándar. En caso de variables continuas, distribución de los resultados de la prueba según los valores de la de referencia

20

Cualquier evento adverso observado durante la realización de las pruebas índice o de referencia

21

Estimaciones de la precisión diagnóstica y medidas de la incertidumbre estadística (p. ej., intervalos de confianza del 95%)

22

Cómo se manejaron los resultados indeterminados, los extremos y los ausentes

23

Si procede, estimaciones de la variabilidad de la precisión diagnóstica entre grupos de participantes, investigadores o centros

24

Si procede, estimaciones de la reproducibilidad o fiabilidad de la prueba

25

Discusión de la aplicabilidad clínica de los resultados del estudio

Discusión

un documento explicativo en tres revistas biomédicas. Posteriormente, otras ocho revistas han publicado el documento íntegro. A partir del año 2006, en que el Comité Internacional de Editores de Revistas Médicas aceptó esta directriz, se generalizó su uso, y ya en abril de 2008 más de 200 revistas biomédicas, en sus instrucciones de publicación, recomiendan a los autores la utilización de la directriz STARD13,14.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Niños con sospecha de apendicitis n = 177

Enviados a casa n=4

Apendicitis n=0

Directamente al quirófano n = 34

No apendicitis n=4

Apendicitis n = 30

No apendicitis n=4

Ultrasonografía n = 139

Enviados a casa n = 11

Apendicitis n=1

Apendicectomía n = 20

No apendicitis n = 10

Apendicitis n = 20

No apendicitis n=0

TCCR n = 108

Enviados a casa n = 52

Apendicitis n=0

Apendicectomía n = 31

No apendicitis n = 52

Apendicitis n = 28

No apendicitis n=3

Admitidos para observación n = 25

Apendicitis n = 24

No apendicitis n=1

Figura 14-1. Diagrama de flujo prototípico de un estudio de precisión diagnóstica. TCCR: tomografía computarizada con contraste renal.

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

En definitiva, la declaración STARD debería mejorar la pobre calidad de la diseminación de los estudios sobre pruebas de precisión diagnóstica. Ya ha tenido algún efecto en algunos campos o revistas que se han adherido a la iniciativa, pero no ha tenido, por el momento, un impacto general5, 16.

&456%*04%&7"-03130/Î45*$0 *OWFTUJHBDJwOTPCSFFMWBMPSQSPOwTUJDP La actividad clínica diaria está fundamentada en tres elementos: el juicio diagnóstico, el pronóstico y el tratamiento. Los estudios de tratamiento y los de diagnóstico, además de ser muy abundantes en la literatura biomédica, disponen de unas directrices consolidadas: CONSORT y STARD, respectivamente. Así, parece que el interés científico que se ha generado alrededor de la investigación terapéutica y diagnóstica lo ha hecho en detrimento de la investigación sobre el valor pronóstico. El pronóstico tiene como objetivo determinar, a través de la probabilidad, la evolución del estado de salud de un paciente en función de una serie de factores biológicos, terapéuticos y sociales que, en la vida real, son concurrentes. Para determinar esta probabilidad, es común la investigación de tipo observacional (sin intervención) con diseños que corresponden a estudios de cohortes, de casos y controles o a series de casos que recopilan información de forma prospectiva o retrospectiva. Para el caso que nos ocupa, debemos diferenciar también la investigación sobre el valor pronóstico de la relacionada con los factores de riesgo, que tiene como objetivo establecer la probabilidad de presentar una enfermedad determinada antes de que ésta se manifieste, en relación con la presencia o ausencia de unos determinados factores. En adelante, y a modo de ejemplo, nos referiremos a las publicaciones sobre el valor pronóstico de los marcadores tumorales en oncología.

© Elsevier. Fotocopiar sin autorización es un delito.

.BSDBEPSFTUVNPSBMFT Existe un gran interés para encontrar nuevos marcadores que puedan ayudar a los profesionales sanitarios, así como a los pacientes con diferentes tipos de cáncer, en el proceso de la toma de decisiones clínicas. A modo de simplificación, podemos clasificar los marcadores en tres categorías: de diagnóstico, de pronóstico y predictivos. Los marcadores de diagnóstico permiten determinar el tejido origen del tumor primario o el subtipo específico de un tumor. Los marcadores de pronóstico indican la probabilidad de un acontecimiento determinado (recidiva del tumor, supervivencia, etc.) con independencia del tratamiento. Los marcadores predictivos, por su parte, indican la probabilidad de respuesta (positiva o negativa) a un tratamiento determinado. Estos últimos están suscitando un creciente interés para conseguir la definición de aquellos tumores que más se beneficiarían de un tratamiento por el hecho de expresar ciertas características moleculares o genéticas. Los marcadores a su vez pueden

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ser de tipo biológico (ciertos valores que se obtienen a través de un análisis de sangre o de otros fluidos corporales), genético (rasgos presentes en el genoma del propio paciente o del tumor), histológico (características obtenidas en la evaluación de la biopsia del tumor), clínico o fisiopatológico. Un nuevo marcador se considera útil para su uso en la práctica clínica si se puede medir de forma fiable y reproducible con un método ampliamente accesible, y si además proporciona información relevante para el médico y el paciente. Respecto al primer criterio, es importante conocer la variabilidad que puede existir dentro y entre distintos laboratorios, lo que obliga a unos controles de calidad estrictos. En el caso del segundo criterio, se refiere a si proporciona una ventaja clínica real, por ejemplo si el marcador se relaciona con la supervivencia o la recidiva tumoral17-19. Las publicaciones sobre marcadores en oncología, contrariamente a lo que podría parecer, han sido y son muy abundantes, aunque su incorporación a la práctica clínica es escasa. A pesar de que algunos de ellos son considerados de forma habitual en oncología, el número de marcadores para los que se dispone de datos fidedignos sobre su valor pronóstico es muy escaso 17,20. Uno de los principales problemas a los que deben hacer frente las revisiones sistemáticas y las guías de práctica clínica en el momento de recomendar el uso de un nuevo marcador tumoral, es el gran volumen de información que, demasiado a menudo, muestra resultados inconsistentes, cuando no contradictorios. Esto ha conducido a que numerosos marcadores tumorales no se hayan recomendado finalmente para la toma de decisiones. Los resultados poco concluyentes sobre los marcadores tumorales pueden deberse, al menos en parte, a que este tipo de investigación adolece de algunas deficiencias metodológicas comunes. Muchos de los estudios han incluido un número muy escaso de participantes y han realizado análisis estadísticos con escaso poder para establecer la relación entre uno o varios marcadores estudiados y la evolución o pronóstico. Adicionalmente, el carácter observacional de los estudios, con sus diferentes diseños, comporta una serie de errores sistemáticos o sesgos propios y característicos. El sesgo de selección es una distorsión en la estimación de un efecto causada por la forma errónea en la que se han seleccionado los sujetos del estudio. Sucede sobre todo si los datos se recogen de forma retrospectiva en bases de datos, y puede dar lugar a la inclusión selectiva de pacientes con un determinado tipo o tamaño de tumor en detrimento de otros, según la disponibilidad del registro consultado para el estudio. El sesgo de información consiste en una distorsión en la estimación del efecto debida a una medición errónea o a una mala clasificación de los sujetos de estudio con respecto a una o varias variables. Esto sucede si los métodos de análisis (dispositivos, reactivos, protocolos de conservación o almacenamiento) no han sido aplicados de la misma forma en todo el estudio. Finalmente, el fenómeno de confusión corresponde a una distorsión debida a que el efecto del marcador de estudio está íntimamente relacionado con el de otros factores que también influyen en la estimación general del efecto. Es importante subrayar que el fenómeno de confusión puede corregirse parcialmente en la fase de análisis de un estudio si se tiene la información adecuada, mientras que los sesgos de selección e información son prácticamente imposibles de corregir durante el análisis21,22.

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

Del mismo modo que en los de precisión diagnóstica, en los estudios sobre valor pronóstico la ausencia de información clave respecto a los aspectos metodológicos y la comunicación poco detallada de los resultados imposibilita a menudo a los lectores un juicio informado sobre sus resultados, impidiendo la incorporación más generalizada de estos marcadores tumorales en la práctica clínica habitual.

%JSFDUSJ[3&."3, En 2005 se publicaron, tras varios años de trabajo, las recomendaciones para la publicación de estudios sobre marcadores tumorales de pronóstico (REMARK, Reporting Recommendations for Tumour Marker Prognostic Studies) en cinco revistas biomédicas en el campo de la oncología: British Journal of Cancer, European Journal of Cancer, Journal of Clinical Oncology, Journal of the National Cancer Institute y Nature Clinical Practice Oncology23. La iniciativa se gestó en el primer congreso internacional sobre diagnóstico en cáncer que organizaron conjuntamente el National Cancer Institute (NCI) de Estados Unidos y la European Organization for Research and Treatment of Cancer (EORTC) en el año 2000. El grupo multidisciplinario formado, en el cual no figuraba ningún editor de revista científica, realizó un importante esfuerzo para recopilar la información disponible hasta el momento, gran parte de tipo empírico, sobre las principales deficiencias en las publicaciones sobre marcadores tumorales. El resultado, avalado por las más importantes instituciones americanas y europeas para la investigación y el manejo de los pacientes con cáncer, consiste en una directriz que contiene un total de 20 elementos que deberían contemplarse en los apartados «Introducción», «Material y métodos», «Resultados» y «Discusión» de las publicaciones sobre marcadores tumorales (tabla 14-2). Debemos destacar que la directriz REMARK está orientada a la comunicación y divulgación completa de los estudios de marcadores tumorales de proTabla 14-2. Lista de los elementos de la directriz REMARK para la publicación de estudios de valor pronóstico

© Elsevier. Fotocopiar sin autorización es un delito.

Punto n.º Introducción

Descripción

1

Indique el marcador evaluado, los objetivos del estudio y cualquier hipótesis preespecificada

2

Describa las características (p. ej., fase de la enfermedad, comorbilidad) de los pacientes, así como su procedencia y los criterios de inclusión y exclusión

3

Describa los tratamientos aplicados y cómo fueron seleccionados (p. ej., aleatoriamente, según una regla)

4

Describa el tipo de material biológico utilizado (incluyendo los controles), así como los métodos de conservación y almacenamiento

Informado en página n.º

Métodos Participantes

Características de la muestra

Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 14-2. Lista de los elementos de la directriz REMARK para la publicación de estudios de valor pronóstico (cont.) Punto n.º

Descripción

Método del ensayo

5

Especifique el método del ensayo utilizado y aporte (o cite) un protocolo detallado, incluyendo los reactivos o dispositivos específicos empleados, procedimientos de control de calidad, evaluaciones de la reproducibilidad, métodos de cuantificación y protocolos de evaluación e información de los resultados. Especifique si (y cómo) los ensayos se efectuaron manteniendo enmascarada la variable respuesta

Diseño del estudio

6

Especifique el método de selección de casos, incluyendo si fue prospectivo o retrospectivo, y si se empleó una técnica de estratificación o emparejamiento (p. ej., según la fase de la enfermedad, la edad, etc.). Especifique el período de selección de los casos, la fecha final y la mediana del tiempo de seguimiento

7

Defina con precisión todos los resultados clínicos evaluados

8

Especifique todas las variables candidatas evaluadas inicialmente o consideradas para su inclusión en los modelos

9

Justifique el tamaño de la muestra; si el estudio fue diseñado para detectar un tamaño del efecto determinado, descríbalo e informe de la potencia deseada

10

Especifique todos los métodos estadísticos, incluyendo los detalles de cualquier procedimiento de selección de variables o de construcción del modelo, cómo se verificaron las asunciones del modelo y cómo se manejaron los datos ausentes

11

Especifique cómo se trataron en el análisis los valores de los marcadores; si es relevante, describa los métodos utilizados para determinar los valores umbral (puntos de corte)

12

Describa el flujo de participantes a lo largo del estudio, incluyendo el número de pacientes incluidos en cada fase del análisis (puede ser útil un diagrama) y los motivos de los abandonos. Específicamente, mencione el número de pacientes evaluados y de episodios detectados, tanto en conjunto como en cada uno de los subgrupos especialmente considerados

13

Describa la distribución de las características demográficas básicas (al menos, edad y sexo), de las variables pronósticas específicas y de los marcadores tumorales, incluyendo el número de valores ausentes

14

Muestre la relación entre el marcador y las variables pronósticas

Análisis estadístico

Informado en página n.º

Resultados Datos

Análisis y presentación

Continúa

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0

Tabla 14-2. Lista de los elementos de la directriz REMARK para la publicación de estudios de valor pronóstico (cont.) Punto n.º

Descripción

15

Presente análisis univariados que muestren la relación entre el marcador y el resultado y la estimación del efecto (p. ej., razón de riesgo, probabilidad de supervivencia). En lo posible, aporte análisis similares para el resto de variables analizadas. Para la relación entre el marcador y el tiempo hasta el evento, se recomienda el uso de curvas de Kaplan-Meier

16

Para los análisis multivariados más importantes, presente las estimaciones del efecto (p. ej., razón de riesgo) con sus intervalos de confianza entre el marcador y, al menos para el modelo final, el resto de variables incluidas

17

Entre los resultados, aporte los efectos estimados y sus intervalos de confianza en un análisis que incluya el marcador y las variables pronósticas estándar, independientemente de su significación estadística

18

Si procede, informe de otras investigaciones como la evaluación de las asunciones del modelo, análisis de sensibilidad o la validación interna

19

Interprete los resultados en el contexto de las hipótesis preespecificadas y otros estudios relevantes

20

Discuta el valor clínico de los resultados y sus implicaciones para futuras investigaciones

Informado en página n.º

© Elsevier. Fotocopiar sin autorización es un delito.

Discusión

nóstico, por ser éstos los más abundantes en la literatura sobre marcadores. Aunque las características de los estudios para evaluar marcadores predictivos difieren de las de los estudios para evaluar marcadores pronósticos, los mismos autores afirman que la mayor parte de la directriz puede aplicarse también a los primeros. Los autores también señalan que los estudios que evalúan los marcadores en el contexto de un ensayo clínico deberían seguir directrices específicas propias como la CONSORT23. Muchos de los investigadores en el campo de los marcadores tumorales tienen como último objetivo o desiderátum el acceso público a los datos de los estudios, incluso de cada uno de los participantes. Esto permitiría la comprobación, independiente del promotor, de los resultados, y facilitaría enormemente las revisiones sistemáticas y sus correspondientes metaanálisis. Para los autores de la directriz, se trata de una aspiración que deberá esperar, como ha sucedido con otras, a su adopción y seguimiento generalizados23.

#*#-*0(3"'Ê" 1.

Knottnerus JA, van Weel C, Muris JW. Evaluation of diagnostic procedures. BMJ. 2002;324:477-80.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM 2. 3.

4. 5.

6.

7. 8.

9.

10. 11. 12. 13.

14.

15.

16. 17.

18. 19. 20.

21.

Knottnerus JA, Tugwell P. The standards for reporting of diagnostic accuracy. J Clin Epidemiol. 2003;56:1029. Smidt N, Rutjes AW, van der Windt DA, Ostelo RW, Bossuyt PM, Reitsma JB, et al. The quality of diagnostic accuracy studies since the STARD statement: Has it improved? Neurology. 2006;67:792-7. Abraira V. Sesgos en los estudios sobre pruebas diagnósticas. SEMERGEN. 2006;32:24-6. Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, van der Meulen JH, et al. Empirical evidence of design-related bias in studies of diagnostic tests. JAMA. 1999;282: 1061-6. Devereaux PJ, Choi PT, El-Dika S, Bhandari M, Montori VM, Schünemann HJ, et al. An observational study found that authors of randomized controlled trials frequently use concealment of randomization and blinding, despite the failure to report these methods. J Clin Epidemiol. 2004;57:1232-6. Smidt N, Rutjes AW, van der Windt DA, Ostelo RW, Reitsma JB, Bossuyt PM, et al. Quality of reporting of diagnostic accuracy studies. Radiology. 2005;235:347-53. Whiting P, Rutjes AW, Reitsma JB, Bossuyt PM, Kleijnen J. The development of QUADAS: A tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews. BMC Med Res Methodol. 2003;3:25. Vandenbroucke JP. STREGA, STROBE, STARD, SQUIRE, MOOSE, PRISMA, GNOSIS, TREND, ORION, COREQ, QUOROM, REMARK... and CONSORT: For whom does the guideline toll? J Clin Epidemiol. 2009;62:594-6. Simera I, Altman DG, Moher D, Schulz KF, Hoey J. Guidelines for reporting health research: The EQUATOR network’s survey of guideline authors. PLoS Med. 2008;5:e139. Altman DG, Simera I, Hoey J, Moher D, Schulz K. EQUATOR: Reporting guidelines for health research. Lancet. 2008;371:1149-50. Altman DG, Bossuyt PM. Estudios de precisión diagnóstica (STARD) y pronóstica (REMARK). Med Clin (Barc). 2005;125(Supl 1):49-55. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Standards for Reporting of Diagnostic Accuracy. Clin Chem. 2003;49:1-6. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. BMJ. 2003;326:41-4. Gómez Sáez N, Hernández-Aguado I, Lumbreras B. Estudio observacional: Evaluación de la calidad metodológica de la investigación diagnóstica en España tras la publicación de la guía STARD. Med Clin (Barc). 2009 [Epub ahead of print]. Wilczynski NL. Quality of reporting of diagnostic accuracy studies: No change since STARD statement publication: before-and-after study. Radiology. 2008;248:817-23. Hayes DF, Bast RC, Desch CE, Fritsche H, Kemeny NE, Jessup JM, et al. Tumor marker utility grading system: A framework to evaluate clinical utility of tumor markers. J Natl Cancer Inst. 1996;88:1456-66. Hayes DF, Trock B, Harris AL. Assessing the clinical impact of prognostic factors: When is «statistically significant» clinically useful? Breast Cancer Res Treat 1998;52:305-19. Levine MN, Browman GP, Gent M, Roberts R, Goodyear M. When is a prognostic factor useful? A guide for the perplexed. J Clin Oncol. 1991;9:348-56. Bast RC, Ravdin P, Hayes DF, Bates S, Fritsche H, Jessup JM, et al. 2000 Update of recommendations for the use of tumor markers in breast and colorectal cancer: Clinical practice guidelines of the American Society of Clinical Oncology. J Clin Oncol. 2001;19:1865-78. Laupacis A, Wells G, Scout Richardson W, Tugwell P. Users’ guides to the medical literature. V. How to use an article about prognosis. Evidence-Based Medicine Working Group. JAMA. 1994;272:234-7.

& 4 5 6 % * 0 4 % & 1 3 & $ * 4 * Î / % * "( / Î 4 5 * $ " : % & 1 3 0 / Î 4 5 * $ 0 22.

© Elsevier. Fotocopiar sin autorización es un delito.

23.

Gasparini G, Gion M. Molecular-targeted anticancer therapy: Challenges related to study design and choice of proper endpoints. Cancer J. 2000;6:117-31. McShane LM, Altman DG, Sauerbrei W, Taube SE, Gion M, Clark GM; Statistics Subcommittee of the NCI-EORTC Working Group on Cancer Diagnostics. REporting recommendations for tumour MARKer prognostic studies (REMARK). Br J Cancer. 2005;93:387-91.

3FWJTJPOFTTJTUFNgUJDBT (6SS|UJBZ9#POGJMM

© Elsevier. Fotocopiar sin autorización es un delito.

*.1035"/$*"%&-"43&7*4*0/&44*45&.Ç5*$"4 El gran número de publicaciones científicas existentes actualmente pone de manifiesto la necesidad de gestionar de manera eficiente el conocimiento científico. Para hacernos una idea, solamente en la base bibliográfica Medline se hallan indexadas más de cinco mil revistas con más de dieciocho millones de artículos publicados. No solamente nos enfrentamos a una sobresaturación de información científica, sino que la calidad de la misma es muy variable, lo que nos obliga a realizar una valoración crítica cuidadosa antes de aplicarla. No obstante, el tiempo disponible para la obtención y valoración de los estudios suele ser muy limitado. Las revisiones de la literatura científica pueden ayudar a proporcionar información científica de forma rápida, en la medida que resumen en un único documento la información procedente de múltiples estudios individuales. Por este motivo las revisiones han experimentado un auge considerable en los últimos años y se han constituido como una pieza fundamental para la toma de decisiones informadas1. Si en el año 1995 el número de artículos indexados en PubMed como «revisión» era de 48.747, esta cifra aumentó a 64.986 en 2000, y a 85.883 en 2007. Se estima que actualmente se publican unas 2.500 revisiones cada año solamente en Medline, lo que las convierte en una parte esencial de la literatura biomédica2. Sin embargo, no todas las revisiones cumplen adecuadamente esta función. Así, las revisiones narrativas, habitualmente basadas en la opinión, suelen estar escritas por expertos en una determinada área científica, por lo que pueden estar sesgadas por dos razones principales: la posible dependencia de la subjetividad del revisor y la falta de explicitación de los métodos y los criterios de elaboración de la revisión3. Esto no significa que las conclusiones de una revisión narrativa nunca sean correctas, sino que las limitaciones inherentes a su formato impiden al lector conocer cuál es su grado de fiabilidad. De ahí la necesidad de disponer de instrumentos más fiables y precisos, como las revisiones sistemáticas, que nos permitan la toma de decisiones sanitarias sobre una base más sólida de información. Las revisiones sistemáticas se definen como revisiones de la evidencia existente para responder una pregunta bien delimitada, que utilizan métodos específicos y sistemáticos para identi-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ficar, seleccionar y evaluar críticamente la investigación primaria, así como para extraer y analizar los datos de los estudios que se incluyen en la revisión4. La revisión sistemática se puede aplicar a cualquier pregunta de investigación, ya sea sobre la etiología, el diagnóstico o el pronóstico, o de intervención (evaluación del efecto de un tratamiento o intervención), aunque es en estas últimas donde más se han utilizado las revisiones sistemáticas con metaanálisis. Las revisiones sistemáticas pueden incluir o no técnicas de metaanálisis. Los metaanálisis se definen como la utilización de técnicas estadísticas para combinar los datos de los estudios que han intentado responder la misma pregunta y presentarlos y resumirlos de manera gráfica y sintética (fig. 15-1). Aunque a menudo los términos «revisión sistemática» y «metaanálisis» se utilicen indistintamente, no son equivalentes: la revisión sistemática consiste en el proceso llevado a cabo para obtener conclusiones a partir de estudios originales, ya sea combinando estadísticamente o no sus resultados, mientras que el metaanálisis es la combinación matemática de al menos dos estudios para obtener una estimación global del efecto de la intervención que se está evaluando. Mientras que la revisión sistemática siempre es posible, el metaanálisis sólo lo es cuando se cumplen determinadas circunstancias. Cuando la revisión sistemática incluye un metaanálisis, la información proporcionada, además de otras ventajas, presenta la cualidad de ser sintética cuantitativamente, proporcionando un valor numérico que resume el efecto aproximado de la intervención analizada. El lector no sólo desea conocer si un tratamiento o intervención es efectivo o no y en qué condiciones, sino que también necesita saber la magnitud del efecto que cabría esperar cuando se aplica. El valor creciente de las revisiones sistemáticas se pone de manifiesto en el trabajo de la Colaboración Cochrane, el primer propósito de la cual es generar, difundir y actualizar revisiones sistemáticas de alta calidad sobre los efectos de las intervenciones sanitarias. Esta organización internacional sin ánimo de lucro, que comenzó su andadura en el año 1993, publicó por primera vez en el año 1995 su Cochrane Handbook for Systematic Reviews of Interventions (Manual del Revisor Cochrane)5, cuya finalidad principal es ayudar a los autores de revisiones Cochrane a ser sistemáticos y explícitos en el desarrollo de las mismas. Si bien la mayoría de revisiones sistemáticas de la Colaboración Cochrane se basan en ensayos clínicos aleatorizados (ECA), en algunas ocasiones incluyen también otro tipo de diseños (estudios cuasi experimentales y estudios controlados no aleatorizados), especialmente cuando se trata de intervenciones complejas o del ámbito de la salud pública. Un buen ejemplo de ello es el grupo de Práctica Efectiva y Organización de la Atención Sanitaria (Effective Practice and Organisation of Care Group), focalizado en intervenciones educacionales, conductuales, financieras, regulatorias u organizacionales diseñadas para mejorar la práctica profesional y el funcionamiento de los servicios en salud. La información sobre el grupo y sus métodos puede encontrarse en http://www.epoc.cochrane.org/en/index.html.

3&7*4*0/&44*45&.Ç5*$"4

© Elsevier. Fotocopiar sin autorización es un delito.

Figura 15-1. Esquema de un metaanálisis: «Corticoides para el parto prematuro». Explicación del gráfico: La primera versión estructurada publicada en 1989 de esta revisión constituye el logo de la Colaboración Cochrane. El objetivo de esta revisión fue evaluar la efectividad y seguridad a corto y largo plazo de la administración de corticoides en mujeres gestantes con la finalidad de acelerar la maduración pulmonar fetal antes de un parto prematuro. En la columna de la izquierda se encuentra la lista de los estudios (ECA) de los que se han tomado los datos para el metaanálisis. La segunda columna, con el encabezamiento «Expt», contiene los datos del grupo experimental en cada estudio (mujeres gestantes que recibieron corticoides). Los valores indican el número de neonatos fallecidos (n) y el número total de mujeres que recibieron el tratamiento (N). La siguiente columna, con el encabezamiento «Ctrl», corresponde a los datos del grupo control en cada estudio (aquellas mujeres que recibieron placebo o ningún tratamiento), el número de neonatos fallecidos (n) y el número total de mujeres en este grupo (N). El cuadrado que aparece sobre cada línea del gráfico representa la odds ratio (la medida del efecto utilizada en este análisis) de cada estudio. En el caso de un resultado adverso como es la muerte, si el cuadrado se sitúa a la izquierda de la línea vertical del gráfico, indica que el tratamiento parece reducir el riesgo de muerte. Si se sitúa a la derecha, entonces indica que el tratamiento parece aumentar el riesgo de presentar el desenlace (muerte). El tamaño del cuadrado está en relación con la ponderación relativa de cada estudio particular con respecto al resultado combinado. La ponderación se basa en el número de participantes en cada estudio y el número de desenlaces (muertes). Los estudios más amplios y/o con mayor número de eventos tienen un mayor peso. Las líneas horizontales representan el intervalo de confianza (IC), es decir, el rango de valores dentro del cual se encontraría la odds ratio el 95% de las veces debido a la variación por el azar. Si la línea horizontal cruza la línea vertical central del gráfico, indica que no se puede establecer una conclusión firme a partir de ese estudio acerca de los beneficios o daños del tratamiento. Una línea cuyo extremo termina en forma de flecha indica que el intervalo de confianza se extiende más allá de la escala del gráfico. La figura del diamante en la parte inferior del gráfico representa el resultado de la combinación de los datos de todos los estudios (metaanálisis). Su punto central representa la odds ratio combinada, y su amplitud representa el intervalo de confianza. El estadístico usado por defecto en la Cochrane Library es la odds ratio de Peto calculada según un modelo de efectos fijos. En este caso, la totalidad del diamante se halla a la izquierda de la línea central, lo que permite concluir con seguridad que el tratamiento es efectivo para reducir el riesgo de muerte de los neonatos, ya que este efecto no parece producirse por azar. El resultado combinado muestra la etiqueta «Subtotal» en lugar de «Total» debido a que este gráfico representa un análisis de subgrupo dentro del análisis de la medida de resultado «Mortalidad neonatal» en esta amplia revisión. En la parte más inferior del gráfico se muestra el valor de z, que representa el resultado de la prueba de significación del efecto global, es decir, una medida matemática equivalente a la posición y amplitud del diamante del gráfico. El valor de chi-cuadrado representa la prueba de homogeneidad del tamaño del efecto observado a través de los diferentes estudios, es decir, mide hasta qué punto los resultados de los distintos estudios son concordantes entre sí.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

&45Ç/%"3&41"3"-"16#-*$"$*Î/%&3&7*4*0/&4 4*45&.Ç5*$"4$0/.&5""/Ç-*4*4%&&/4":04 $-Ê/*$04"-&"503*;"%04 Aunque, tal como se ha dicho, el número de revisiones sistemáticas y metaanálisis publicados ha aumentado de forma espectacular en los últimos años, no siempre se han explicitado suficientemente sus métodos, produciendo, por tanto, resultados poco claros o incluso contradictorios. Este hecho ha llevado a la necesidad de desarrollar normas para la publicación de este tipo de trabajos a fin de facilitar su interpretación y utilización por parte de los usuarios. Al igual que a mediados de los años noventa se publicó el informe CONSORT6 para la publicación de ensayos clínicos, en 1996 se creó el grupo QUOROM (Quality of Reporting of Meta-analysis), cuyo objetivo era establecer unas normas para mejorar la calidad de la presentación de los metaanálisis de ECA. Aunque previamente otros autores habían propuesto criterios y directrices para mejorar la calidad de la publicación de metaanálisis, QUOROM constituye la primera propuesta fruto de un amplio consenso que pretende ser de aplicación en las diversas áreas o disciplinas de las ciencias de la salud. QUOROM es un grupo de trabajo multidisciplinario formado por epidemiólogos, clínicos, estadísticos, editores e investigadores. En 1996 tuvo lugar la Conferencia sobre Calidad de Elaboración de los Informes de los Metaanálisis, que dio como resultado la declaración QUOROM7, una lista de comprobación y un diagrama de flujo que facilitan la publicación de metaanálisis de buena calidad metodológica. Se puede consultar más información en: http://www.consort-statement.org/QUOROM.pdf.

%&$-"3"$*Î/26030. La propuesta QUOROM incluye una lista de comprobación (tabla 15-1) y un diagrama de flujo (fig. 15-2). La lista se estructura en seis categorías que se corresponden con cada una de las secciones que componen un artículo científico (Título, Resumen, Introducción, Métodos, Resultados y Discusión) y catorce subcategorías, relacionadas con aspectos más específicos que deberían incluirse en cada una de las categorías anteriores. En total, la lista contiene 18 ítems que deberán considerarse por parte de los autores de metaanálisis. La finalidad de esta lista de comprobación es animar a los autores a que proporcionen toda aquella información que resulta esencial para interpretar y utilizar adecuadamente los resultados de un metaanálisis. A continuación se comentan brevemente cada uno de estos apartados.

5rUVMP El título (ítem 1) del artículo debe identificar el trabajo como un metaanálisis o revisión sistemática de ECA. Un título informativo permite identificar más rápidamente un metaanálisis o una revisión sistemática de nuestro interés. Si además especifica que se trata de una revisión sobre ECA, ayudará a priorizarla frente a otro tipo de revisiones.

3&7*4*0/&44*45&.Ç5*$"4

Tabla 15-1. Lista de comprobación en QUOROM Categoría

Subcategoría

Título

Descriptor

¿Notificado? (Sí/No)

N.o página

Identificar el informe como un metaanálisis (o revisión sistemática de ECA) Utilizar un formato estructurado Describir:

Resumen Objetivos

Explícitamente la pregunta clínica

Fuentes de datos

Las bases de datos (una lista) y otras fuentes de información

Métodos de revisión

Los criterios de selección (población, intervención, resultado y diseño de estudio) Los métodos para evaluar la validez, la extracción de datos y las características de los estudios, así como la síntesis cuantitativa suficientemente detallada para permitir su replicación

Resultados

Características de los ECA incluidos y excluidos, resultados cuantitativos y cualitativos (estimaciones puntuales e intervalos de confianza) y análisis de subgrupos

Conclusión

Los resultados principales Describir: El problema clínico explícitamente, la justificación biológica para la intervención y la justificación de la revisión

Introducción

© Elsevier. Fotocopiar sin autorización es un delito.

Métodos Búsquedas

Las fuentes de información detalladas (como bases de datos, registros, ficheros personales, informes de expertos, agencias, búsqueda manual) así como cualquier restricción (años considerados, estado de la publicación, idioma de la publicación)

Selección

Los criterios de inclusión y exclusión (definiendo la población, la intervención, los resultados principales y el diseño de estudio)

Valoración de la validez

Criterios y proceso empleados (p. ej., condiciones de enmascaramiento, valoración de la calidad y sus hallazgos)

Extracción de datos

Proceso o procesos utilizados (p. ej., de forma independiente o por duplicado)

Características de los estudios

Tipo de diseño científico, características de los participantes, detalles de la intervención, variables de resultado y valoración de la heterogeneidad clínica Continúa

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 15-1. Lista de comprobación en QUOROM (cont.) Categoría

Subategoría

Descriptor

Síntesis cuantitativa de los datos

Las principales medidas de efecto (p. ej., el riesgo relativo), el método de combinación de los resultados (pruebas estadísticas e intervalos de confianza), manejo de los datos ausentes, valoración de la heterogeneidad estadística, justificación de cualquier análisis de sensibilidad o de subgrupo planificado a priori y cualquier valoración del sesgo de publicación

Diagrama de flujo

Ilustrar la estructura del metaanálisis mediante el flujo de los ECA (v. fig. 15-2)

Características de los estudios

Presentar datos descriptivos para cada ensayo (p. ej., edad, tamaño de la muestra, intervención, dosis, duración, período de seguimiento)

Síntesis cuantitativa de los datos

Informar del grado de acuerdo en la valoración de la selección y la validez, presentar un resumen simple de los resultados (para cada grupo de tratamiento en cada ECA, para cada variable de resultado primaria), presentar los datos necesarios para calcular el tamaño de los efectos y los intervalos de confianza en los análisis por intención de tratar

¿Notificado? N.o (Sí/No) página

Resultados

Discusión

Resumir los hallazgos clave, discutir las inferencias clínicas en función de la validez interna y externa, interpretar los resultados en función de la totalidad de la evidencia disponible, describir los potenciales sesgos en el proceso de revisión y sugerir áreas de investigación futura

ECA: ensayo clínico aleatorizado.

3FTVNFO El resumen debe tener un formato estructurado (ítem 2), con una breve descripción de los siguientes apartados: objetivos (ítem 3), fuentes de datos (ítem 4), métodos de la revisión (ítem 5), resultados (ítem 6) y conclusión (ítem 7), los cuales se deberán describir con mayor detalle en la categoría correspondiente (v. más adelante). En los objetivos debe describirse de forma clara y precisa la pregunta clínica a la que la revisión desea dar respuesta. Como veremos más adelante, los objetivos se corresponden directamente con los criterios para la selección de los estudios de la revisión.

3&7*4*0/&44*45&.Ç5*$"4

*OUSPEVDDJwO En la introducción (ítem 8) debe describirse con detalle el problema clínico, los fundamentos biológicos de la intervención y la justificación de la revisión. Las revisiones sistemáticas no surgen de la nada, sino del contexto de un problema clínico relevante en el que existe incertidumbre sobre un determinado tratamiento o intervención. Por eso, el autor debe empezar por justificar la necesidad de la revisión haciendo referencia a la importancia sanitaria del problema y a la controversia existente sobre las intervenciones que se desean revisar.

.nUPEPT El apartado de métodos se compone de varios subapartados. En primer lugar, se solicita a los autores información exhaustiva sobre las búsquedas bibliográficas (ítem 9) llevadas a cabo para identificar los estudios: bases de datos, informes de agencias, guías de práctica clínica, así como registros de estudios, ficheros personales, informes de expertos, búsqueda manual, contactos con agencias de financiación de la investigación, industria farmacéutica, etc. Igualmente se solicita información sobre los años de publicación considerados, así como el estado de las publicaciones (sólo estudios publicados como originales en revistas o también en forma de resúmenes e incluso estudios no publicados) y el

ECA potencialmente relevantes identificados y seleccionados para su localización (n = ...) ECA excluidos con las respectivas justificaciones (n = ...) ECA localizados para su valoración detallada (n = ...) ECA excluidos con las respectivas justificaciones (n = ...)

© Elsevier. Fotocopiar sin autorización es un delito.

ECA potencialmente apropiados para ser incluidos en el metaanálisis (n = ...) ECA excluidos del metanaálisis con las respectivas justificaciones (n = ...) ECA incluidos en el metaanálisis (n = ...) ECA retirados, por variables de resultado, con su justificación (n = ...) ECA incluidos en el metaanálisis (n = ...)

Figura 15-2. Diagrama de flujo de ensayos clínicos aleatorizados (ECA) en QUOROM.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

idioma de publicación. Existe controversia sobre la importancia de incluir datos no publicados en un metaanálisis8. Algunos estudios que han tratado de evaluar el papel de la «literatura gris» en los resultados de los metaanálisis encontraron que los metaanálisis que se limitaron a considerar sólo los ECA publicados tendían a sobrestimar el efecto de los tratamientos, en comparación con los que también incluyeron literatura gris. Sin embargo, otros estudios no mostraron resultados concluyentes en este sentido9,10. Por lo que respecta al idioma de publicación, existe evidencia de que las restricciones idiomáticas en un metaanálisis pueden conducir a un resultado sesgado11, especialmente en algunos ámbitos, por lo que se anima a los autores a no restringir las búsquedas a un único idioma, habitualmente el inglés. A continuación se solicitan datos sobre la selección (ítem 10) de los estudios, es decir, los criterios de inclusión y exclusión. La selección de estudios para una revisión no puede depender en ningún caso de la dirección de sus resultados, sino que deben establecerse a priori unos criterios explícitos que guíen esta importante decisión por parte de los autores. Estos criterios, que se desprenden directamente de la pregunta formulada en los objetivos del trabajo, consisten en definir con suficiente detalle y precisión la población de interés (en otras palabras, el problema clínico o condición), la intervención (incluye la necesidad de establecer también el grupo control de comparación), las principales variables de resultado que se consideran relevantes (a menudo se requiere de su definición u operativización) y el diseño de estudio que se considera adecuado para la revisión. De estos criterios no sólo dependerán las decisiones acerca de la selección de estudios, sino también el diseño de la estrategia de búsqueda. El siguiente apartado hace referencia a la valoración de la calidad (ítem 11) de los estudios incluidos. Existe evidencia directa12-15 de la que se deriva la necesidad de documentar la calidad de los ECA incluidos en el metaanálisis, ya que numerosos estudios han demostrado que la inclusión de estudios de baja calidad tiende a que se sobrestimen los efectos de la intervención valorada. Por ello, es importante que el lector de la revisión pueda conocer la calidad de las pruebas a partir de las cuales se construye la misma y se generan sus conclusiones. Es por este motivo que QUOROM establece la necesidad de explicitar los criterios (p. ej., asignación aleatoria, encubrimiento de las asignaciones, enmascaramiento y pérdidas en el seguimiento) y el proceso utilizado (p. ej., utilización de escalas y scores). Tratándose de un aspecto cualitativo de tanta importancia que está sujeto a un juicio subjetivo, es relevante conocer quién o quiénes aplicaron estos criterios y cómo. Los expertos, entre ellos la Colaboración Cochrane, sugieren que se haga al menos por pares de forma independiente, previendo un sistema para resolver las posibles discrepancias. Posteriormente, debe presentarse el proceso o procesos empleados para la extracción de los datos (ítem 12) de los estudios (p. ej., de forma independiente, por duplicado, utilizando una hoja de extracción de datos diseñada de forma específica para la revisión) y deben describirse las características de los estudios (ítem 13): tipo de diseño, características de los participantes, detalles de la intervención, definición de las variables de resultado y valoración de la heterogeneidad clínica. Habitualmente se recomienda acompañar esta sección de la revisión con una tabla-resumen.

3&7*4*0/&44*45&.Ç5*$"4

El último apartado de métodos hace referencia a la síntesis cuantitativa de los datos (ítem 14). Deben especificarse las principales medidas de efecto (como el riesgo relativo), los métodos estadísticos empleados para la combinación de los resultados (ya que existen diversas estrategias de análisis alternativas, unas más conservadoras que otras, que deben explicitarse), el manejo de los datos no disponibles (debe conocerse si se imputaron o no valores para los datos no disponibles en el cálculo de las medidas de efecto) y la valoración de la heterogeneidad estadística entre los estudios incluidos (sólo está justificado aplicar técnicas de metaanálisis cuando los resultados de los diferentes estudios que se pretende combinar son razonablemente homogéneos o consistentes). Asimismo, debe justificarse a priori cualquier análisis de sensibilidad y de subgrupo. Finalmente, se recomienda documentar la estrategia utilizada para analizar el sesgo de publicación.

© Elsevier. Fotocopiar sin autorización es un delito.

3FTVMUBEPT En el apartado de resultados debe presentarse el diagrama de flujo de ensayos clínicos (ítem 15) (v. fig. 15-2), en el que se describe todo el proceso desde la identificación inicial de los ECA potencialmente relevantes hasta la selección definitiva de los mismos. A su vez, deben detallarse los eventuales motivos para la exclusión de cualquier trabajo, pues es importante que el lector perciba que la selección de estudios en la revisión no ha sido un proceso arbitrario. A continuación, deben presentarse las características de cada uno de los estudios (ítem 16), como la edad de los pacientes, el tamaño de la muestra, la intervención, la dosis, la duración y el período de seguimiento). Esta información permitirá al lector conocer hasta qué punto los estudios finalmente incluidos en la revisión sistemática son homogéneos desde el punto de vista clínico, lo que a su vez ayudará a valorar la pertinencia o no de un metaanálisis y su aplicabilidad. El último apartado de los resultados lo constituye la síntesis cuantitativa de los datos (ítem 17). En primer lugar, debe presentarse un informe sobre el grado de acuerdo entre los autores de la revisión sobre la selección de los estudios y la valoración de su calidad. Un alto grado de acuerdo garantiza que los criterios se han aplicado de forma consistente. Posteriormente, deben exponerse de forma clara y ordenada los resultados para cada grupo de tratamiento en cada ECA y para cada variable de resultado relevante. Además, hay que proporcionar los datos necesarios para calcular el tamaño del efecto y los intervalos de confianza según un análisis por intención de tratar, por ejemplo mediante tablas de 2 × 2, medias y desviaciones estándar, proporciones, etc. Sólo una presentación clara de los datos permite al lector valorar e interpretar adecuadamente los resultados. En ocasiones, el lector puede desear reanalizar los datos según un criterio distinto al de la revisión, para lo que necesitará disponer de los datos crudos, completos y presentados de forma ordenada.

%JTDVTJwO Finalmente, en la discusión (ítem 18) deben resumirse los resultados principales, discutiendo las implicaciones para la práctica clínica a partir de la validez interna y externa de la revisión. Los resultados tienen que interpretarse en

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

función de la totalidad de la evidencia disponible. También deben describirse los sesgos potenciales que han podido incidir en el proceso de revisión y que podrían cuestionar las conclusiones o imponer mucha cautela en su interpretación. Finalmente, puesto que las revisiones sistemáticas también permiten delimitar las áreas de incertidumbre en las que no existe evidencia o ésta es controvertida, permiten señalar futuras líneas de investigación necesarias para cubrir estas lagunas en el conocimiento.

*.1"$50%&26030.&/-"$"-*%"% %&-"416#-*$"$*0/&4 Algunos aspectos criticados de la versión inicial de QUOROM es que no especifique la afiliación o fuentes de financiación de los autores o la comparabilidad entre los grupos de tratamiento de los documentos originales16. Estas normas de publicación han sido revisadas por sus autores en nueva versión modificada, que ha adoptado el nuevo nombre de PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses, http://www.prisma-statement.org/)17. Aunque la aparición de las iniciativas mencionadas refleja la necesidad de mejorar la publicación de todo tipo de estudios en las revistas biomédicas, sólo CONSORT parece haber logrado un alto grado de aceptación, por lo que ha sido incorporada por la World Association of Medical Editors, el International Committee of Medical Journals Editors (ICMJE) y el Council of Science Editors18. No ha sido ésta todavía la suerte de QUOROM, pues no se han realizado estudios sobre su impacto en cuanto a la mejoría de la calidad de los metaanálisis después de su publicación ni de su inclusión como criterio editorial de las revistas biomédicas. Aunque la aplicación del checklist de QUOROM no resulta complejo ni consume excesivo tiempo, desafortunadamente muchas revistas, en especial las de especialidades médicas donde se publica el mayor número de las revisiones sistemáticas, todavía no lo han adoptado, por lo que se plantean dudas acerca de la fiabilidad de sus resultados y conclusiones. Algunos estudios han tratado de evaluar el grado de cumplimiento de las recomendaciones de QUOROM y su impacto a lo largo del tiempo. En un estudio reciente19 se identificaron todos los metaanálisis de ECA (161) publicados en Medline entre los años 2000 y 2005, y se aplicaron los criterios de QUOROM. La puntuación media obtenida fue de 12,3 puntos (sobre un máximo de 18), con un rango entre 4,5 y 16,5. Lo más significativo fue la constatación de un incremento en la puntuación media a lo largo del tiempo (10,5 en 2000 hasta 13,0 en 2005). Se halló que las revisiones Cochrane tenían mayor calidad que los metaanálisis publicados en revistas. Aunque se observó una mejoría a lo largo del tiempo en la mayoría de ítems de QUOROM, no obstante, persistieron las insuficiencias en algunos de ellos, como son la comunicación de los resultados (ítem 17), la discusión (ítem 18) y, sobre todo, el diagrama de flujo de los estudios (ítem 15). Otro estudio reciente20 identificó 300 revisiones sistemáticas indexadas en PubMed en noviembre de 2004 y publicadas en inglés. En su mayoría consistían en revisiones terapéuticas (71%) publicadas en revistas de especialidades médi-

3&7*4*0/&44*45&.Ç5*$"4

cas (91%). En el 54% se había realizado un metaanálisis. Nuevamente, se halló que las revisiones Cochrane tenían mayor calidad que las revisiones publicadas en revistas biomédicas con sistema de revisión por pares. Algunas de las explicaciones para esta superioridad de las revisiones Cochrane son la existencia de un Tabla 15-2. Esquema de una revisión Cochrane Carátula t 5ÓUVMP t 3FWJTPSFT t 'VFOUFTEFBQPZP t 2VÏDPOUFOJEPFTOVFWP Texto de la revisión t 4JOPQTJT t 3FTVNFO t "OUFDFEFOUFT t 0CKFUJWPT t $SJUFSJPTQBSBMBTFMFDDJØOEFMPTFTUVEJPTEFFTUBSFWJTJØO — Tipos de estudios — Tipos de participantes — Tipos de intervenciones — Tipos de medidas de resultado (outcomes) t &TUSBUFHJBEFCÞTRVFEBQBSBMBJEFOUJGJDBDJØOEFMPTFTUVEJPT t .ÏUPEPTEFSFWJTJØO t %FTDSJQDJØOEFMPTFTUVEJPT t $BMJEBENFUPEPMØHJDB t 3FTVMUBEPT t %JTDVTJØO t $PODMVTJPOFTEFMPTSFWJTPSFT — Implicaciones para la práctica — Implicaciones para la investigación t "HSBEFDJNJFOUPT t $POGMJDUPTEFJOUFSÏT

© Elsevier. Fotocopiar sin autorización es un delito.

Referencias t 3FGFSFODJBTEFMPTFTUVEJPT — Estudios incluidos — Estudios excluidos — Estudios pendientes de evaluación — Estudios en curso t 0USBTSFGFSFODJBT — Referencias adicionales — Otras versiones publicadas de esta revisión Tablas y figuras t $BSBDUFSÓTUJDBTEFMPTFTUVEJPTJODMVJEPT t $BSBDUFSÓTUJDBTEFMPTFTUVEJPTFYDMVJEPT t $BSBDUFSÓTUJDBTEFMPTFTUVEJPTFODVSTP t $PNQBSBDJPOFT EBUPTZHSÈGJDPT t 5BCMBTBEJDJPOBMFT

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

protocolo previo a la revisión y el compromiso de realizar actualizaciones periódicas. El proceso de elaboración y publicación de una revisión Cochrane es un proceso altamente estructurado y estandarizado, tal como queda reflejado en el Manual de Revisores Cochrane (disponible on line en: http://www.cochranehandbook.org). Entre otros aspectos, este manual establece la estructura de una revisión sistemática Cochrane, tal como queda esquematizado en la tabla 15-2. El esquema de una revisión Cochrane no es exactamente igual al que propone QUOROM, pues la publicación en la Cochrane Library (y en la Biblioteca Cochrane Plus, la versión en castellano) no tiene las limitaciones de espacio habituales de las revisiones que se publican en revistas biomédicas, por lo que suelen ser mucho más exhaustivas. No obstante, ambos formatos comparten unos mismos criterios de rigor, transparencia y precisión y las iniciativas que las impulsan reflejan una misma preocupación y un mismo compromiso en garantizar la calidad y utilidad para el lector de las revisiones sistemáticas, a fin de que sean instrumentos válidos para la toma de decisiones. Además, el estudio halló importantes déficits en un porcentaje elevado de las revisiones publicadas en revistas biomédicas, como, por ejemplo, la no especificación del período de la búsqueda bibliográfica, la falta de información sobre la calidad de los estudios, la ausencia de un análisis del sesgo de publicación, la falta de detalles acerca de los criterios de elegibilidad, o bien la ausencia de valoración de los potenciales riesgos de la intervención. También existían sospechas de un sesgo por la notificación selectiva de resultados. Aunque la limitación de espacio en las revistas biomédicas puede suponer una dificultad que contribuye a que la información sea incompleta, la falta de unos criterios claros por parte de los autores parece ser la razón fundamental de este problema. Estas razones apoyan la necesidad de un uso extendido de QUOROM y su adopción por parte de los editores de las revistas biomédicas, dada la importancia creciente de las revisiones en la literatura biomédica y como herramienta de soporte en la toma de decisiones. Esta aspiración se ve reforzada por el hecho de que la calidad de las revisiones publicadas en revistas que han adoptado los criterios QUOROM también es mayor que la de aquellas que no lo han hecho21.

&45Ç/%"3&41"3"-"16#-*$"$*Î/%&.&5""/Ç-*4*4 %&&456%*040#4&37"$*0/"-&4&/&1*%&.*0-0(Ê" Existen muchas situaciones donde el ensayo clínico controlado y aleatorizado no es posible, y sólo se dispone de datos procedentes de estudios observacionales. Por ejemplo, en los estudios acerca de factores de riesgo o de exposiciones que pueden causar daño, la exposición no puede asignarse al azar, bien porque está relacionada con características inherentes a los sujetos de estudio (p. ej., grupo sanguíneo, sexo o una característica genética determinada), bien porque no resulta ético ni aceptable exponer a los individuos a exposiciones que podrían causarles daño (p. ej., al asbesto o una radiación ionizante). Los estudios observacionales también se han utilizado habitualmente para el estudio de la efectividad de intervenciones complejas en el campo de la salud pública, como programas sanitarios o intervenciones educacionales, dadas las dificultades prácticas para

3&7*4*0/&44*45&.Ç5*$"4

© Elsevier. Fotocopiar sin autorización es un delito.

realizar un estudio experimental en este contexto o también la necesidad de explorar el efecto de la intervención en la comunidad en condiciones normales. A diferencia de los estudios experimentales, en los estudios observacionales la asignación a la exposición (estudios etiológicos) o intervención (estudios de efectividad) de interés no depende del azar, y se estudia la asociación entre los cambios o diferencias observadas en una característica (la exposición o la intervención) y los cambios o diferencias observados en una medida de resultado de interés. Algunos diseños de estudios observacionales son los que utilizan datos procedentes de bases de datos existentes, los estudios de corte transversal, las series de casos, los estudios de casos y controles, los estudios con controles históricos y los estudios de cohortes. La aplicación del metaanálisis en los estudios observacionales ha sido un tema muy controvertido, dado el mayor riesgo potencial de sesgo en este tipo de estudios en comparación con los ensayos clínicos controlados y aleatorizados. Además, la gran diversidad de diseños en los estudios observacionales y en las poblaciones estudiadas hace particularmente problemática la interpretación de una medida resumen a partir de la combinación de sus resultados. Por esta razón, no es de extrañar que exista un claro predominio de metaanálisis de ensayos clínicos en la literatura biomédica. No obstante, el número de metaanálisis de estudios observacionales publicados ha aumentado progresivamente, pues son una herramienta de gran ayuda en la toma de decisiones especialmente en el área de la salud pública y la política sanitaria. Por esta razón, y dados los retos particulares que presentan este tipo de estudios a causa del riesgo inherente de sesgos y las diferencias en los diseños de los estudios observacionales, se hacía necesario disponer de una herramienta que ayudara a mejorar la calidad de los informes publicados de este tipo de metaanálisis. En 1997 se creó el grupo MOOSE (The Meta-analisis of Observational Studies in Epidemiology), formado por 27 expertos procedentes de diferentes áreas (clínicos, investigadores clínicos y sociales, estadísticos, epidemiólogos y editores), cuyo objetivo era confeccionar una lista de comprobación que ayudara a mejorar la calidad de la presentación de los metaanálisis de estudios observacionales. El grupo de trabajo celebró un seminario en 1997 que dio como resultado la propuesta MOOSE22.

13016&45".004& La propuesta MOOSE consiste en una lista de comprobación (tabla 15-3) donde se establece un total de 35 recomendaciones estructuradas en seis grandes apartados: introducción, estrategia de búsqueda, métodos, resultados, discusión y conclusiones. A continuación se comentan brevemente cada uno de estos apartados.

*OUSPEVDDJwO La introducción debe incluir una definición del problema, la hipótesis del estudio, una descripción de la(s) medida(s) de resultado considerada(s), del tipo

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 15-3. Lista de comprobación MOOSE (propuesta para autores, editores y revisores de metaanálisis de estudios observacionales) t -BTFDDJØOEFMBJOUSPEVDDJØOEFCFSÓBJODMVJS — Definición del problema — Hipótesis planteada — Descripción de la(s) medida(s) de resultado — Tipo de exposición o intervención utilizada — Tipo de diseños de estudio utilizados — Población de estudio t -BTFDDJØOEFMBestrategia de búsqueda debería incluir: — Calificación de quién realizó la búsqueda (documentalistas e investigadores) — Estrategia de búsqueda, incluyendo el período de tiempo y palabras clave utilizadas — Esfuerzos realizados para incluir todos los estudios disponibles, incluyendo contacto con los autores — Bases de datos y registros consultados — Software utilizado para la búsqueda, su nombre y versión, incluyendo funcionalidades especiales (p. ej., explosión) — Búsqueda manual (p. ej., lista de referencias de los estudios recuperados) — Listado de las citaciones localizadas y de las excluidas, con su justificación — Método empleado para los estudios publicados en otros idiomas distintos del inglés — Método empleado para los estudios no publicados y los resúmenes — Descripción de los contactos con autores t -BTFDDJØOEFMPTmétodos debería incluir: — Descripción de la relevancia y justificación de los estudios seleccionados para demostrar la hipótesis del estudio — Justificación de la selección y sistema de codificación de los datos (p. ej., según criterios clínicos establecidos o por conveniencia) — Documentación acerca de cómo los datos fueron clasificados y codificados (p. ej., múltiples evaluadores, cegamiento y fiabilidad interobservador) — Valoración de los factores de confusión (p. ej., comparabilidad entre casos y controles) — Valoración de la calidad de los estudios, incluyendo el cegamiento de los evaluadores; estratificación o regresión para posibles factores predictivos de los resultados — Valoración de la heterogeneidad — Descripción suficientemente detallada de los métodos estadísticos (p. ej., una descripción completa del modelo de efectos fijos o aleatorios, justificación acerca de si el modelo seleccionado tiene en cuenta los factores predictores de los resultados, modelos de dosis-respuesta, o metaanálisis acumulativo) para poder ser reproducidos — Presentación adecuada de los resultados en forma gráfica o en tablas t -BTFDDJØOEFMPTresultados debería incluir: — Resumen gráfico de los resultados (estimadores) individuales y globales — Tabla descriptiva con información de todos los estudios incluidos — Resultados de los análisis de sensibilidad o de subgrupo — Medida de la incertidumbre estadística de los resultados t -BTFDDJØOEFMBdiscusión debería incluir: — Valoración cuantitativa de los sesgos (p. ej., sesgo de publicación) — Justificación de las exclusiones (p. ej., exclusión de estudios en idioma distinto al inglés) — Valoración de la calidad de los estudios incluidos t -BTFDDJØOEFMBTconclusiones debería incluir: — Posibles explicaciones alternativas para los resultados observados — Generalización de las conclusiones (p. ej., a partir de los datos disponibles y en el contexto de lo que se sabe sobre el tema) — Orientaciones para la investigación futura — Fuentes de financiamiento

de exposición o intervención estudiado, del tipo de diseño utilizado, así como una descripción detallada de la población de estudio. Esta descripción detallada resulta especialmente pertinente en este tipo de metaanálisis donde cabe esperar un elevado grado de heterogeneidad entre los estudios seleccionados (diferencias en la población de estudio, en el diseño y/o en las medidas de resultado) que repercutirá en los resultados.

3&7*4*0/&44*45&.Ç5*$"4

&TUSBUFHJBEFC|TRVFEB La estrategia de búsqueda debe especificar la cualificación de quién realiza la búsqueda, las bases de datos electrónicas y otros registros utilizados, el diseño de la estrategia de búsqueda con los términos empleados y el período, la utilización de software específico, la búsqueda manual y el contacto con los autores, las restricciones idiomáticas en la selección de los estudios, el uso de material no publicado y de resúmenes, así como los criterios de exclusión. Algunos estudios han puesto de manifiesto las insuficiencias en la descripción de la estrategia de búsqueda en la mayoría de metaanálisis publicados23.

.nUPEPT Los métodos deben incluir una descripción de la relevancia de los estudios seleccionados y justificación de su combinación en el metaanálisis, el grado en que la clasificación y la codificación de los datos en los estudios estaban especificadas y fueron objetivas, la valoración de los factores de confusión, de la calidad de los estudios y de la heterogeneidad entre éstos, una descripción de los métodos estadísticos utilizados en el análisis y la presentación de los resultados en forma gráfica o en tablas. La valoración de la calidad de los estudios resulta de particular importancia por su potencial efecto sobre los resultados. Por ello, resulta muy recomendable explorar, mediante análisis de subgrupo o de sensibilidad, cómo determinadas características clave del diseño están influyendo en los resultados y cómo ello explica la variabilidad observada entre los estudios. Los análisis estratificados o de regresión pueden también ser muy útiles para este propósito. En resumen, las fuentes de sesgo y de heterogeneidad pueden ser previstas a priori y, en consecuencia, confirmadas en el análisis.

© Elsevier. Fotocopiar sin autorización es un delito.

3FTVMUBEPT Los resultados deben incluir un resumen gráfico de los resultados (estimaciones) de los estudios incluidos en la revisión y de cualquier combinación de los mismos, una tabla descriptiva con información esencial de cada estudio, resultados de los análisis de sensibilidad o de cualquier análisis de subgrupo realizado, y una medida de la incertidumbre estadística de los resultados.

%JTDVTJwO La discusión debe abordar el problema de los sesgos, incluido el sesgo de publicación, los factores de confusión y la calidad de los estudios. Tanto los defectos en el diseño de los estudios, como en el modo en que los estudios son seleccionados en la revisión, tienden a distorsionar la magnitud o la dirección de las asociaciones observadas y, por tanto, cuestionan la validez del metaanálisis. Las variaciones en la calidad de los estudios pueden explicar a su vez la variabilidad en sus resultados.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

$PODMVTJwO Debido al elevado riesgo de sesgo inherente a los estudios observacionales, la conclusión debe tener en cuenta otras posibles explicaciones alternativas para los resultados observados, así como el grado en que la generalización de éstos resulta o no adecuada (a partir de los datos disponibles y en el contexto de lo que se sabe sobre el tema). El metaanálisis también puede ayudar a identificar áreas que requieren mayor investigación. Las fuentes de financiamiento deben ser reveladas y su influencia, explorada en los resultados en caso de ser necesario.

#*#-*0(3"'Ê" 1.

2. 3. 4.

5. 6.

7.

8.

9. 10. 11.

12.

13.

14.

15.

Ceballos C, Valdizan JR, Artal A, Almarcegui, Allepuz C, García Campayo, et al. ¿Por qué la medicina basada en la evidencia? 20 años de metaanálisis. An Med Interna. 2000;17:521-6. Moher D, Tetzlaff J, Tricco AC, Sampson M, Altman DG. Epidemiology and reporting characteristics of systematic reviews. PLoS Med. 2007;4:e78. Gispert JP, Bonfill X. ¿Cómo realizar, evaluar y utilizar revisiones sistemáticas y metaanálisis? Gastroenterol Hepatol. 2004;27:129-49. Alderson P, Green S, Higgins JPT, eds. Cochrane Reviewers’ Handbook 4.2.2 [updated December 2003]. en: The Cochrane Library, Issue 1, 2004. Chichester, Reino Unido: John Wiley & Sons, Ltd.; 2003. http://www.cochrane-handbook.org/. Begg CB, Cho MK, Eastwood S, Horton R, Moher D, Olkin I, et al. Improving the quality of reporting of randomized controlled trials: the CONSORT statement. JAMA. 1996;276:637-9. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF, et al. Improving the quality of reports of meta-analyses of randomised controlled trials: The QUOROM statement. Lancet. 1999;354:1896-900. Cook DJ, Guyatt GH, Ryan G, Clifton J, Buckingham L, Willan A, et al. Should unpublished data be included in meta-analysis? Current convictions and controversies. JAMA. 1993;269:2749-53. Easterbrook PJ, Berlin JA, Gopalan R, Matthews DR. Publication bias in clinical research. Lancet. 1991;337:867-72. Smith ML. Publication bias and meta-analysis. Eval Educ. 1980;4:22-4. Moher D, Pham B, Klassen TP, et al. Does the language of publication of reports of randomized controlled trials influence the estimates of intervention effectiveness reported in meta-analyses? 6th Cochrane Colloquium; 1998. Schultz KF, Chalmers I, Hayes RJ, Altman DG. Empirical evidence of bias: Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA. 1995;273:408-12. Moher D, Pham B, Jones A, Cook DJ, Jadad AR, Moher M, et al. Does the quality of reports of randomised trials affect estimates of intervention efficacy reported in meta-analyses? Lancet. 1998;352:609-13. Jadad AR, Moore RA, Carroll D, Jenkinson C, Reynolds DJ, Gavaghan DJ, et al. Assessing the quality of reports of randomized clinical trials: Is blinding necessary? Control Clin Trials. 1996;17:1-12. Berlin JA, on behalf of the University of Pennsylvania meta-analysis blinding study group. Does blinding of readers affect the results of meta-analyses? Lancet. 1997;350:185-6.

3&7*4*0/&44*45&.Ç5*$"4 16. 17. 18. 19. 20. 21.

22.

© Elsevier. Fotocopiar sin autorización es un delito.

23.

Christensen E. Quality of reporting of meta-analyses: The QUOROM statement. Will it help? J Hepatol. 2001;34:342-5. The PLoS Medicine Editors. Many reviews are systematic but some are more transparent and completely reported than others. PloS Med. 2007;4:e147. Altman DG. Endorsement of the CONSORT statement by high impact medical journals: Survey of instructions for authors. BMJ. 2005;330:1056-7. Wen J, Ren Y, Wang L, Li Y, Liu Y, Zhou M, et al. The reporting quality of meta-analyses improves: A random sampling study. J Clin Epidemiol. 2008;61:770-5. Moher D, Tetzlaff J, Tricco AC, Sampson M, Altman DG. Epidemiology and reporting characteristics of systematic reviews. PLoS Med. 2007;4:e78. Mrkobrada M, Thiessen-Philbrook H, Haynes B, Iansavichus AV, Rehman F, Garg AX. Need for quality improvement in renal systematic reviews. Clin J Am Soc Nephrol. 2008;3:1102-14. Stroup DF, Berlin JA, Morton SC, Olkin I, Williamson GD, Rennie D, et al. Meta-analysis of observational studies in epidemiology. A proposal for reporting. JAMA. 2000;283:2008-12. Sipe TA, Curiette WL. A meta-synthesis of factors related to educational achievement. Int J Educ Res. 1997;25:583-98.

$BMJEBEEFWJEB SFMBDJPOBEBDPOMBTBMVE ZPUSPTSFTVMUBEPT QFSDJCJEPTQPSMPTQBDJFOUFT +.7BMEFSBTZ+"MPOTP

© Elsevier. Fotocopiar sin autorización es un delito.

*/7&45*("$*Î/&/3&46-5"%04&/4"-6% La calidad de vida relacionada con la salud (CVRS) es una variable de interés para los servicios sanitarios, en primer lugar, por su asociación clara y consistente con fenómenos de salud tan relevantes e inequívocos como la mortalidad, la hospitalización y el consumo de recursos sanitarios1. Diversos estudios han demostrado a lo largo de las tres últimas décadas que la salud percibida (medida a través de una pregunta sobre la salud general entre excelente y mala) se asocia de manera independiente de los diagnósticos clínicos y otros factores de riesgo a la mortalidad a medio plazo (entre 6 y 9 años)2-5. Un ensayo clínico sobre la eficacia de la rehabilitación respiratoria demostró que la CVRS era un predictor independiente de la mortalidad a los 6 años5. La asociación de la CVRS era de magnitud similar a la mostrada por el volumen espiratorio forzado durante el primer segundo (%FEV1) de estos pacientes. Conviene señalar que el %FEV1 se utiliza como principal indicador de la gravedad clínica de la enfermedad pulmonar obstructiva crónica (EPOC)6, entre otros motivos, por su capacidad predictiva de la mortalidad en estos pacientes 7. También se ha establecido que la CVRS predice de manera independiente la hospitalización8, la utilización de los servicios de atención primaria9 y, por tanto, resulta una variable fundamental asociada con el gasto sanitario. Todos estos eventos a los que se asocia la CVRS son sustantivos y se sitúan claramente en el campo de acción de los servicios sanitarios. Un segundo argumento que ilustra el interés de la medida de la CVRS es la comprobación empírica de que su asociación con los indicadores fisiopatológi-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

cos de enfermedad utilizados con más frecuencia en la clínica es débil o, en el mejor de los casos, moderada10. Las correlaciones entre las puntuaciones de cuestionarios genéricos, como el Perfil de Salud de Nottingham (PSN) o el Cuestionario de Salud SF-36, y el %FEV1, o el resultado de la prueba de esfuerzo y de otros muchos indicadores clínicos, se sitúan entre 0,25 y 0,6. Por su parte, los cuestionarios específicos, como el Saint George’s Respiratory Questionnaire (SGRQ) o el Asthma Quality of Life Questionnaire no superan una correlación de 0,7 con indicadores clínicos específicos 11. Es decir, a pesar de que ambos tipos de instrumentos, los cuestionarios de CVRS y los marcadores fisiopatológicos de enfermedad, miden conceptos relacionados, la variación compartida es escasa. Este hecho sugiere más una complementariedad que un solapamiento en esas mediciones y, por tanto, que su utilización conjunta proporcione una información más completa de los fenómenos de salud/enfermedad que se pretenden evaluar. Cada vez más la CVRS se está convirtiendo en un objetivo terapéutico en sí misma. Esto es especialmente importante en pacientes con enfermedades crónicas y en aquellos con una esperanza de vida limitada. En otras ocasiones, algunas terapias no pretenden tanto la mejoría biológica como un incremento del afrontamiento o de la adaptación del paciente a la enfermedad. Por todo ello se hace necesario disponer de un marco conceptual de la CVRS y de instrumentos adecuados para su medición12. El interés por la medida de la CVRS se ha traducido en una notable labor investigadora en los últimos treinta años13, 14. En particular, se ha profundizado en numerosos aspectos de la metodología, lo que justifica sobradamente la conveniencia de recoger en una guía los elementos primordiales que deben estar presentes en la publicación de trabajos que incluyen esta variable. Éste es precisamente el objetivo de este capítulo, en el que además se pretende proporcionar una somera introducción a la tipología de instrumentos disponibles para la medición de CVRS y de otras variables relacionadas, así como proporcionar una guía básica de publicaciones científicas periódicas que merece la pena considerar a la hora de publicar manuscritos con estas variables de resultado.

*/4536.&/504%&.&%*%"%&$"-*%"%%&7*%" :3&46-5"%041&3$*#*%04103-041"$*&/5&4 $7311

El desarrollo de medidas CVRS ha seguido una tendencia prácticamente exponencial en las últimas décadas. Estimaciones basadas únicamente en publicaciones en inglés situaron el número disponible a nivel mundial en un mínimo de 1.275 instrumentos, con gran preponderancia de los específicos para pacientes con determinadas enfermedades15. La misma tendencia se puede observar en los instrumentos disponibles en edad pediátrica16. La elaboración de estos instrumentos no ha sido el resultado de una planificación sistemática, por lo que con frecuencia existe más de un instrumento específico para la evaluación de un mismo problema de salud, mientras que no se dispone de ninguno que sea específico para otros muchos problemas.

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

Los instrumentos de medida de CVRS han aparecido típicamente en forma de cuestionarios estandarizados. La mayoría se han desarrollado en países anglosajones, principalmente en EE.UU., Gran Bretaña y Canadá. Desde un punto de vista conceptual, las notables diferencias entre países justifican que, si no se han desarrollado originalmente para su uso en población española, estos instrumentos deban pasar por un proceso de adaptación transcultural y por ello se suele diferenciar entre instrumentos originales y adaptados 17, 18. En el caso de España, se cuenta con algunas medidas concebidas y desarrolladas para su uso en nuestra población, pero lo más frecuente ha sido la adaptación de instrumentos desarrollados en otros países. La biblioteca virtual BiblioPRO, de acceso libre y gratuito, es una base de datos accesible a través de Internet. Ha sido desarrollada por la Unidad de Investigación en Servicios Sanitarios del IMIM-Hospital del Mar, actualmente cataloga más de 500 instrumentos para uso en población española y forma parte de CIBERESP (CIBER en Epidemiología y Salud Pública)19. Sin embargo, la definición de la CVRS y de los conceptos asociados, como estado funcional o salud percibida, dista de estar resuelta. Por ello, la Food and Drug Administration (FDA) ha propuesto recientemente el concepto «resultados percibidos por los pacientes» para referirse de forma genérica a todos estos instrumentos, sin entrar en precisiones sobre su tipología: la medición de cualquier aspecto del estado de salud del paciente que proviene directamente del mismo (esto es, sin interpretación de las respuestas del paciente por parte del médico u otra persona)20,21. Una propuesta reciente de clasificación de instrumentos ha intentado dotar de solidez a este concepto a partir de un modelo conceptual bien establecido10 y con evidentes puntos de contacto con el modelo propuesto por la Organización Mundial de la Salud para la Clasificación Internacional de Funcionamiento12 (tabla 16-1). En ella se diferencian tres ejes principales: el constructo (objeto de la medición), la población y la medición (el modelo de resumen de la información o puntuaciones), con diversas categorías en cada eje. Mediante este sistema es posible conocer de forma unívoca las características clave de un instrumento de resultados percibidos por los pacientes.

© Elsevier. Fotocopiar sin autorización es un delito.

(6Ê"1"3"-"&7"-6"$*Î/%&*/4536.&/504 %&.&%*$*Î/%&-"$734&--*45"%0&.130 Las listas o guías (checklists) se han hecho muy populares en el ámbito de la evaluación de la calidad de la literatura científica. Estas guías facilitan el recordatorio de todas las características metodológicas fundamentales a tener en cuenta, así como de los niveles cuantitativos, en su caso. Algunas listas han trascendido ese uso pasando a representar potentes elementos en la formación de los investigadores. Así ha sucedido, por ejemplo, con la colaboración CONSORT, que es un elemento prácticamente imprescindible de cualquier ensayo clínico desde el mismo diseño. En este capítulo revisamos los criterios usados en el listado de comprobación EM-PRO (originalmente e-PRO)22, 23, basados en la propuesta del comité científico del Medical Outcomes Trust24. Esa propuesta ha sintetizado las propuestas previas y ha sistematizado los atri-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 16-1. Sistema de clasificación de resultados percibidos por los pacientes: ejes y categorías Eje A. Constructo

Categoría A.1. Síntomas A.2. Estado funcional A.3. Percepciones de salud A.4. Calidad de vida relacionada con la salud A.5. Otros constructos

B. Población

B.1. Edad

B.2. Sexo

B.3. Enfermedad B.4. Cultura C. Medición

C.1. Modelo de medida

C.2. Dimensionalidad

C.3. Adaptabilidad

Descriptor Clasificación Internacional de Enfermedades (CIE-10) Clasificación Internacional de Funcionamiento (CIF) Sin descriptores específicos de segundo nivel Sin descriptores específicos de segundo nivel A.5.a. Satisfacción con la atención A.5.b. Desventaja A.5.c. Capacidad de recuperación A.5.d. Ambiental B.1.a. Todas las edades B.1.b. Niños B.1.c. Adolescentes B.1.d. Adultos B.1.e. Ancianos B.2.a. Ambos sexos B.2.b. Mujeres B.2.c. Hombres Clasificación Internacional de Enfermedades (CIE-10) Díadas país-idioma C.1.a. Psicométrico C.1.b. Econométrico C.1.c. Otros modelos de medida C.2.a. Índice C.2.b. Perfil C.2.c. Índice y perfil C.3.a. Estandarizado C.3.b. Parcialmente individualizado C.3.c. Individualizado

butos y criterios pertinentes para la evaluación de un instrumento de CVRS; destaca por su actualidad, el carácter sistemático y por el suficiente detalle con que explicita cada criterio. Nuestra propuesta diferencia 8 atributos fundamentales, que incluyen el modelo conceptual y de medida, las características psicométricas clásicas (fiabilidad, validez y sensibilidad al cambio), la interpretabilidad de las puntuaciones, la carga que la administración del instrumento implica para el entrevistador y el entrevistado, y la disponibilidad y características de formatos alternativos al estándar. También se incluye el proceso de adaptación transcultural que se ha seguido, cuando el original se ha desarrollado en un medio distinto. A cada atributo le corresponden una serie de criterios que han de permitir una valoración precisa del mismo. El procedimiento de construcción de un instrumento de medida de resultados percibidos por el paciente es complejo y de naturaleza iterativa. Ello hace que normalmente los atributos de un instrumento se evalúen en distintos artículos científicos. Por ello, el listado de comprobación se ha construido de forma modular, para que pueda ser aplicado únicamente a aquellos atributos que

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

específicamente se pretendan evaluar en un momento dado. A continuación se definen y comentan con mayor detalle cada uno de estos atributos que, junto con los criterios de evaluación, aparecen en la tabla 16-2.

"USJCVUPTEFMPTJOTUSVNFOUPTEFSFTVMUBEPTQFSDJCJEPTQPSMPTQBDJFOUFT DSJUFSJPTQBSBTVFWBMVBDJwO .PEFMPDPODFQUVBMZEFNFEJEB El modelo conceptual que subyace a la construcción y uso de un instrumento se puede entender como la descripción razonada de los conceptos, las relaciones entre esos conceptos y las poblaciones que se pretende evaluar. Este modelo conceptual, teórico, se concreta operativamente en la justificación de la estructura del instrumento y de cada escala, así como de los procedimientos que se siguen para la obtención de las puntuaciones por globales y por escalas. Desde el punto de vista del modelo de medida, es necesario que cada escala mida un único constructo (unidimensionalidad), que las diversas escalas midan constructos distintos y que la escala represente adecuadamente la variabilidad observable. Para la evaluación formal de la dimensionalidad de las escalas y el modelo empírico de medida se pueden utilizar aproximaciones basadas en la teoría clásica de los tests, como el análisis factorial y de componentes principales25. De forma alternativa, se pueden aplicar métodos basados en la teoría de respuesta al ítem (TRI) o en modelos de ecuaciones estructurales26-28. Para la evaluación de la variabilidad, se suelen emplear medidas de tendencia central (p. ej., la media) y de dispersión (p. ej., la desviación estándar) así como indicadores de los efectos techo (proporción de individuos que alcanzan la puntuación máxima) y suelo (proporción de individuos con la puntuación mínima), recomendándose en ambos casos valores inferiores al 15% 29. Finalmente, en ocasiones, los investigadores han realizado laboriosos ejercicios de ponderación para establecer el valor relativo de cada ítem o escala, pero lo más frecuente es que no se aplique ningún tipo de pesos, asumiéndose entonces de forma implícita su equivalencia30.

© Elsevier. Fotocopiar sin autorización es un delito.

'JBCJMJEBE La fiabilidad se ha definido tradicionalmente como el grado en que un instrumento está libre de error aleatorio, una conceptualización complementaria a la que en epidemiología relaciona la validez con la ausencia de error de sistemático. Las fuentes de error aleatorio se han buscado en las respuestas proporcionadas a los diferentes ítems que componen una misma escala en una misma administración del instrumento (consistencia interna), entre las distintas administraciones de un mismo instrumento a la misma población (fiabilidad test-retest) o entre distintos observadores o administradores (fiabilidad interobservadores)31. Para la evaluación de la consistencia interna, el grado en que todos los ítems de una escala miden el mismo constructo, se ha empleado habitualmen-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

Tabla 16-2. Listado de comprobación EM-PRO: atributos y criterios que deberían constar en la publicación de información sobre instrumentos de resultados percibidos por los pacientes Modelo conceptual y de medida t $PODFQUPRVFTFQSFUFOEFNFEJS t 'VOEBNFOUPTQBSBMBPCUFODJØOEFMPTÓUFNTZTVDPNCJOBDJØO t %JNFOTJPOBMJEBEEFMJOTUSVNFOUPZEJTUJODJØOEFFTDBMBT t 1BSUJDJQBDJØOEFMBQPCMBDJØOEJBOBFOMBPCUFODJØOEFMDPOUFOJEP t 7BSJBCJMJEBEEFMBFTDBMBFOMBQPCMBDJØO t &TDBMBEFNFEJEB t 'VOEBNFOUPQBSBFMDÈMDVMPEFMBTQVOUVBDJPOFT Fiabilidad t $POTJTUFODJBJOUFSOB —Métodos para la estimación de la consistencia interna &TUJNBDJØOEFMBDPOTJTUFODJBJOUFSOBTFHÞOUFPSÓBDMÈTJDBEFUFTUT DPOFTUJNBEPSFT DFOUSBMFTZFSSPSFTUÈOEBSEFDBEBQVOUVBDJØO EJNFOTJPOFTZPUPUBM

&TUJNBDJØOEFMBDPOTJTUFODJBJOUFSOBTFHÞOUFPSÓBEFSFTQVFTUBBMÓUFN DPOFSSPSFTUÈOEBS de la medida (EEM) en el rango de puntuaciones y fiabilidad marginal de cada dimensión —Consistencia interna en cada población de interés t 3FQSPEVDJCJMJEBE —Métodos para la estimación de la reproducibilidad 'VOEBNFOUPZEJTF×PEFMBDPNQBSBDJØOUFTUSFUFTU DPOJOUFSWBMPRVFHBSBOUJDFMB estabilidad de la población —Estimación sobre la reproducibilidad test-retest e interevaluador mediante coeficiente de correlación intraclase (CCI) *OGPSNBDJØOTPCSFMBDPNQBSBCJMJEBEEFMPTQBSÈNFUSPTEFMÓUFN EJGJDVMUBE ZEFMB precisión de la medida en administraciones repetidas Validez t 'VOEBNFOUPQBSBMBFTUJNBDJØOEFMBWBMJEF[ t .ÏUPEPTQBSBMBFTUJNBDJØOEFMBWBMJEF[ t $BSBDUFSÓTUJDBTEFMBTNVFTUSBTFNQMFBEBTQBSBMBFTUJNBDJØOEFMBWBMJEF[ t &TUJNBDJPOFTEFMBWBMJEF[FODBEBQPCMBDJØOEFJOUFSÏT t 'PSNVMBDJØOEFIJQØUFTJTBQSJPSJZTVFWBMVBDJØO WBMJEF[EFDPOTUSVDUP

t 'VOEBNFOUPTQBSBMBFMFDDJØOEFMDSJUFSJP WBMJEF[EFDSJUFSJP

Sensibilidad al cambio t .ÏUPEPTQBSBMBFTUJNBDJØOEFMBTFOTJCJMJEBEBMDBNCJP QPCMBDJØO JOUFSWFODJØO JOUFSWBMP

t %JTF×PMPOHJUVEJOBMDPODPNQBSBDJØOEFVOHSVQPFTUBCMFZVOHSVQPRVFIBZBDBNCJBEP t &TUJNBDJØOEFEJGFSFODJBTFOMBTQVOUVBDJPOFT Interpretabilidad t 'VOEBNFOUPTQBSBMBFMFDDJØOEFMPTDSJUFSJPTFYUFSOPTPQPCMBDJPOFT t *OGPSNBDJØOTPCSFMBGPSNBEFQSFTFOUBSMPTSFTVMUBEPT t %BUPTDPNQBSBUJWPTPOPSNBUJWPTEFSFGFSFODJB Carga t 1BSBFMFOUSFWJTUBEP *OGPSNBDJØOTPCSFMBTOFDFTJEBEFTEFBENJOJTUSBDJØO UJFNQP IBCJMJEBEFTEFMFDUVSBZ DPNQSFOTJØO OFDFTJEBEFTFTQFDÓGJDBT

—Demostración de que la administración no supone un esfuerzo físico o emocional —Información sobre las circunstancias en las que la administración no es apropiada Continúa

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

Tabla 16-2. Listado de comprobación EM-PRO: atributos y criterios que deberían constar en la publicación de información sobre instrumentos de resultados percibidos por los pacientes (cont.) t Para el entrevistador —IOGPSNBDJØOTPCSFMBTOFDFTJEBEFTEFBENJOJTUSBDJØO UJFNQP IBCJMJEBEFTZOFDFTJEBEFT específicas de formación u otro tipo) Formatos de administración t *OGPSNBDJØOTPCSFGJBCJMJEBE WBMJEF[ JOUFSQSFUBCJMJEBEZDBSHBQBSBDBEBGPSNBUPEF administración distinto t Información sobre la comparabilidad entre los distintos formatos Adaptación cultural y lingüística t Sólo para instrumentos adaptados (v. tabla 16-3)

© Elsevier. Fotocopiar sin autorización es un delito.

te el coeficiente alfa de Cronbach (y el coeficiente de Kuder Richardson KR20, para opciones de respuesta dicotómicas). Se han propuesto como estándares mínimos apropiados valores de alfa de Cronbach de 0,70 para realizar comparaciones entre grupos. Para comparaciones individuales, el estándar mínimo se fija en 0,90 e incluso 0,95, porque de otra forma el intervalo de confianza de las puntuaciones individuales es tan amplio que el uso del instrumento resultaría ineficiente22. En la aproximación según teoría de respuesta al ítem, la fiabilidad se mide para cada puntuación, pero es posible calcular un parámetro, la fiabilidad marginal, de significado análogo al coeficiente de fiabilidad clásico22. Los otros dos tipos de fiabilidad se conocen también de forma general como reproducibilidad. La reproducibilidad test-retest se evalúa mediante la administración repetida del instrumento de CVRS a una misma población que se haya mantenido estable en relación al constructo objeto de medición. Con frecuencia, sólo es posible asegurar esta estabilidad entre administraciones inmediatas muy seguidas en el tiempo, por lo que en general se selecciona en un lapso que va desde las 24 horas a pocas semanas. En la evaluación de la reproducibilidad test-retest e interobservador se emplean medidas de la concordancia, habitualmente el coeficiente de correlación intraclase, por tratarse de medidas continuas32. Los estándares mínimos recomendados son los mismos que para la evolución de la consistencia interna22, 33.

7BMJEF[ La definición más aceptada de validez la identifica con el grado en que un instrumento de CVRS efectivamente mide lo que se supone que mide. De una manera algo menos genérica, se podría describir la validez como el grado en que las puntuaciones obtenidas con el instrumento reflejan adecuadamente la CVRS del individuo o de las poblaciones a las que se aplica habitualmente. Se consideran tres tipos distintos de validez: a) contenido; b) constructo, y c) criterio31. La validez de contenido se refiere a la demostración de que los conceptos evaluados son apropiados en relación al uso que se le quiere dar. Suele evaluarse mediante la participación de paneles de expertos y de pacientes. El

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

estudio de la validez de constructo se basa en la descripción de las complejas interrelaciones entre las mediciones realizadas con el instrumento y la constelación de conceptos integrados en el modelo conceptual. Tradicionalmente se ha diferenciado entre validez de constructo convergente o estudio de la correlación con medidas similares, y validez de constructo divergente, orientado a la identificación de falta de asociación con medidas dispares o de diferencias en las puntuaciones entre grupos diferenciados o extremos, según criterios clínicos o epidemiológicos. Las matrices multirrasgo-multimétodo suelen ser la técnica de elección para el estudio de las asociaciones, pero para su correcta interpretación resulta imprescindible la formulación de hipótesis a priori sobre los patrones de relación esperados34. Se ha propuesto que valores de correlación mayores o iguales de 0,60 se corresponderían con una asociación de elevada intensidad, mientras que los menores de 0,30 indicarían falta de asociación35. La validez de criterio, finalmente, se refiere al grado en que las medidas obtenidas con el instrumento de CVRS se asemejan a las obtenidas con un método de referencia. La falta de medidas de referencia ha hecho que, hasta la fecha, la evaluación de este tipo de validez se haya aplicado casi exclusivamente al estudio de versiones reducidas de instrumentos, empleando el instrumento original como estándar.

4FOTJCJMJEBEBMDBNCJP Este concepto se refiere a la capacidad del instrumento para detectar diferencias en la magnitud del constructo. En ocasiones también se ha definido como el cociente entre la señal, entendida como diferencia real entre medidas, y el ruido, entendido como variabilidad de la medida36. En su evaluación se suelen comparar las puntuaciones obtenidas antes y después de una intervención que se entiende que tendrá como efecto una modificación en la magnitud del constructo, cuantificada mediante estimaciones estandarizadas de las diferencias (tamaño del efecto)36. Para ello se han propuesto diversos índices estadísticos, que ponen en relación las diferencias con una medida de variabilidad de la medida, todos ellos con fortuna variable y sin que ninguno haya resultado preferido a los demás37. Otros métodos habitualmente utilizados son la comparación de las puntuaciones con una pregunta general de cambio y el anclaje de las puntuaciones, esto es su relación con cambios en otras medidas, ya sea con carácter transversal o longitudinal, o con componentes de las propias medidas (p. ej., porcentaje de pacientes capaces de realizar una actividad contenida en el propio instrumento)38. La clasificación de este concepto como característica independiente es objeto de debate y podría acomodarse como un tipo de evaluación específica de la validez, la fiabilidad o incluso la interpretabilidad. Por un lado, la capacidad de discriminación de cambios en la magnitud del constructo podría acomodarse sin problemas como forma de evaluación longitudinal de la validez. Por otra parte, la fiabilidad del instrumento tiene un importante efecto sobre la cantidad de «ruido», de forma que la sensibilidad al cambio no es independiente de la misma, haciendo problemática su consideración independiente. Finalmente,

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

las estimaciones del tamaño del efecto y la relación de las puntuaciones con otras medidas están íntimamente asociadas a la interpretación de las puntuaciones, como se verá en el siguiente apartado.

© Elsevier. Fotocopiar sin autorización es un delito.

*OUFSQSFUBCJMJEBE Se entiende por interpretabilidad el grado en que es posible asignar un significado comprensible a las puntuaciones de un instrumento de CVRS y viene facilitada por la posibilidad de relacionar las puntuaciones (o diferencias en esas puntuaciones) con otras medidas inteligibles. Como se deducirá, el mismo uso repetido del instrumento lo hace interpretable, por cuanto permite establecer esas relaciones, ya sea explícita o implícitamente39. Una medida interpretable resulta más útil en la toma de decisiones clínicas, tanto desde el punto de vista diagnóstico como terapéutico. La supuesta falta de interpretabilidad de las medidas de CVRS es consecuencia directa de su novedad, más que una característica intrínseca de lo que se mide. Se han propuesto diversas maneras de incrementar las puntaciones, como la publicación de la distribución de las puntuaciones en muestras representativas de la población general, la realización de estudios que utilicen una gran variedad de medidas de CVRS y otras relacionadas, el estudio de la asociación entre las puntuaciones (o sus diferencias) con determinados diagnósticos, con la necesidad de tratamiento o con el efecto de tratamientos bien establecidos y también su asociación o su capacidad de predicción de ciertos eventos vitales, entre otros1. Recientemente se han formulado también propuestas de interpretación fundamentadas en el contenido basadas en TRI, cuya relevancia reside en el hecho de que no precisan de información externa al propio instrumento 39. Así, empleando modelos basados en observaciones reales de un número suficiente de pacientes, las puntuaciones de un cuestionario podrían interpretarse en términos de las mismas actividades evaluadas en el cuestionario39. Consideremos por ejemplo una puntuación de 70 en un instrumento, el Índice VF-14, que permite la cuantificación de la función visual en pacientes con cataratas. ¿Cómo determinar si la función visual asociada a esta puntuación es apropiada o no, si es mucha o si es poca? Conocer que el rango teórico es de 0 a 100 es de ayuda, pero tal vez lo sea aún más saber que la media en una población seleccionada con una edad media de 70 años es de alrededor de 53. Idealmente se podría comparar con valores poblaciones por edad y sexo (normas poblacionales). Una aproximación alternativa supone construir un modelo que permita predecir para una puntuación dada la respuesta (función visual) en las 14 actividades descritas en el instrumento o en un subconjunto de las mismas (perfil) de particular interés. De esta forma, sabríamos que con una puntuación de 70 en general, el paciente no será capaz de conducir de noche, tendrá cierta dificultad para leer letra pequeña y no tendrá ninguna para realizar trabajos manuales, ver la televisión o reconocer a personas. Existen métodos que permiten resumir la información en términos de una sola actividad, pero por el detalle necesario para exponerlos, se remite a la publicación original39.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

$BSHBQBSBFMFOUSFWJTUBEPSZQBSBFMFOUSFWJTUBEP La carga de administración se define como el tiempo, el esfuerzo y las necesidades y exigencias derivadas de la administración de un instrumento que recaigan sobre la persona a quien se aplica (carga para el entrevistado) o sobre los terceros que intervienen (carga para el entrevistador). Se mide en relación con consideraciones de índole operativa, como el tiempo que se tarda en administrar el cuestionario, pero también en relación con los requisitos mínimos para una administración efectiva, como la capacidad de lectura y de comprensión necesarias por parte del entrevistado. Un aspecto complementario a éstos y en el que no se suele reparar lo suficiente es la aceptabilidad por parte del entrevistado de las áreas de evaluación y de las formulaciones específicas empleadas en el instrumento, como podría ser el caso de preguntas relacionadas con la sexualidad. Las formas básicas de administración de los instrumentos de medida de CVRS incluyen la autoadministración (supervisada o no), la administración mediante personal entrenado (telefónicamente o en persona) asistidas, o no, por ordenador, y la administración a personas próximas distintas del paciente (familiar, cuidador u otro). Cada una de ellas presenta ventajas e inconvenientes que se deben tener en cuenta a la hora de seleccionar un instrumento40. Para una descripción suficiente del instrumento es necesario señalar, además de la forma estándar, las formas alternativas de administración de que se dispone.

6OSFUPFTQFDrGJDPQBSBMBFTUBOEBSJ[BDJwOMBDPNQBSBCJMJEBEUSBOTDVMUVSBM La adaptación cultural y lingüística es el octavo criterio propuesto por el comité científico del Medical Outcomes Trust. Este criterio es especialmente relevante para el ámbito español pues la mayoría de los instrumentos de medida de CVRS de que se disponen son adaptaciones de cuestionarios originalmente desarrollados en otros países. Además, buena parte de los manuscritos científicos en esta área describen ese proceso. Con el fin de garantizar la aplicabilidad de estos instrumentos a otras poblaciones, en general, y a la española, en particular, es preciso alcanzar la equivalencia conceptual y lingüística con el original. Se establece la primera, cuando los conceptos medidos son equivalentes en cuanto a significado y relevancia en la aplicación de los instrumentos a las poblaciones diana respectivas41. La equivalencia lingüística se refiere, en cambio, a la formulación de esos conceptos de forma que las estructuras semánticas seleccionadas cumplan la misma función y posean el mismo significado, tanto para cada ítem, como para las opciones de respuesta y todos los otros aspectos del instrumento17, 40. Repárese en que la equivalencia lingüística trasciende la simple traducción: un instrumento desarrollado en España en castellano no tendrá necesariamente aplicabilidad inmediata en cualquier otro país de habla hispana. Para alcanzar los tipos de equivalencia descritos conviene seguir un proceso cuidadoso de adaptación transcultural, que ha sido objeto de sistematización repetida18, 42 (tabla 16-3). En general se considera recomendable realizar al

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

Tabla 16-3. Módulo del listado de comprobación EM-PRO de aplicación exclusiva para instrumentos adaptados Adaptación cultural y lingüística t Traducción —Traducción de los ítems y de las opciones de respuesta del instrumento original (O): al menos dos versiones independientes (T1i) —Conciliación y síntesis de las versiones (T1i) en una versión consensuada (T1c) t Traducción inversa (retrotraducción) —Traducción de la versión consensuada (T1c) al idioma original: retrotraducción (R) —Conciliación de diferencias entre el instrumento original (O) y la retrotraducción (R) t 7FSTJØOQSFEFGJOJUJWB —4ÓOUFTJTEFWFSTJPOFTQSFWJBTZFWBMVBDJØOEFMBFRVJWBMFODJBMJOHàÓTUJDB TFNÈOUJDB JEJPNÈUJDB ZDPODFQUVBM —Elaboración de la versión adaptada predefinitiva T2

© Elsevier. Fotocopiar sin autorización es un delito.

t Ensayo de administración —Administración de la versión adaptada predefinitiva T2 a la muestra de conveniencia —Entrevista cognitiva para la evaluación de la comprensión y la aplicabilidad de la versión adaptada predefinitiva T2

menos dos traducciones independientes del instrumento del idioma original al de adaptación (preferentemente más) y al menos una traducción inversa (también llamada retrotraducción) de la anterior de nuevo al idioma original. Es muy conveniente la participación en los estudios de adaptación de población bilingüe en ambos idiomas y con un cierto grado de conocimiento de ambas culturas. Finalmente, cabe insistir en que, a los efectos de todas las características descritas a continuación, tanto psicométricas como de otra índole, se deben considerar de forma diferenciada el instrumento original y cada una de sus adaptaciones22. Los criterios descritos en la tabla 16-2 deberían considerarse de mínimos. De hecho, las propuestas más detalladas18 exigen evidencia empírica de que la versión es aceptable y comprensible para la nueva cultura (lo que requiere la participación de individuos de la población general y grupos de pacientes) así como un esfuerzo específico de armonización internacional (es decir, con otras versiones culturales del mismo instrumento). Obviamente, estos criterios ya son tenidos en cuenta en aquellos instrumentos que se desarrollan originalmente en diversos países de manera simultánea, como por ejemplo el WHOQOL43.

$PODMVTJPOFT Este listado de comprobación se ha concebido como guía para autores en la elaboración de protocolos para la construcción de instrumentos de resultados percibidos por los pacientes, así como para orientar la presentación de los métodos empleados y de sus resultados, tanto a los autores como a los evaluadores de futuras publicaciones. Es de esperar que la adopción de unas guías comunes faciliten la labor de todos los implicados y permitan alcanzar el objetivo de disponer de mejores herramientas de medida de resultados percibidos por los pacientes.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

3&7*45"4&41&$Ê'*$"4%&$734:053043&46-5"%04 1&3$*#*%04103-041"$*&/5&4 Los trabajos sobre CVRS y otros resultados percibidos pueden ser de interés no sólo en sus áreas de aplicación clínica, sino también para una serie de revistas internacionales de relevancia (tabla 16-4). Quality of Life Research es posiblemente la más conocida. Editada por la International Society of Quality of Life Research (ISQOL), es una revista que publica investigación original, artículos teóricos y metodológicos en el ámbito de la medición de la calidad de vida en cualquier rama de las ciencias de la salud. Se ha mantenido de forma consistente en el primer tercil de las revistas con mayor factor de impacto en el área de conocimiento de investigación en servicios sanitarios y actualmente ofrece una notable velocidad de procesamiento de los manuscritos. En particular, esta revista admite el envío de comunicaciones breves relacionadas con la adaptación transcultural de instrumentos, lo cual es de especial interés para el ámbito español. Además, la revista proporciona la posibilidad de incorporar opcionalmente resúmenes en otras lenguas, en condiciones que deben negociarse con los editores. Health and Quality of Life Outcomes es una revista de orientación similar. Forma parte de la iniciativa BioMed Central y se publica en condiciones de acceso abierto desde 2003; supone una excelente alternativa a la anterior. Value in Health es una revista aparecida hace pocos años pero que enseguida ha conseguido ubicarse entre las de referencia en este mismo ámbito. Tiene un perfil menos específico que Quality of Life Research y está publicada por la International Society for Pharmacoeconomics and Outcomes Research. De mayor y más prestigiosa trayectoria, Medical Care es la publicación oficial de American Public Health Association y se centra en aspectos de la administración y provisión de servicios de salud, pero ha publicado destacados trabajos del ámbito de la CVRS, incluyendo también notables suplementos sobre el tema y en menor frecuencia adaptaciones transculturales. Journal of Clinical Epidemiology es otra revista que ha publicado en el pasado numerosa bibliografía relacionada con la CVRS y otros resultados percibidos, con un marcado carácter metodológico. Todas las anteriores disponen de factor de impacto tal como publica Thomson Reuters a través del informe anual Journal Citation Reports. Es de destacar la revista de acceso abierto Health and Quality of Life Outcomes, a la que recientemente se le ha asignado un alto valor relativo de impacto (IF: 3.2, en 2008, según JCR Science Edition, ISI web of Knowledge. Thomson Reuters). En el ámbito de las publicaciones españolas, Medicina Clínica, fundada en 1943, es la única publicación semanal de contenido clínico que se edita en España y constituye el máximo exponente de la calidad y pujanza de la medicina española. Esta revista ha publicado numerosos trabajos sobre el tema, entre los que se incluyen los valores poblacionales de referencia de los instrumentos de la familia SF-36 y 1244, 45. Numerosas revistas clínicas especializadas han publicado trabajos en relación con la CVRS, algunas con factor de impacto substancial, como la Revista Española de Cardiología o los Archivos de Bronconeumología. Otras de carácter

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 %

Tabla 16-4. Listado de publicaciones diana Título de la publicación

Factor de impacto (2008)

Clasificación JC†

Idioma

Sitio en internet

Quality of Life Research

)FBMUI$BSF Sciences and Services:

Inglés

XXXTQSJOHFSDPN NFEJDJOFKPVSOBM

Health and Quality of Life Outcomes

)FBMUI$BSF Sciences and 4FSWJDFT

Inglés

XXXIRMPDPN

Value in Health

)FBMUIDBSF Science and 4FSWJDFT

Inglés

XXXJTQPSPSH WBMVFJOIFBMUI@JOEFY asp

Medical Care

)FBMUIDBSF Science and 4FSWJDFT

Inglés

KPVSOBMTMXXDPNMXX medicalcare

Journal of Clinical Epidemiology

1VCMJD enviromental and occupational IFBMUI

Inglés

XXXFMTFWJFSDPNMPDBUF jclinepi

Medicina Clínica

.FEJDJOF General and Internal:

Español

XXXFMTFWJFSFTND

Gaceta Sanitaria

"QBSUJSEF

&TQB×PM DBUBMÈO FVTLFSB gallego

IUUQXXXFMTFWJFSFTHT

"QBSUJSEF

Español

IUUQXXXFMTFWJFSFTBQ

Atención Primaria †

© Elsevier. Fotocopiar sin autorización es un delito.

+PVSOBM$JUBUJPO3FQPSU*4*8FCPG,OPXMFEHF¥5IPNQTPO3FVUFST /PPGJDJBM DPSSFTQPOEJFOUFB'VFOUF'FSOÈOEF[& VOOVFWPJNQVMTPQBSBMBSFWJTUB(BD4BOJU 2008;22:1-5. /PPGJDJBM DPSSFTQPOEJFOUFB'VFOUF"MFJYBOESF#FOBWFOU37BMEFSSBNB;VSJÈO+$ .JHVFM%BTJU" "MPOTP"SSPZP" $BTUFMMBOP(ØNF[.)ZQPUIFUJDBMJOGMVFODFPGOPOJOEFYFE4QBOJTINFEJDBMKPVSOBMTPOUIF JNQBDUGBDUPSPGUIF+PVSOBM$JUBUJPO3FQPSUTJOEFYFEKPVSOBMT4DJFOUPNFUSJDT

más genérico, como Atención Primaria, en el ámbito clínico o Gaceta Sanitaria, en el de la salud pública, constituyen excelentes alternativas.

#*#-*0(3"'Ê" 1. 2. 3. 4.

Alonso J. La medida de la calidad de vida relacionada con la salud en la investigación y la práctica clínica. Gac Sanit. 2000;14(2):163-7. Mossey JM, Shapiro E. Self-rated health: a predictor of mortality among the elderly. Am J Public Health. 1982;72:800-8. Kaplan GA, Camacho T. Perceived Health and Mortality: A Nine-Year Follow-Up of The Human Population Laboratory Cohort. Am J Epidemiol. 1983;117(3):292-304. Idler EL, Angel RJ. Self-rated health and mortality in the NHANES-I Epidemiologic Follow-up Study. Am J Public Health. 1990;80:446-52.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM 5.

6.

7. 8.

9.

10. 11 . 12 . 13 . 14.

15. 16.

17. 18.

19.

20.

21.

22.

23.

Ries AL, Kaplan RM, Limberg TM, Prewitt LM. Effects of pulmonary rehabilitation on physiologic and psychosocial outcomes in patients with chronic obstructive pulmonary disease. Ann Intern Med. 1995;122:823-32. American Thoracic Society. Standards for the diagnosis and care of patients with Chronic Obstructive Pulmonary Disease. American Thoracic Society. Am J Respir Crit Care Med. 1995;152:S78-S121. Anthonisen NR, Wright EC, Hodgkin JE. Prognosis in chronic obstructive pulmonary disease. Am Rev Respir Dis. 1986;133(1):14-20. Siu AL, Reuben DB, Ouslander JG, Osterweil D. Using multidimensional health measures in older persons to identify risk of hospitalization and skilled nursing placement. Qual Life Res. 1993;2(4):253-61. Connelly JE, Philbrick JT, Smith GR, Jr., Kaiser DL, Wymer A. Health perceptions of primary care patients and the influence on health care utilization. Med Care. 1989;27 (3 Suppl):S99-109. Wilson IB, Cleary PD. Linking clinical variables with health-related quality of life. A conceptual model of patient outcomes. JAMA. 1995;273(1):59-65. Alonso J, Ferrer M. Enfermedad pulmonar obstructiva crónica y salud percibida. Med Clin (Barc). 1998;111(15):580-2. Valderas JM, Alonso J. Patient reported outcome measures: a model-based classification system for research and clinical practice. Qual Life Res. 2008; 17(9):1125-35. Valderas JM, Alonso J, Guyatt GH. Measuring patient-reported outcomes: moving from clinical trials into clinical practice. Med J Aust. 2008;189(2):93-4. Valderas JM, Kotzeva A, Espallargues M, Guyatt G, Ferrans CE, Halyard MY, et al. The impact of measuring patient-reported outcomes in clinical practice: a systematic review of the literature. Qual Life Res. 2008;17(2):179-93. Garratt A, Schmidt L, Mackintosh A, Fitzpatrick R. Quality of life measurement: bibliographic study of patient assessed health outcome measures. BMJ. 2002;324(7351):1417. Solans M, Pane S, Estrada MD, Serra-Sutton V, Berra S, Herdman M, et al. Health-related quality of life measurement in children and adolescents: A systematic review of generic and disease-specific instruments. Value Health. 2008;11(4):742-64. Herdman M, Fox-Rushby J, Badia X. A model of equivalence in the cultural adaptation of HRQoL instruments: the universalist approach. Qual Life Res. 1998;7(4):323-35. Wild D, Grove A, Martin M, Eremenco S, McElroy S, Verjee-Lorenz A, et al. Principles of Good Practice for the Translation and Cultural Adaptation Process for Patient-Reported Outcomes (PRO) Measures: report of the ISPOR Task Force for Translation and Cultural Adaptation. Value Health. 2005;8(2):94-104. BiblioPRO. Biblioteca virtual de Instrumentos de Resultados Percibidos de Red IRYSS (Investigación sobre Resultados de Salud y Servicios Sanitarios). 2009. Último acceso: 15 de diciembre de 2008, URL: http://bibliopro.imim.es/BiblioPRO.asp Acquadro C, Berzon R, Dubois D, Leidy NK, Marquis P, Revicki D, et al. Incorporating the patient’s perspective into drug development and communication: an ad hoc task force report of the Patient-Reported Outcomes (PRO) Harmonization Group meeting at the Food and Drug Administration, February 16, 2001. Value Health. 2003;6(5):522-31. FDA. Draft guidance for industry on patient-reported outcome measures: Use in medicinal product development to support labeling claims. Federal Register. 2006;71(23): 5862-3. Valderas JM, Ferrer M, Alonso J. Lista de comprobación: instrumentos de medida de calidad de vida relacionada con la salud y de otros resultados percibidos por los pacientes. Med Clin (Barc). 2005;125(Supl.1):58-62. Valderas JM, Ferrer M, Mendivil J, Garin O, Rajmil L, Herdman M, et al. Development of EMPRO: A Tool for the Standardized Assessment of Patient-Reported Outcome Measures. Value Health. 2008;11(4):700-8.

$ " - * %" % % & 7 * %" 3 & - "$ * 0 / " %" $ 0 / - " 4" - 6 % 24.

25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37.

38. 39.

40. 41.

© Elsevier. Fotocopiar sin autorización es un delito.

42. 43. 44.

45.

Scientific Advisory Committee of the Medical Outcomes Trust. Assessing health status and quality-of-life instruments: attributes and review criteria. Qual Life Res. 2002; 11(3):193-205. Nunnally JC, Bernstein IH. Psychometric theory. 3 ed. Nueva York: McGraw-Hill, 1994. Wright BD, Stone MH. Best test design. Chicago: MESA Press, 1979. Wright BD, Masters GN. Rating Scale Analysis. Chicago: Mesa Press, 1982. Kline RB. Principles and practice of structural equation modelling. Nueva York: Guilford Press: 1998. McHorney CA, Tarlov AR. Individual-patient monitoring in clinical practice: are available health status surveys adequate? Qual Life Res. 1995;4:293-307. Badia X, Salamero M, Alonso J. La medida de la salud. Guía de escala de medición en español. Barcelona: Edimac, 2002. Streiner DL, Norman GR. Health measurement scales: a practical guide to their development and use. Oxford: Oxford University Press, 1989. Prieto L, Lamarca R, Casado A. La evaluación de la fiabilidad en las observaciones clínicas: el coeficiente de correlación intraclase. Med Clin (Barc). 1998;110(4):142-5. Tully MP, Cantrill JA. Subjective outcome measurement–a primer. Pharm World. Sci 1999;21(3):101-9. Campbell DT, Fiske DW. Convergent and discriminant validation by the multitrait-multimethod matrix. Psychol Bull. 1959;56(2):81-105. Andresen EM, Lollar DJ, Meyers AR. Disability outcomes research: why this supplement, on this topic, at this time? Arch Phys Med Rehabil. 2000;81(12 Suppl 2):S1-S4. Deyo RA, Diehr P, Patrick DL. Reproducibility and responsiveness of health status measures. Statistics and strategies for evaluation. Control Clin Trials. 1991;12:142S-58S. Terwee CB, Dekker FW, Wiersinga WM, Prummel MF, Bossuyt PM. On assessing responsiveness of health-related quality of life instruments: guidelines for instrument evaluation. Qual Life Res 2003;12(4):349-62. Wyrwich KW, Bullinger M, Aaronson N, Hays RD, Patrick DL, Symonds T. Estimating clinically significant differences in quality of life outcomes. Qual Life Res. 2005;14(2):285-95. Valderas JM, Alonso J, Prieto L, Espallargues M, Castells X. Content-based interpretation aids for health-related quality of life measures in clinical practice. An example for the Visual Function Index (VF-14). Qual Life Res. 2004;13:35-44. Guyatt GH, Feeny DH, Patrick DL. Measuring health-related quality of life. Ann Intern Med. 1993;118(8):622-9. Bullinger M, Alonso J, Apolone G, Leplege A, Sullivan M, Wood-Dauphinee S, et al. Translating health status questionnaires and evaluating their quality: the IQOLA Project approach. International Quality of Life Assessment. J Clin Epidemiol. 1998;51(11):913-23. Beaton DE, Bombardier C, Guillemin F, Ferraz MB. Guidelines for the process of crosscultural adaptation of self-report measures. Spine. 2000;25(24):3186-91. The World Health Organization Quality of Life assessment (WHOQOL): position paper from the World Health Organization. Soc Sci Med. 1995;41(10):1403-9. Alonso J, Regidor E, Barrio G, Prieto L, Rodríguez C, De La Fuente De Hoz L. Valores poblacionales de referencia de la versión española del Cuestionario de Salud SF-36. Med Clin (Barc). 1998;111(11):410-6. Vilagut G, Valderas JM, Ferrer M, Garín O, López-García E, Alonso J. Interpretación de los cuestionarios de salud SF-36 y SF-12 en España: componentes físico y mental [Interpretation of SF-36 and SF-12 questionnaires in Spain: physical and mental components]. Med Clin (Barc). 2008;130(19):726-35.

-BSFE&26"503GBDJMJUBOEP MBDPNVOJDBDJwO USBOTQBSFOUFZQSFDJTB EFMBJOWFTUJHBDJwOTBOJUBSJB *4JNFSB %("MUNBO %.PIFS ,'4DIVM[Z+)PFZ

© Elsevier. Fotocopiar sin autorización es un delito.

«If the CONSORT recommendations were followed in the reporting of future studies, the effects of Morita therapy would be clearer. Much important data within the included studies were so poorly reported that clinicians, funders and recipients of care might have reason to feel let down by the research community.» He Y, Li C. Morita therapy for schizophrenia. Cochrane review1

Las revisiones sistemáticas se sitúan orgullosamente en la cima de la pirámide de la evidencia2, y las revisiones Cochrane ocupan el lugar más privilegiado dentro de ellas. Los profesionales asistenciales, los investigadores y los gestores sanitarios se apoyan más que nunca en la evidencia sintetizada. Y así, cientos de revisores se enfrentan con el problema de la mala calidad de los informes de los estudios primarios cuando elaboran las revisiones sistemáticas. La descripción inadecuada de los métodos y de los hallazgos de una investigación impide la evaluación crítica de su calidad y relevancia, mina la confianza en sus resultados y limita su uso posterior. Existe una abundante evidencia de que gran parte de la investigación sanitaria publicada se comunica pobremente. Presentamos aquí unos pocos ejemplos para poner de manifiesto la ausencia de información esencial en los artícu-

* Este capítulo es una traducción del artículo: Simera I. The EQUATOR Network: Facilitating transparent and accurate reporting of health research. The Journal for the Serials Community. 2008;21:183-7.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

los de investigación. Chan y Altman3 evaluaron la información sobre algunos aspectos metodológicos importantes en 519 ensayos clínicos aleatorios publicados e indexados en MEDLINE en diciembre de 2000. Las características más relacionadas con la validez de los hallazgos de la investigación (es decir, el cálculo de la potencia estadística, la definición de las principales variables de resultado, la generación de la secuencia de aleatorización y la ocultación de dicha secuencia) se describían adecuadamente en menos de la mitad de las publicaciones. Moher et al.4 examinaron las características epidemiológicas y los aspectos relacionados con el sesgo de 300 revisiones sistemáticas (de las cuales 125 eran revisiones Cochrane) indexadas en MEDLINE durante noviembre de 2004. La calidad global de la información sobre los aspectos metodológicos clave era muy poco consistente con los hallazgos, y especialmente desalentadora en las revisiones no Cochrane. Glasziou et al.5 evaluaron las descripciones de los tratamientos en 80 estudios (ensayos clínicos y revisiones sistemáticas) publicadas durante un año en Evidence-Based Medicine, una revista dirigida a los médicos que trabajan en atención primaria y medicina general. Faltaban elementos cruciales de la descripción de las intervenciones en 41 de ellas, lo que impedía a los médicos emplear los tratamientos en su práctica clínica. Escribir, revisar y editar publicaciones científicas no es fácil. Sin embargo, esta imagen de calidad deficiente de los informes de las investigaciones indica un fracaso colectivo de autores, asesores y editores, así como de los financiadores de la investigación y de las editoriales, a la hora de garantizar la disponibilidad de publicaciones fiables de las investigaciones sanitarias.

26c16&%&)"$&34&1"3".&+03"3 -"$0.6/*$"$*Î/%&-"*/7&45*("$*Î/ Las guías y listas de comprobación son herramientas diseñadas para ayudar a alcanzar ciertos estándares, al proporcionar conjuntos de reglas o de principios que orientan hacia una conducta adecuada6. Se utilizan con éxito en muchas áreas de la actividad humana (p. ej., las listas de comprobación de la aviación, las guías de práctica clínica o las checklists quirúrgicas7). De forma similar, grupos de científicos, metodólogos y editores de revistas han desarrollado diferentes recomendaciones y listas de comprobación para orientar la descripción de diversos tipos de estudios utilizados en la investigación sanitaria. La mayoría de las revistas biomédicas solicitan a los autores que cumplan con los requisitos de uniformidad para manuscritos presentados a revistas biomédicas (Uniform Requirements for Manuscripts Submitted to Biomedical Journals) elaborados por el Comité Internacional de Editores de Revistas Médicas (International Committee of Medical Journal Editors, ICMJE)8. Este documento establece los principios éticos en la ejecución y comunicación de la investigación, y proporciona recomendaciones relacionadas con elementos específicos de la redacción y edición. Además de estos requisitos de uniformidad, existen diferentes guías que contienen recomendaciones específicas para la descripción de los métodos y hallazgos de tipos específicos de investigación. Estas directrices especifican un conjunto mínimo de ítems necesario para un

- " 3 & % & 2 6"5 0 3

informe claro y completo de lo que se ha hecho, donde se reflexione sobre aspectos concretos que podrían introducir un sesgo en la investigación. El cumplimiento de estas directrices mejora la fiabilidad y transparencia de las publicaciones9,10. Probablemente, la más influyente hasta ahora es la declaración CONSORT11 para la publicación de ensayos clínicos aleatorios; otros ejemplos incluyen STROBE 12, para estudios observacionales en epidemiología, y STARD13, para estudios de utilidad diagnóstica, aunque se han publicado muchas otras en los últimos años14. La mayoría de estas guías se han desarrollado aisladamente, sin que se haya producido en su elaboración e implementación la colaboración o coordinación que puede observarse, por ejemplo, en el campo de las guías de práctica clínica15. Este aislamiento ha contribuido a un reducido interés en las guías disponibles y a su limitada influencia sobre la calidad de las publicaciones.

© Elsevier. Fotocopiar sin autorización es un delito.

-"3&%&26"503 En 2006, el UK NHS National Knowledge Service, con la finalidad de proporcionar a los profesionales asistenciales información más útil y de mayor calidad sobre las investigaciones, proporcionó fondos para iniciar el programa red EQUATOR (Enhancing the QUAlity and Transparency Of health Research: aumentando la calidad y transparencia de la investigación sanitaria). Esta iniciativa internacional pretende mejorar la calidad de las publicaciones científicas promoviendo la comunicación transparente y precisa, así como la fiabilidad, de la investigación sanitaria publicada. La red EQUATOR es una organización «paraguas» que proporciona recursos de información, formación, evaluación y soporte para el desarrollo de recomendaciones para la elaboración de informes de estudios (y aspira a mucho más en el futuro), dirigidas a los agentes clave que influyen en la calidad de la información de la investigación sanitaria: investigadores (autores), editores de revistas, revisores y científicos que elaboran guías. En octubre de 2007, la red EQUATOR inauguró su sitio web16, que actualmente contiene enlaces a más de 80 guías publicadas. En general, estas recomendaciones toman la forma de listas de comprobación, acompañadas de una cantidad variable de explicaciones y ejemplos. En los primeros 9 meses, el sitio web tuvo más de 12.000 visitantes de 149 países. Se está realizando una importante actualización para mejorar el sitio, que incluye mayor información sobre las directrices, un foro de discusión en línea y nuevos materiales formativos. La formación es un elemento importante de las actividades de la red EQUATOR. Ya se han realizado diversos talleres, que hasta ahora se han dirigido principalmente a editores de revistas, los cuales desempeñan un papel vital al determinar y garantizar la calidad de las publicaciones. Una de las tareas más importantes de EQUATOR es animar a los editores de revistas a apoyar las directrices y a utilizarlas activamente, tanto en la revisión de los trabajos como en el proceso editorial. Kay Dickersin y sus colegas analizaron 12 reuniones editoriales para la discusión de manuscritos en JAMA17. Clasificaron 2.376 fra-

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

ses escritas y orales, correspondientes a 102 manuscritos, en 3 grandes categorías: ciencia, periodismo y redacción. Las frases utilizadas con más frecuencia en las reuniones editoriales se referían a aspectos científicos (1.274 frases, 54%), que incluían el diseño y los métodos de investigación, la presentación e interpretación de resultados, los métodos de análisis, la población estudiada, la potencia estadística y el tamaño de la muestra, las variables utilizadas y las mediciones realizadas, la necesidad de datos adicionales, la capacidad de generalización, la calidad de los datos y los conflictos de interés. Estos investigadores también resaltaron el importante papel del proceso de revisión por expertos (peer review) en la toma de las decisiones editoriales, documentado por el hecho de que más del 25% (459/1.773) de las frases orales se referían a comentarios de los revisores. Aunque los autores previenen contra la generalización de los resultados a otras revistas, puede verse claramente el impacto potencial de un mejor informe, que podría lograrse mediante la adherencia de los autores a las diferentes guías de publicación, sobre la eficiencia de las reuniones editoriales.

#FOFGJDJPTQBSBMBDPNVOJEBEDJFOUrGJDB La responsabilidad última del diseño y ejecución de la investigación y de su publicación clara y completa recae en los investigadores. Enseñar a los jóvenes investigadores los principios básicos de una buena comunicación y aumentar su conocimiento de las recomendaciones disponibles puede reducir muchos de los problemas actuales y aumentar la calidad de los manuscritos presentados a las revistas. La colaboración con las organizaciones implicadas en la investigación y la formación profesional es crucial. Los investigadores experimentados, así como los editores y los revisores, también pueden beneficiarse del uso de las directrices. El uso de listas de comprobación por los autores y los revisores promueve una comunicación más completa y refuerza todo el proceso editorial, lo que puede mejorar y acelerar la toma de decisiones de la revista. Reunir todas las recomendaciones disponibles en un único portal facilitaría una mayor utilización por parte de los autores. Las revistas pueden contribuir significativamente a este proceso si proporcionan un enlace a los recursos de EQUATOR desde sus instrucciones para autores y les animan a utilizar las guías adecuadas. El enlace con el portal de EQUATOR también aliviaría la necesidad de las revistas de buscar las últimas recomendaciones sobre la comunicación de la investigación sanitaria relevante y de actualizar sus instrucciones con frecuencia. Se ahorraría así tiempo y dinero, a la par que se daría un mejor servicio a los autores. Algunas revistas y editoriales ya han implementado esta política, y las estadísticas del portal de EQUATOR muestran un incremento del tráfico procedente de estas revistas18. Para el éxito de esta iniciativa, también es vital el apoyo decidido de los financiadores de la investigación sanitaria y las editoriales. Estas organizaciones pueden ayudar significativamente a aumentar el conocimiento de los problemas asociados con una comunicación deficiente, mediante el uso de estrategias motivadoras que fomenten la elaboración de informes de investigación

- " 3 & % & 2 6"5 0 3

de alta calidad y la introducción de medidas que evalúen el cumplimiento de las recomendaciones. Además, pueden proporcionar el tan necesario soporte financiero, y el liderazgo en el desarrollo y mantenimiento de unas directrices sólidas. Las listas de comprobación evitan errores y omisiones. Pocas personas volarían conscientemente en un avión en el que el piloto no utilizara un protocolo de despegue y aterrizaje. Se necesita una cultura similar para asegurar un informe completo y preciso. La red EQUATOR ayudará al desarrollo de estos procedimientos. Las editoriales y los financiadores de la investigación, tanto públicos como privados, tienen una responsabilidad social ante las comunidades clínica y científica, y deberían apoyar iniciativas como la red EQUATOR. Aunque el proyecto ha atraído la atención de algunas agencias financiadoras (como UK National Institute of Health Research y Medical Research Council), el apoyo proporcionado todavía no es suficiente para asegurar todas las actividades esenciales. Para llegar a ser una iniciativa verdaderamente internacional, la red necesita el apoyo global de un amplio abanico de organizaciones.

© Elsevier. Fotocopiar sin autorización es un delito.

1MBOFTEFGVUVSPEFMBSFE&26"503 La red EQUATOR se lanzó formalmente en una reunión inaugural en Londres en junio de 200819,20. Los ponentes invitados llamaron la atención sobre muchos problemas relacionados con la deficiente situación actual de la comunicación de la investigación sanitaria y sus consecuencias para un amplio abanico de usuarios, y discutieron los retos y las posibles soluciones21. La red EQUATOR busca expandir la naturaleza y la dispersión geográfica de sus actividades implicando a un mayor número de personas, organizaciones y países, y promoviendo relaciones más intensas con sus principales destinatarios. Los recursos económicos adicionales permitirán el desarrollo posterior de la investigación de EQUATOR y de programas de traslación del conocimiento. La red EQUATOR liderará el abordaje de los problemas resaltados en la reunión de lanzamiento y en otras posteriores, incluyendo la clarificación de los conceptos erróneos sobre las directrices, colaborando en el desarrollo de recomendaciones sólidas y realmente útiles, y ayudando a superar las barreras existentes para su implementación. EQUATOR continuará respondiendo a las sugerencias de los múltiples grupos relevantes interesados en aumentar la credibilidad y el valor de la investigación diseñada para mejorar la salud. La investigación sanitaria está liderando los esfuerzos para conseguir una comunicación clara, completa y transparente, aunque están emergiendo algunas iniciativas alentadoras en otras áreas de investigación22,23. Lo que diferencia la investigación sanitaria de otras actividades científicas es la naturaleza de la población que estudia. Muchas personas aceptan voluntariamente el riesgo de participar en estudios de investigación para mejorar la atención sanitaria de futuras generaciones. Al realizar y comunicar los resultados de estos estudios, siempre deberíamos tener presente la responsabilidad ante los participantes en las investigaciones. El reconocimiento de esta responsabilidad debe demostrarse claramente en nuestros actos.

$POUFOJEPEFVOBSUrDVMPPSJHJOBM

#*#-*0(3"'Ê" 1. 2. 3. 4.

5. 6. 7. 8.

9.

10.

11.

12.

13.

14. 15. 16. 17.

18. 19. 20.

He Y, Li C. Morita Therapy for schizophrenia, Cochrane Database of Systematic Reviews, 2007. Issue 1, Art. No.: CD006346, DOI: 10.1002/14651858.CD006346. Centre for Evidence-Based Medicine, Levels of Evidence [acceso: 19 de agosto de 2008]. Disponible en: http://www.cebm.net/index.aspx?o=1025. Chan AW, Altman DG. Epidemiology and reporting of randomised trials published in PubMed Journals. Lancet. 2005;365:1159-62. Moher D, Tetzlaff J, Tricco AC, Sampson M, Altman DG. Epidemiology and reporting characteristics of systematic reviews. PLoS Med. 2007;4:e78, doi:10.1371/journal. pmed.0040078. Glasziou P, Meats E, Heneghan C, Shepperd S. What is missing from descriptions of treatment in trials and reviews? BMJ, 2008;28:336:1472-4. The Free Dictionary [acceso: 27 de agosto de 2008]. Disponible en: http://www.thefreedictionary.com/guideline. WHO Surgery Checklist. [acceso: 27 de agosto de 2008]. Disponible en: http://www. youtube.com/user/WHOSurgeryChecklist. International Committee of Medical Journal Editors. Uniform requirements for manuscripts submitted to biomedical journals [acceso: 12 de agosto de 2008]. Disponible en: http://www.icmje.org. Plint AC, Moher D, Morrison A, Schulz K, Altman DG, Hill C, et al. Does the CONSORT checklist improve the quality of reports of randomised controlled trials? A Systematic Review. Med J Aust. 2006;185:263-7. Smidt N, Rutjes AW, Van der Windt DA, Ostelo RW, Bossuyt PM, Reitsma JB, et al. The quality of diagnostic accuracy studies since the STARD statement: Has it improved? Neurology. 2006;67:792-7. Moher D, Schulz KF, Altman DG. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel-group randomised trials. Lancet. 2001;357:1191-4. Von Elm E, Altman DG, Egger M, Pocock S, Gøtzsche PC, Vandenbroucke JP, on behalf of the STROBE initiative. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: Guidelines for reporting observational studies. PLoS Med. 2007;4:e296. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, et al., on behalf of STARD Group. Towards complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Standards for Reporting of Diagnostic Accuracy. Clin Chem. 2003;49:1-6. EQUATOR Network: Library for health research reporting [acceso: 12 de agosto de 2008]. Disponible en: http://www.equator-network.org/index.aspx?o=1037. Guidelines International Network (G-I-N) [acceso: 19 de agosto de 2008]. Disponible en: http://www.g-i-n.net. EQUATOR Network website. [acceso: 19 de agosto de 2008]. Disponible en: http://www. equator-network.org. Dickersin K, Ssemanda E, Mansell C, Rennie D. What do the JAMA editors say when they discuss manuscripts that they are considering for publication? Developing a schema for classifying the content of editorial discussion. BMC Med Res Methodol. 2007;7:44. EQUATOR Network website [acceso: 19 de agosto de 2008]. Disponible en: http://www. equator-network.org/index.aspx?o=1200. Groves T. Enhancing the quality and transparency of health research. BMJ. 2008; 8:337:a718. Thornton H. Report on EQUATOR Network Launch Meeting 26th June 2008. «Achieving transparency in reporting health research». Int J Surg. 2008;6:428-31.

- " 3 & % & 2 6"5 0 3 21. 22.

© Elsevier. Fotocopiar sin autorización es un delito.

23.

EQUATOR Network website [acceso: 27 de agosto de 2008]. Disponible en: http://www. equator-network.org/index.aspx?o=1125. Jedlitschka A, Pfahl D. Reporting guidelines for controlled experiments in software engineering. IESEReport IESE-035.5/E; 2005. Newman M, Elbourne D. Improving the usability of educational research: Guidelines for the reporting of primary empirical research studies in education (The REPOSE guidelines). Evaluation and Research in Education. 2006;18:201-12.

3FRVJTJUPTQBSBFMFOWrP EFVONBOVTDSJUP ".BSVTß JD

Una vez escrito el manuscrito y elegida la revista a la que se desea enviarlo, todavía existen algunos requisitos técnicos y editoriales para su envío que van más allá de la organización del artículo en sus diferentes apartados: Introducción, Métodos, Resultados y Discusión (IMRD). Las instrucciones para autores de las revistas especifican los requisitos necesarios para dar la forma adecuada al artículo que se envía. Estos requisitos incluyen los relacionados con la organización del manuscrito y la información sobre los autores y el estudio, así como los aspectos relacionados con el estilo y las referencias bibliográficas. En biomedicina, la mayoría de revistas siguen las instrucciones elaboradas por el International Committee of Medical Journal Editors (ICMJE, tabla 18-1), que publica y actualiza periódicamente los «Requisitos de uniformidad para manuscritos enviados a revistas biomédicas» (Uniform Requirements for Manuscripts Submitted to Biomedical Journals: Writing and Editing for Biomedical Publication, disponibles en: http://www.icmje.org). Muchas revistas están adheridas y su lista aparece en la página web del ICMJE. Incluso aunque no esté en la

© Elsevier. Fotocopiar sin autorización es un delito.

Tabla 18-1. International Committee of Medical Journal Editors t &MInternational Committee of Medical Journal Editors (ICMJE) es un grupo informal de doce editores médicos. Las revistas del grupo incluyen las más prestigiosas y con mayor factor de impacto, como New England Journal of Medicine, Lancet y JAMA, y también algunas más pequeñas y de ámbito nacional, como Norwegian Medical Journal, Dutch Medical Journal, Croatian Medical Journal y New Zealand Medical Journal. t &M*$.+&FNQF[ØTVUSBCBKPFO DPNPVOFTGVFS[PEFMPTFEJUPSFTNÏEJDPTQBSB acordar un estilo de escritura y de referenciar las citas bibliográficas (era el tiempo en que los NBOVTDSJUPTTFNFDBOPHSBGJBCBO ZMPTNBOVTDSJUPTSFDIB[BEPTFOVOBSFWJTUBEFCÓBO escribirse y mecanografiarse de nuevo para cumplir con los requisitos de una nueva revista). Con el tiempo, el ICMJE dio un paso adelante en sus recomendaciones, incluyendo los BTQFDUPTÏUJDPTEFMBQVCMJDBDJØOCJPNÏEJDB1PSFKFNQMP MPTSFRVJTJUPTEFM*$.+&QBSBMB BVUPSÓBEFNBOVTDSJUPTTPOBDFQUBEPTDPNPVOBOPSNB OPTØMPFOFMDBNQPEFMB CJPNFEJDJOB TJOPUBNCJÏOFONVDIPTPUSPTDBNQPTEFJOWFTUJHBDJØO&MSFRVJTJUPNÈT SFDJFOUF RVFIBUFOJEPVOHSBOJNQBDUPFOMBQVCMJDBDJØOEFMPTFOTBZPTDMÓOJDPT FTFMEF que éstos han de estar registrados en una base de datos pública antes de su inicio, como DPOEJDJØOQSFWJBQBSBQPEFSTPMJDJUBSTVQVCMJDBDJØOFOMBTSFWJTUBTBEIFSJEBTBM*$.+&

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

lista, una revista aceptará más fácilmente un artículo si sigue las instrucciones del ICMJE, especialmente si se hace constar en la carta de presentación que acompaña al manuscrito. Este capítulo se centra en los aspectos del manuscrito no relacionados con el formato IMRD, y en la información sobre los aspectos éticos que los editores y revisores de la revista necesitan para decidir si un artículo es apto para su publicación. Sin embargo, la información que aquí se presenta no sustituye a las instrucciones detalladas para los autores que publican las distintas revistas, y que deben ser estudiadas detalladamente por los autores antes de enviar su manuscrito. De todos modos, la estructura del manuscrito (tabla 18-2), los

Tabla 18-2. 3FDPNFOEBDJPOFTEFM*$.+&QBSBMBPSHBOJ[BDJØOEFMNBOVTDSJUP enviado a una revista 1

1ÈHJOBDPOFMUÓUVMP RVFDPOUJFOF 5ÓUVMPEFMBSUÓDVMP /PNCSFEFMPTBVUPSFTZEFMBJOTUJUVDJØOBMBRVFQFSUFOFDFO Nombre del autor para la correspondencia y detalles para su contacto Rectificaciones (si existen) 'VFOUF T EFGJOBODJBDJØOZPUSBTBZVEBT 4VCUÓUVMP Número de palabras Número de figuras y tablas

2

1ÈHJOBEFOPUJGJDBDJØOEFDPOGMJDUPTEFJOUFSFTFT

3

3FTVNFO QBMBCSBTDMBWF OÞNFSPEFSFHJTUSPEFMFOTBZPDMÓOJDP

4

1BSUFDFOUSBMEFMBSUÓDVMP *OUSPEVDDJØO .BUFSJBM1BSUJDJQBOUFT1BDJFOUFTZNÏUPEPT Resultados %JTDVTJØO

5

Agradecimientos a las personas e instituciones que han ayudado en el estudio, EFTDSJQDJØOEFMBDPOUSJCVDJØOEFDBEBVOPEFMPTBVUPSFTBMEFTBSSPMMP EFMBJOWFTUJHBDJØO ZMJTUBEFQFSTPOBTRVFIBODPOUSJCVJEPFOVONBOVTDSJUP DVZBBVUPSÓBQFSUFOFDFBVOHSVQPEFJOWFTUJHBDJØO

6

Referencias bibliográficas

7

5BCMBTDBEBVOBFOVOBQÈHJOBTFQBSBEB

8

5ÓUVMPEFMBTGJHVSBT

9

*MVTUSBDJPOFT GJHVSBT DBEBVOBFOVOBQÈHJOBTFQBSBEB

10

-JTUBTEFDPNQSPCBDJØOQBSBFTUVEJPTFTQFDÓGJDPT

11

Material suplementario para editores y revisores

Tabla 18-3. $POTFKPTHFOFSBMFTQBSBFMGPSNBUPEFVONBOVTDSJUP t 6TBSEPCMFFTQBDJPZNÈSHFOFTBNQMJPTFOUPEBTMBTQBSUFTEFMNBOVTDSJUP t +VTUJGJDBSFMUFYUPBMBJ[RVJFSEB t /VNFSBSUPEBTMBTQÈHJOBTDPOTFDVUJWBNFOUF JODMVZFOEPMBQÈHJOBEFMUÓUVMP t /PTFSFDPNJFOEBVTBSOPUBTBQJFEFQÈHJOBFOMBTUBCMBT VUJMJ[BSTÓNCPMPT QBSBMBTOPUBTBMQJF DPNP p q f ]] s pp FUD t 4FHVJSDVJEBEPTBNFOUFMBTJOTUSVDDJPOFTQBSBQSFQBSBSMBTGJHVSBT

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

principios generales de su estilo (tabla 18-3) y los requisitos editoriales son los mismos en la mayoría de revistas.

1Ç(*/"%&-5Ê56-0

© Elsevier. Fotocopiar sin autorización es un delito.

Esta página contiene la síntesis más sucinta del estudio —su título— y la información de los autores y sus instituciones. Los requisitos de uniformidad del ICMJE recomiendan que los investigadores que firman el estudio proporcionen información detallada sobre su contribución individual al mismo (tabla 18-4). Las revistas publicarán esta información, de manera que los lectores puedan juzgar la contribución individual de cada uno de los autores. El ICMJE define autor como alguien «que ha realizado contribuciones intelectuales sustantivas al estudio». A pesar de que alienta a las revistas para aplicar la política de declaración de la contribución de cada autor, el ICMJE todavía proporciona criterios para la autoría (v. tabla 18-4), que son los que determinan si el nombre de un investigador debe constar como autor del manuscrito. Aunque el momento adecuado para debatir y decidir sobre la autoría y el orden en que los autores firmarán el manuscrito es bastante anterior al momento de su envío a la revista (preferentemente antes del inicio del estudio), en el momento de enviar el artículo es conveniente que los autores confirmen su autoría y su posición en la lista. Algunas revistas exigen incluso una declaración escrita de los autores (en la página del título, en una página de declaración separada del manuscrito, o bien en la carta de presentación) de que todos los investigadores que aparecen como autores merecen serlo, y que todos los que merecen serlo constan como autores. En investigación clínica, la autoría de los grandes ensayos recae cada vez más en un grupo numeroso de investigadores, y sólo algunos de ellos asumen la responsabilidad de redactar el manuscrito. En caso de autoría por estos grupos (también llamada autoría corporativa o colectiva), es muy importante identificar claramente el grupo y los individuos que son los autores del manuscrito (tabla 18-5). Esto es muy importante, ya que la mayoría de bases de datos bibliográficas, incluida PubMed, mostrarán sólo los nombres que aparecen en la línea del artículo destinada a los autores (tabla 18-6).

Tabla 18-4. $SJUFSJPTEFM*$.+&QBSBMBDPOUSJCVDJØOZMBBVUPSÓB TFDDJØO**" Contribución "DUVBMNFOUF BMHVOBTSFWJTUBTTPMJDJUBOZQVCMJDBOJOGPSNBDJØOTPCSFMBTDPOUSJCVDJPOFTEF DBEBQFSTPOBDJUBEBBMFTUVEJPQSFTFOUBEP BMNFOPTFOFMDBTPEFJOWFTUJHBDJØOPSJHJOBM4F BOJNBFODBSFDJEBNFOUFBMPTFEJUPSFTBEFTBSSPMMBSZBQMJDBSVOBQPMÓUJDBEFEFDMBSBDJØOEFMB DPOUSJCVDJØOJOEJWJEVBMBMBJOWFTUJHBDJØO BTÓDPNPEFJEFOUJGJDBSRVJÏOFTFMSFTQPOTBCMFEF MBJOUFHSJEBEEFMBPCSBFOTVDPOKVOUP Autoría -PTDSÏEJUPTEFBVUPSÓBEFCFOCBTBSTFFOa)VOBDPOUSJCVDJØOTVTUBODJBMBMBDPODFQDJØOZ EJTF×P PMBBERVJTJDJØOEFEBUPT PBMBOÈMJTJTFJOUFSQSFUBDJØOEFMPTEBUPTb)MBSFEBDDJØO EFMBSUÓDVMPPMBSFWJTJØODSÓUJDBEFTVDPOUFOJEPJOUFMFDUVBMJNQPSUBOUF Zc)MBBQSPCBDJØOGJOBM EFMBWFSTJØOBOUFTEFTFSQVCMJDBEP-PTBVUPSFTEFCFOTBUJTGBDFSFTUBTUSFTDPOEJDJPOFT %JTQPOJCMFFOXXXJDNKFPSHBVUIPS

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Tabla 18-5. $SJUFSJPTEFM*$.+&QBSBMBBVUPSÓBEFHSVQP t &MHSVQPEFCFJEFOUJGJDBSBMBTQFSTPOBTEJSFDUBNFOUFSFTQPOTBCMFTEFMNBOVTDSJUP t -BTQFSTPOBTSFTQPOTBCMFTEFMNBOVTDSJUPEFCFOTBUJTGBDFSMPTDSJUFSJPTEFBVUPSÓB definidos por el ICMJE t &MBVUPSQBSBMBDPSSFTQPOEFODJBEFCFJOEJDBSMBGPSNBQSFGFSJEBFORVFMPTBVUPSFT BQBSFDFSÈOFOMBMÓOFBEFTUJOBEBBFMMP ZFOMBTCBTFTEFEBUPTCJCMJPHSÈGJDBT

t &MBVUPSQBSBMBDPSSFTQPOEFODJBEFCFOJOEJDBSFMOPNCSFEFUPEPTMPTBVUPSFTZEFMHSVQP t 0USPTNJFNCSPTEFMHSVQP RVFDPOUSJCVZFOQFSPOPTPOBVUPSFT EFCFOBQBSFDFS FOMBTFDDJØOEFBHSBEFDJNJFOUPT

Tabla 18-6. *OEFYBDJØOEFVOBBVUPSÓBEFHSVQPFO.&%-*/&1VC.FE t -PTBVUPSFTTFDJUBOFOFMNJTNPPSEFOFORVFBQBSFDFOFOFMBSUÓDVMP t -PTOPNCSFTEFMPTBVUPSFTJOEJWJEVBMFTTFTFQBSBOQPSDPNBT ZFOFMDBTPEFVOHSVQP por un punto y coma t 4JFMHSVQPFTFMÞOJDPBVUPS WBTFHVJEPQPSVOQVOUP t $VBOEPVOHSVQPFTMBÞOJDBFOUSBEBFOMBMÓOFBEFTUJOBEBBMPTBVUPSFT QFSPFYJTUF VOBMJTUBEFBVUPSFTSFTQPOTBCMFTEFMBSFEBDDJØOEFMNBOVTDSJUPFOBMHVOBPUSBQBSUFEFM BSUÓDVMP FMHSVQPBQBSFDFFOQSJNFSMVHBS TFHVJEPEFMPTBVUPSFTJOEJWJEVBMFTFODPOUSBEPT FODVBMRVJFSMVHBSEFMBSUÓDVMP &KFNQMP 1SBTBE"# "MMBSE.8/*4$$PNQBSBUJWF4FRVFODJOH1SPHSBN (SFFO&% Confirming the phylogeny of mammals by use of large comparative sequence data sets. .PM#JPM&WPM4FQ &QVC.BZ 1.*% /PSNBTQVCMJDBEBTFOFMCPMFUÓOUÏDOJDPEFMBNational Library of Medicine EFNBZPKVOJPEF EJTQPOJCMFTFOIUUQXXXOMNOJIHPWQVCTUFDICVMMNKNK@DPSQ@BVUIPSIUNM

Algunas revistas sólo piden los nombres de los autores, y otras solicitan además el grado académico más alto de cada autor, junto con su afiliación institucional. Estos requisitos se indican en las instrucciones de la revista; es aconsejable comprobar el estilo en artículos publicados recientemente en la revista y aplicarlo. La página del título contiene también el nombre y los datos correspondientes al autor que se encarga de la comunicación con la revista (tabla 18-7). Algunos autores (p. ej., los que trabajan para una agencia gubernamental) pueden tener que enviar una cláusula de exención de responsabilidad en la página del título (p. ej., si las opiniones en el manuscrito son propias y no representan la opinión oficial de la institución para la que trabajan). La página del título debe contener también información sobre la(s) fuente(s) de apoyo financiero o de otro tipo, tales como becas para la investigación o para viajes, equipamiento, medicamentos, o de otro tipo. Muchas revistas también solicitan a los autores que proporcionen un título corto, que aparecerá en el encabezamiento o el pie de página del artículo impreso. Se trata de un título abreviado, por lo general de alrededor de cuarenta caracteres, espacios incluidos (tabla 18-8). La página del título también contiene información sobre el número de palabras del manuscrito y el de tablas y figuras. El número de palabras sólo incluye el texto del manuscrito, es decir, sin resumen, agradecimientos, le-

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

5BCMB *OGPSNBDJØORVFEFCFQSPQPSDJPOBSTFTPCSFFMBVUPSRVFTFFODBSHB EFMBDPNVOJDBDJØODPOMBSFWJTUB t %JSFDDJØOQPTUBM t /ÞNFSPEFUFMÏGPOPZGBY t %JSFDDJØOEFDPSSFPFMFDUSØOJDP t &MBVUPSQBSBMBDPSSFTQPOEFODJBEFCFJOEJDBSTJOPRVJFSFRVFTVEJSFDDJØOFMFDUSØOJDBTF publique en la revista t 5BNCJÏOEFCFJEFOUJGJDBSTFFMBVUPSRVFQSPQPSDJPOBSÈTFQBSBUBTEFMBSUÓDVMP los autores también pueden declarar si no van a proporcionar separatas

Tabla 18-8. &KFNQMPTEFUÓUVMPDPSUP

© Elsevier. Fotocopiar sin autorización es un delito.

5ÓUVMP

5ÓUVMPDPSUP

Demonstrating Reduced Environmental and Genetic Diversity in Human Isolates by Analysis of Blood Lipid Levels

Reduced Diversity in Human Isolates (35 caracteres)

Two-year Rehospitalization Rates of Patients with Newly Diagnosed or Chronic Schizophrenia on Atypical or Typical Antipsychotic Drugs: Retrospective Cohort Study

Atypical Antipsychotics and Rehospitalization (45 caracteres)

yendas ni referencias bibliográficas. Incluso si las instrucciones de la revista no solicitan específicamente el número de palabras, es útil incluir esta información, ya que ayudará al editor a evaluar si el manuscrito presentado se ajusta a los límites fijados por la revista para los diferentes tipos de artículo. Informar del número de figuras y tablas también es útil, ya que ayuda al comité de redacción a determinar si realmente se incluyen todas ellas en el manuscrito. Por último, la página del título deberá contener información sobre la posible presentación anterior de los datos del manuscrito en formas que no se consideran publicación, como una comunicación o póster en un congreso. Algunas revistas utilizan un procedimiento doble ciego en la evaluación de los manuscritos presentados, en el que los revisores desconocen la identidad de los autores y viceversa: la identidad de los revisores no es conocida por los autores. En tales casos, los autores han de presentar los originales sin ningún tipo de información sobre su identidad en el texto, con un documento separado que los identifique (habitualmente una página del título completa, con sus nombres y afiliaciones). Las instrucciones para los autores de las revistas proporcionan instrucciones específicas sobre cómo presentar un manuscrito para la revisión a doble ciego.

1Ç(*/"%&/05*'*$"$*Î/%&6/104*#-& $0/'-*$50%&*/5&3&4&4 La declaración de los posibles conflictos de intereses es un aspecto importante de la transparencia y honestidad de la investigación científica. Para garan-

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

tizar que esta información no se pasa por alto ni se incluye en un lugar inapropiado, los requisitos del ICMJE recomiendan informar de un posible conflicto de intereses en una página separada, a continuación de la del título. Algunas revistas solicitan a los autores que rellenen un formulario de declaración sobre conflicto de intereses, y otras solicitan esta información en una carta adjunta al manuscrito. Independientemente de los requisitos de la revista, es aconsejable seguir la recomendación del ICMJE ya que, al convertir la declaración sobre un posible conflicto de intereses en una parte más del manuscrito, podrá ser vista no sólo por los editores, sino también por los revisores.

3&46.&/ 1"-"#3"4$-"7&:/Ò.&30%&3&(*4530 %&-&/4":0$-Ê/*$0 El formato del resumen y su longitud pueden variar según las revistas (tabla 18-9), pero su contenido es el mismo. El resumen expone brevemente el trabajo presentado en el manuscrito y sigue los mismos principios de organización de éste: informa sobre por qué se hizo el estudio (Objetivo, Antecedentes), la metodología que se utilizó (Método), los resultados observados (Resultados) y qué significación tienen éstos (Discusión). Los autores deben asegurarse de que la información contenida en el resumen representa con precisión la del cuerpo del artículo, sobre todo que los resultados son los mismos que los presentados en el resumen. La precisión en el resumen es muy importante porque es la «cara» de todo el artículo: es, junto con el título, la información que está indexada en las bases de datos bibliográficas, y la primera información a la que acceden los investigadores y otros lectores interesados. Algunas revistas solicitan a los autores que proporcionen unas cuantas palabras clave, por lo general de tres a cinco, que describan los temas tratados en el manuscrito. En el ámbito de la investigación médica, la mejor orientación para la elección de estas palabras clave es el vocabulario del Medical Subject Headings (MeSH) de PubMed, disponible en: http://www.ncbi.nlm.nih.gov/sites/ entrez?db=mesh.

5BCMB Diferentes tipos de estructura de un resumen Único párrafo

Estructura IMRD

Superestructura

0CKFUJWP

0CKFUJWP

Método

&NQMB[BNJFOUP

Resultados

1BSUJDJQBOUFT

$PODMVTJØO

Diseño del estudio *OUFSWFODJØO Variable principal de resultado Resultados Conclusiones

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

5BCMB 3FHJTUSPTEFFOTBZPTDMÓOJDPTSFDPNFOEBEPTQPSFM*$.+& t $MJOJDBM5SJBMTHPW t 8PSME)FBMUI0SHBOJ[BUJPO1SJNBSZSFHJTUSJFT EJTQPOJCMFFOIUUQXXXXIPJOUJDUSQ OFUXPSLQSJNBSZFOJOEFYIUNM "VTUSBMJBO/FX;FBMBOE$MJOJDBM5SJBMT3FHJTUSZ "/;$53

— Chinese Clinical Trial Register (ChiCTR) — Clinical Trials Registry-India (CTRI) — ISRCTN.org — The Netherlands National Trial Register (NTR) 4SJ-BOLB$MJOJDBM5SJBMT3FHJTUSZ 4-$53

Tabla 18-11. $POKVOUPNÓOJNPEFEBUPTQSPQVFTUPQPSMB0SHBOJ[BDJØO.VOEJBM EFMB4BMVEQBSBFMSFHJTUSPEFVOFOTBZPDMÓOJDP 1. 2. 3. 4. 5. 6. 8. 11. 12. 13. 14. 15. 16. 18.

Primary Register and Trial ID# Date of Registration in Primary Register Secondary ID#s Source(s) of Monetary or Material Support Primary Sponsor Secondary Sponsor(s) Contact for Public Queries Contact for Scientific Queries Public Title Scientific Title Countries of Recruitment Health Condition(s) or Problem(s) Studied Intervention(s) Key Inclusion and Exclusion Criteria Study Type Date of First Enrollment Target Sample Size Recruitment Status Primary Outcome(s) Key Secondary Outcomes

© Elsevier. Fotocopiar sin autorización es un delito.

%JTQPOJCMFFOIUUQXXXXIPJOUJDUSQEBUB@TFUFO

En el pasado, estas palabras clave se utilizaban para preparar el índice de la revista. Hoy en día, en que la edición electrónica hace que la indexación sea más automática, las palabras clave ayudan a los editores a identificar los revisores más adecuados para el manuscrito. Desde 2005, el ICMJE ha introducido la obligación de registrar un ensayo clínico como una condición previa para la tramitación del manuscrito para su revisión. Las revistas que están adheridas al ICMJE, y otras muchas que no, siguen esta política, así como la recomendación de publicar el número de registro al final del resumen. Los autores deben asegurarse de que su ensayo está incluido (antes de la inclusión del primer paciente) en un registro de ensayos aceptado (tabla 18-10), y que en este registro se declaran los 20 ítems del conjunto mínimo de datos propuesto por la Organización Mundial de la Salud (OMS) y aceptado por el ICMJE (tabla 18-11).

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

$6&310%&-."/64$3*50*.3% Los requisitos de uniformidad del ICMJE proporcionan una pauta general sobre cómo escribir las partes básicas de un manuscrito de investigación, que se han abordado en otras partes de este libro. Es importante tener en cuenta el formato y el estilo de cada una de las partes del manuscrito (fig. 18-1) y asegurarse de que el texto del manuscrito narra la historia y que las cifras y tablas la ilustran. Las instrucciones de la revista para la preparación de las ilustraciones y tablas deben seguirse cuidadosamente. Algunas revistas cobran por la reproducción de imágenes en color, por lo que los autores tienen que decidir si están dispuestos a asumir dicho coste. Los autores también deben asegurarse de que todas las ilustraciones y tablas se explican por sí mismas, y que están estructuradas de manera uniforme. Una pobre presentación de los datos técnicos puede llevar a los editores y revisores a considerar que los datos en sí mismos son de mala calidad. Algunas revistas exigen que los autores de un manuscrito con ilustraciones que contengan fotografías de pacientes o participantes en el estudio presenten un permiso por escrito de éstos para publicarlas en la revista. Este requisito es importante y debe tenerse en cuenta, no al presentar el manuscrito para su publicación, sino en el momento del propio estudio. Algunas revistas solicitan a los autores que proporcionen detalles técnicos acerca de las figuras, y comprueban sistemáticamente todas las de los manuscritos aceptados en busca de indicios de manipulación de las imágenes. Los autores deben estudiar cuidadosamente las instrucciones de la revista sobre estos temas y estar preparados para responder, si es necesario, a las preguntas que los editores puedan hacerles incluso después de la aceptación del manuscrito.

INTRODUCCIÓN Vaya del contexto general del trabajo, para decirle al lector, desde qué se sabía, hacia qué no se sabe todavía y cuáles son los problemas, hasta qué ha decidido hacer

DISCUSIÓN Después de sintetizar sus resultados, identifique sus limitaciones y sesgos, compárelos y contrástelos con los hallazgos previos y discuta las implicaciones teóricas y prácticas de los suyos, haga sugerencias para futuras investigaciones, muestre lo que es nuevo y cómo sus resultados se insertan en el contexto amplio descrito en el inicio de la Introducción

Figura 18-1. 'PSNBUPEFMPTBQBSUBEPTj*OUSPEVDDJØOxZj%JTDVTJØOxEFVONBOVTDSJUP

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

Tabla 18-12. 4FDDJØOEFBHSBEFDJNJFOUPTEFVONBOVTDSJUPDJFOUÓGJDP t -PTBHSBEFDJNJFOUPTFOVONBOVTDSJUPDJFOUÓGJDPTFEBOBMBTQFSTPOBTRVFOPTPOBVUPSFT QFSPIBOBZVEBEPFOMBJOWFTUJHBDJØOPFOMBQSFQBSBDJØOEFMNBOVTDSJUP )BOQSPQPSDJPOBEPDPOTFKP SFWJTJØO TVQFSWJTJØOVPUSBTDPOUSJCVDJPOFTFTQFDÓGJDBT )BOSFDPHJEPPBOBMJ[BEPMPTEBUPT )BOQSPQPSDJPOBEPBZVEBPDPOTFKPFTUBEÓTUJDP )BOQSPQPSDJPOBEPBZVEBUÏDOJDBEVSBOUFMBJOWFTUJHBDJØO )BOQSPQPSDJPOBEPBZVEBFEJUPSJBMPCJCMJPHSÈGJDB PFOMBSFEBDDJØOEFMNBOVTDSJUP )BOQSPQPSDJPOBEPCFDBTPBZVEBGJOBODJFSBPNBUFSJBM TJFNQSFRVFOPEFCBEFDMBSBSTF en alguna otra parte del manuscrito) —Conflictos de intereses relevantes de todos los autores (siempre que no deban declararse en alguna otra parte del manuscrito)

"(3"%&$*.*&/504:053"4%&$-"3"$*0/&4 La sección de agradecimientos es el lugar donde se reconoce la ayuda de personas que no son autores del manuscrito (tabla 18-12). Muchas revistas solicitan de los autores la autorización por escrito de todas las personas que figuran en los agradecimientos. Esta sección puede contener otra información relevante, como la declaración de la contribución de los autores a la investigación y la preparación del manuscrito, así como información sobre la financiación de la investigación, o de otro tipo de conflicto de intereses, o las exenciones de responsabilidad. Algunas revistas solicitan que esta información conste en la página del título y/o en una página destinada a declarar los posibles conflictos de intereses, pero después la publican en la sección de agradecimientos, en letra pequeña.

© Elsevier. Fotocopiar sin autorización es un delito.

#*#-*0(3"'Ê" Aunque el motivo inicial del ICMJE fue la armonización de los formatos y estilos de las referencias bibliográficas de las distintas revistas biomédicas, su papel se ha expandido a otras cuestiones de redacción y publicación. La revisión actual de los requisitos de uniformidad del ICMJE proporciona una breve recomendación sobre cómo escribir las referencias bibliográficas y dirige a los autores a la publicación de la National Library of Medicine de Estados Unidos (tabla 18-13).

-*45"4%&$0.130#"$*Î/1"3"%&5&3.*/"%04 %*4&d04%&&456%*0 Las revistas adheridas al ICMJE, y otras que publican investigación clínica, solicitan a los autores que presenten listas de comprobación e incluyan diagramas de flujo que describan los estudios con un diseño específico. Tales listas de verificación ayudan a los autores a preparar un informe claro y trans-

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Tabla 18-13. 5JQPTEFEPDVNFOUPTJODMVJEPTFOMBTHVÓBTQBSBFTDSJCJS MBTSFGFSFODJBTCJCMJPHSÈGJDBT $JUBSEPDVNFOUPTJNQSFTPTQVCMJDBEPT 1. Revistas 2. Libros 1VCMJDBDJPOFTEFDPOHSFTPT *OGPSNFTDJFOUÓGJDPTZUÏDOJDPT 5. Tesis y tesinas 6. Referencias 1BUFOUFT "SUÓDVMPTEFQFSJØEJDPT .BQBT %PDVNFOUPTMFHBMFT $JUBSNBUFSJBMOPQVCMJDBEP 1FOEJFOUFEFQVCMJDBS jFOQSFOTBx

4FTJPOFTEFQØTUFSTZDPNVOJDBDJPOFTQSFTFOUBEPTFODPOHSFTPT 13. Manuscritos $JUBSNBUFSJBMBVEJPWJTVBM DJOUBTEFBVEJP WÓEFPT EJBQPTJUJWBT GPUPHSBGÓBT FUD 14. Libros y otro material en formato audiovisual 15. Revistas en formato audiovisual 'PUPHSBGÓBTZHSBCBEPT $JUBSNBUFSJBMFO$%30. %7%PEJTRVFUF -JCSPTFO$%30. %7%PEJTRVFUF 3FWJTUBTFO$%30. %7%PEJTRVFUF #BTFTEFEBUPTFO$%30. %7%PEJTRVFUF 1SPHSBNBTJOGPSNÈUJDPTFO$%30. %7%PEJTRVFUF $JUBSNBUFSJBMFO*OUFSOFU 21. Libros en Internet 22. Revistas en Internet #BTFTEFEBUPTTJTUFNBTEFSFDVQFSBDJØOEFJOGPSNBDJØOFO*OUFSOFU 1ÈHJOBTXFC $PSSFPFMFDUSØOJDPZGPSPTEFEJTDVTJØO %JTQPOJCMFFOIUUQXXXODCJOMNOJIHPWCPPLTCWGDHJ DBMMCW7JFX4IPX50$SJEDJUNFE 50$EFQUI

parente de todos los hechos relacionados con su estudio. También ayudan a los revisores y editores a evaluar la calidad del estudio y aumenta las posibilidades de aceptación, si el estudio está bien planificado y realizado, y sus detalles descritos de manera clara y sucinta. Estas directrices han sido desarrolladas por expertos y se basan en pruebas empíricas de que la falta de información específica sobre el estudio se asocia con estimaciones sesgadas de los resultados, y afecta a su fiabilidad y relevancia. Para algunos tipos de estudio, los autores también están obligados a proporcionar una figura, por lo general en el apartado «Métodos», que describa el flujo de los participantes a través del estudio: ¿cuántos se incluyeron?, ¿cómo fueron asignados a los grupos de estudio?, ¿cómo fueron seguidos?, y ¿cómo fueron analizados al finalizar el estudio? Estas listas de comprobación están disponibles en Internet, ya sea en las instrucciones para autores de las revistas o en las páginas web de las organizaciones de expertos, y han sido comentadas en otras partes de este libro. Incluso aunque la revista no exija explícitamente estas listas, recomiendo comprobar si

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

el manuscrito proporciona toda la información pertinente incluida en la lista correspondiente.

."5&3*"-$0.1-&.&/5"3*01"3"3&7*403&4 :&%*503&4 Muchas revistas limitan la extensión de los manuscritos, por lo que los autores suelen tener que hacer una selección de los resultados. La publicación electrónica hace posible presentar, junto con el manuscrito, material complementario para apoyar y reforzar la investigación presentada. Este material puede incluir tablas y figuras adicionales, imágenes de alta resolución, conjuntos de datos, películas, clips de sonido o secuencias de animación; es un material que está a disposición de los revisores y que puede ayudarles a evaluar la calidad del estudio. El material se publica junto con la versión electrónica del artículo, pero no en la revista impresa. Este material deberá elaborarse en el formato especificado por las revistas, con el fin de garantizar que los autores y los revisores puedan utilizarlo directamente.

© Elsevier. Fotocopiar sin autorización es un delito.

$"35"%&13&4&/5"$*Î/:053"%0$6.&/5"$*Î/ Los manuscritos deberán presentarse acompañados de una carta al editor. Algunas revistas exigen explícitamente dicha carta, y solicitan formalmente a los autores que indiquen en la carta que el manuscrito presentado no ha sido publicado y no está siendo considerado para su publicación por ninguna otra revista. Algunas también solicitan una declaración sobre los autores del manuscrito, por ejemplo indicando que todos ellos merecen ser autores, y que todos los que lo merecen firman el manuscrito. La carta también contiene, por lo general, una breve mención de los resultados presentados en el manuscrito, y de su importancia para los lectores de la revista. Aunque no se envía a los revisores, esta carta ayuda a los editores a evaluar inicialmente el manuscrito y decidir si lo envían a los expertos para su revisión. Los editores saben que la carta es una «venta del producto», pero les ayuda a tener una perspectiva más amplia del trabajo de los autores y de los motivos por los que éstos consideran que la revista es un lugar adecuado para la publicación de su investigación. La carta puede contener otra información de interés para el manuscrito y la revista, desde la afirmación de que los autores están dispuestos a cubrir los gastos de reproducción de las ilustraciones en color si el artículo se publica, hasta la sugerencia de nombres de posibles revisores. Algunas revistas solicitan los nombres y datos de contacto de expertos que podrían ser adecuados para revisar el manuscrito, siempre que no presenten un conflicto de interés para ello. Las revistas suelen utilizar uno de estos expertos, junto a revisores de sus propios archivos. La carta también puede especificar nombres de expertos a los que los autores desearían que no se enviara el manuscrito, al ser competidores en el mismo campo. Está justificado hacerlo incluso aunque las instrucciones de la revista no aborden específicamente esta posibilidad.

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Algunas revistas cuentan con formularios de declaración específicos, por ejemplo, de la contribución de los distintos autores, de los conflictos de intereses y/o de la cesión de los derechos de autor. Una vez más, las normas para los autores proporcionan estos formularios (por lo general, como documentos en su página web) e instrucciones de cuándo y de qué manera (por carta, fax, Internet) deben presentarse estos documentos a la revista.

13&4&/5"$*Î/&/1"1&-0&-&$53Î/*$" Hasta hace muy poco, la forma más común de presentar un manuscrito a la revista era en formato papel. La carta de presentación y las copias del manuscrito (entre tres y cinco) se enviaban por correo postal, junto con el resto de la documentación necesaria, a la dirección de la revista. Hoy en día, la mayoría de las revistas usan el envío por vía electrónica, lo que permite acelerar el proceso de revisión y presentar una mayor cantidad de datos e información sobre la investigación. En general, la ventaja de la presentación y la publicación electrónicas es que permite el procesamiento y la publicación de grandes cantidades de datos. El formato de la presentación electrónica puede diferir de la clásica en papel, pero tiene los mismos elementos. Por ejemplo, al realizar una solicitud online, puede no haber una página de título, pero toda la información que debería contener (autores, ayudas a la investigación, presentaciones previas, conflicto de intereses) ha de ser introducida en campos separados, a veces en diferentes páginas web. Cualquiera que sea la forma de presentación, el consejo más importante para los autores que preparan su manuscrito es seguir el sentido común, su experiencia y, sobre todo, las instrucciones para autores de la revista (tabla 18-14). O, parafraseando una famosa cita, confíe en su investigación, pero ¡verifique la presentación de su manuscrito! Tabla 18-14. -JTUBEFDPNQSPCBDJØOSFRVJTJUPTUÏDOJDPTZFEJUPSJBMFTQBSBFMFOWÓP de un manuscrito a una revista 4FDDJØOEFMNBOVTDSJUP

Qué debe comprobarse

Título

o{&TDMBSPZFTQFDÓGJDP o{*ODMVZFFMEJTF×PEFMFTUVEJP QBSBFTUVEJPTDMÓOJDPT

o ¿Incluye las especies (en estudios experimentales con BOJNBMFT

Autores

Cada uno de los autores que firman el manuscrito, ¿satisface MPTDSJUFSJPTEFBVUPSÓBEFM*$.+& 1) o$POUSJCVDJØOTVTUBODJBMBMBDPODFQDJØOZEJTF×P 0o"ERVJTJDJØOEFEBUPT 0o"OÈMJTJTFJOUFSQSFUBDJØOEFMPTEBUPT y 2) o&TDSJCJSFMBSUÓDVMP 0o3FWJTBSDSÓUJDBNFOUFTVDPOUFOJEPJOUFMFDUVBM y 3) o%BSMBBQSPCBDJØOBMBWFSTJØOGJOBM Continúa

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

Tabla 18-14. -JTUBEFDPNQSPCBDJØOSFRVJTJUPTUÏDOJDPTZFEJUPSJBMFTQBSBFMFOWÓP de un manuscrito a una revista (cont.) 4FDDJØOEFMNBOVTDSJUP

Qué debe comprobarse

Listas de comprobación

o Si su manuscrito requiere una estructura especial en el JOGPSNF {TFJODMVZFMBMJTUBEFDPNQSPCBDJØO correspondiente indicando las páginas del manuscrito que DPOUJFOFOMBJOGPSNBDJØORVFTPMJDJUBMBMJTUB o4JTFSFRVJFSFVOBGJHVSBDPOFMGMVKPEFMPTQBDJFOUFTBMP MBSHPEFMBJOWFTUJHBDJØO {TFJODMVZFZTFEFTDSJCF BEFDVBEBNFOUF

Resumen

o{1SPQPSDJPOBUPEBMBJOGPSNBDJØOSFMFWBOUFBDFSDBEFM FTUVEJPPCKFUJWP NÏUPEPT SFTVMUBEPTZDPODMVTJPOFT o ¿Está estructurado siguiendo las instrucciones de la SFWJTUB o{&TUÈDPNQMFUP o{-PTOÞNFSPTDPODVFSEBODPOMPTEFMBTFDDJØOEF SFTVMUBEPT o ¿Las conclusiones se derivan solamente de los resultados QSFTFOUBEPT o{4VMPOHJUVEFTBEFDVBEB HFOFSBMNFOUFEFB palabras) o Si la revista solicita palabras clave, ¿están listadas al final EFMSFTVNFO DPOTFKPTJHBFMMedical Subject Headings, .F4) EF1VC.FE

Número de registro del ensayo clínico

o{&MOÞNFSPEFSFHJTUSPEFMFOTBZPDMÓOJDPBQBSFDFEFTQVÏT EFMSFTVNFO

Cuerpo del manuscrito

*OUSPEVDDJØO o{-BQSFHVOUBEFJOWFTUJHBDJØOFTUÈDMBSBNFOUFEFGJOJEB o{7BEFMPHFOFSBMBMPFTQFDÓGJDP MBIJQØUFTJT

o ¿Las investigaciones previas relacionadas con el problema FOFTUVEJPFTUÈOCJFOEFTDSJUBT

© Elsevier. Fotocopiar sin autorización es un delito.

.ÏUPEPT o{4FEFTDSJCFDPOEFUBMMFMBNVFTUSBEFMFTUVEJP NÏUPEP EFNVFTUSFP DSJUFSJPTEFJODMVTJØOZFYDMVTJØO

o{4FEFTDSJCFDMBSBNFOUFFMEJTF×PEFMFTUVEJP o ¿Se describen todos los métodos y técnicas, incluyendo el BOÈMJTJTFTUBEÓTUJDP o{-BQSFTFOUBDJØOFTDMBSBZTJTUFNÈUJDB 3FTVMUBEPT o{-BQSFTFOUBDJØOEFMPTEBUPTFTDMBSBZTJTUFNÈUJDB o{&MUFYUPEFTDSJCFMPTIBMMB[HPTZMBTUBCMBTZGJHVSBT ilustran el texto (los datos que aparecen en las tablas y GJHVSBTOPFTUÈOSFQFUJEPTJOOFDFTBSJBNFOUFFOFMUFYUP

o{4FQSFTFOUBOTPMBNFOUFMPTSFTVMUBEPT OPMBNFUPEPMPHÓB OJTVEJTDVTJØO %JTDVTJØO o{7BEFMPFTQFDÓGJDPBMPHFOFSBM o{&NQJF[BDPOVOBSFDBQJUVMBDJØODPODJTBEFMPTSFTVMUBEPT QSJODJQBMFT o{$PNQBSBMPTSFTVMUBEPTDPOJOWFTUJHBDJPOFTQSFWJBT o{-BTFDVFODJBEFMPTBSHVNFOUPTFTMØHJDB o{)BZVOBTFDDJØORVFBCPSEFMBTMJNJUBDJPOFTEFMFTUVEJP o{-BTDPODMVTJPOFTBMGJOBMEFMBEJTDVTJØOTFCBTBOTØMP FOMPTSFTVMUBEPTEFMFTUVEJP Continúa

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Tabla 18-14. -JTUBEFDPNQSPCBDJØOSFRVJTJUPTUÏDOJDPTZFEJUPSJBMFTQBSBFMFOWÓP de un manuscrito a una revista (cont.) 4FDDJØOEFMNBOVTDSJUP

Qué debe comprobarse

Agradecimientos, conflicto de intereses y otras declaraciones

¿Se agradecen las contribuciones de las personas que no NFSFDFOTFSBVUPSFTEFMNBOVTDSJUP o$POTFKPZTVQFSWJTJØOHFOFSBM o-FDUVSBDSÓUJDBEFMNBOVTDSJUP o Recogida o análisis remunerado de los datos o$POTFKPFTUBEÓTUJDP o Ayuda técnica o Ayuda editorial *NQPSUBOUFBMHVOBTSFWJTUBTTPMJDJUBOMBBVUPSJ[BDJØOQPSFTDSJUP EFMBTQFSTPOBTDJUBEBTFOMBTFDDJØOEFBHSBEFDJNJFOUPT o{4FJODMVZFVOBEFDMBSBDJØOEFMBDPOUSJCVDJØOEFDBEBVOP EFMPTBVUPSFT o ¿Se especifican los posibles conflictos de intereses de los EJTUJOUPTBVUPSFT o¿Se incluyen las posibles exenciones de responsabilidad FOSFMBDJØODPOFMNBOVTDSJUP o{4FJODMVZFFMQFSNJTPQBSBMBQVCMJDBDJØOEFGPUPHSBGÓBTF JNÈHFOFTEFMPTQBSUJDJQBOUFTFOFMFTUVEJP

Bibliografía

o ¿Se han seguido las instrucciones para escribir y citar las SFGFSFODJBT o ¿Están todas las referencias en la lista y están todas citadas en FMUFYUP o{&TUÈOUPEBTMBTSFGFSFODJBTDJUBEBTDPOFYBDUJUVE o{4POUPEBTSFBMNFOUFSFGFSFODJBT

Tablas y figuras

o{4FOFDFTJUBOUPEBT {1PESÓBTFSNFKPSQSFTFOUBSMPT SFTVMUBEPTEFPUSBNBOFSB

o{4POTFODJMMBT FTUSVDUVSBEBTMØHJDBNFOUFZBVUPFYQMJDBUJWBT o{&MUÓUVMPFTDPNQMFUP o ¿La leyenda explica todos los detalles (abreviaturas, unidades EFNFEJEB FUD

o ¿Se indican las unidades de medida de cada una de las WBSJBCMFT o ¿Se han seguido las instrucciones para autores al preparar las GJHVSBT o{5PEBTMBTUBCMBTZGJHVSBTTFDJUBOFOFMNBOVTDSJUP o{&MGPSNBUPEFMBTUBCMBTZGJHVSBTFTDPOTJTUFOUF o&OFMDBTPEFGPUPHSBGÓBT {TFIBPCUFOJEPFMQFSNJTPQBSBTV QVCMJDBDJØO o Si las figuras no son originales, ¿se ha obtenido el permiso de la FNQSFTBFEJUPSJBM

#*#-*0(3"'Ê"3&$0.&/%"%" Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis PP, Glasziou PP, Irwig LM, et al.; Standards for Reporting of Diagnostic Accuracy. Toward complete and accurate reporting of studies of diagnostic accuracy: The STARD initiative. Standards for Reporting of Diagnostic Accuracy. Br Med J. 2003;326:41-4. Huth EJ, Case K. The URM: Twenty-five years old. Sci Editor. 2004;27:17-21. International Committee of Medical Journal Editors. Uniform Requirements for Manuscripts Submitted to Biomedical Journals Writing and Editing for Biomedical Publication [acceso: 15 de septiembre de 2008]. Disponible en: http://www.icmje.org. Moher D, Schulz KF, Altman DG. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel-group randomized trials. Lancet. 2001;357:1191-4.

3 & 2 6 * 4 * 5 0 4 1" 3 " & - & / 7 Ê 0 % & 6 / . " / 6 4 $ 3 * 5 0

© Elsevier. Fotocopiar sin autorización es un delito.

Patrias K. Citing medicine: The NLM style guide for authors, editors, and publishers [Internet]. 2.ª ed. En: Wendling DL, ed. Bethesda, MD: National Library of Medicine; 2007 [acceso: 15 de septiembre de 2008]. Disponible en: http://www.nlm.nih.gov/citingmedicine. Rossner M, Yamada KM. What’s in a picture? The temptation of image manipulation. J Cell Biol. 2004;166:11-5. Von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative. The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: Guidelines for reporting observational studies. Lancet. 2007;370:1453-7.

&MTJTUFNBEFSFWJTJwO QPSFYQFSUPT QFFSSFWJFX FOMBTSFWJTUBTDJFOUrGJDBT WFOUBKBTZMJNJUBDJPOFT 4-PSFO[PZ($BSSBTDP

© Elsevier. Fotocopiar sin autorización es un delito.

*/530%6$$*Î/ El éxito de cualquier publicación científica no sólo depende del diseño y desarrollo del trabajo de investigación, sino también del planteamiento de los autores en cuanto a su difusión y de la evaluación del manuscrito. El proceso de revisión por expertos (por pares) de los manuscritos, conocido también por el término inglés peer review, es un elemento clave para garantizar la calidad de las revistas científicas y supone un paso esencial en la divulgación de los avances científicos1. Sus objetivos son contribuir al progreso científico mediante la difusión del conocimiento, evitando la publicación de estudios metodológicamente incorrectos, con datos no válidos o con conclusiones erróneas, y facilitando la adecuada presentación de resultados fiables y conclusiones válidas2. Este proceso sirve de ayuda a los editores para seleccionar y mejorar los artículos que se publican, y además puede tener una función formadora para los autores noveles3. En todo el proceso es esencial el papel de revisores, evaluadores, árbitros o referees, y de ellos depende, en buena medida, la calidad de las revistas4. Sin embargo, este sistema de revisión de las publicaciones científicas no se halla exento de críticas, algunas de ellas justificadas, aunque la opinión mayoritaria de los expertos en bibliometría es que, aunque constituye un método mejorable, en la actualidad continúa siendo la mejor estrategia disponible para garantizar la calidad de las revistas científicas en general y de las biomédicas en particular5, hasta el punto de que se considera un criterio de calidad de las revistas científicas y de sus contenidos.

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Este capítulo se dedica a intentar clarificar las luces y las sombras de la revisión externa por expertos en las revistas médicas. Para ello se estructura en cuatro apartados. En el primero se exponen la evolución histórica, los métodos y los sesgos inherentes a este sistema, con el fin de clarificar sus ventajas y limitaciones. La segunda parte hace referencia a la labor del elemento clave del sistema, el revisor, detalla cómo realiza su trabajo, qué manuscritos revisa y qué criterios emplea en el arbitraje. El tercer apartado analiza los imprescindibles aspectos éticos que comporta el trabajo de revisión. En el cuarto y último se plantea el presente y el futuro del peer review con relación al impacto de las tecnologías de la información y la comunicación (TIC), como Internet, en la difusión actual y futura del conocimiento científico.

&70-6$*Î/)*45Î3*$"%&-044*45&."4 %&3&7*4*Î/103&91&3504 La revisión por expertos o peer review, también denominada revisión por pares (en el sentido de iguales) o revisión por colegas, es un método de arbitraje para evaluar la calidad de los artículos científicos y las solicitudes de financiación de fondos para la investigación. Consiste en que dos o más revisores (expertos externos e independientes) leen y analizan los artículos para determinar tanto el rigor metodológico de las investigaciones científicas como la validez de las ideas, además de la veracidad, factibilidad y aplicabilidad de los resultados, así como su impacto potencial en el avance del conocimiento científico. Su objetivo final es establecer un control de calidad de la literatura científica6. Aunque el término peer review es reciente, este tipo de revisión lleva utilizándose desde hace aproximadamente 250 años. Se considera que la primera revista que lo aplicó fue Philosophical Transactions of the Royal Society, la revista de la Royal Society de Londres. Esta institución constituyó, en 1752, un comité de revisores para valorar si los artículos que recibía merecían ser publicados. Cuando era necesario, dicho comité podía solicitar la opinión de otros miembros de la institución expertos en diferentes áreas de conocimiento. La especialización de la ciencia fue el motor principal de la institucionalización de la revisión por expertos. Las revistas recibían artículos cuya calidad lo consideraban difícil de juzgar por su director o el comité editorial, aunque sus miembros también fuesen médicos o científicos con titulaciones similares. En 1893, Ernest Hart, director del British Medical Journal (BMJ), presentó a los miembros de la American Medical Editors’ Association un sistema de revisión por expertos externo al comité editorial, que consistía en enviar cada artículo a un especialista; este método sentó las bases de la actual peer review. Ya entonces se reconocieron algunos de los defectos que hoy en día siguen achacándosele, pero se creyó y se sigue creyendo que puede recomendarse por su autorizada precisión y fiabilidad7. La revisión por expertos se consolidó paulatinamente después de la Segunda Guerra Mundial, pero lo hizo de manera gradual, y no todas las revistas ni todos los revisores atribuyeron el mismo significado a ese método.

& - 4 * 4 5 & . " % & 3 & 7 * 4 * Î / 1 0 3 & 9 1 & 35 0 4

Hoy, a pesar del tiempo transcurrido, sigue sin alcanzarse un consenso respecto a cuál es el mejor tipo de revisión por expertos que debe aplicarse a un artículo científico8. Existen partidarios de mantener el tradicional anonimato de revisores y autores, mientras que hay detractores que defienden que resulta más beneficioso que ambos conozcan sus identidades, mediante el que se ha denominado Open Peer Review y sus variantes Phillica y PLoS Medicine9.

© Elsevier. Fotocopiar sin autorización es un delito.

.&50%0-0(Ê"%&-"3&7*4*Î/103&91&3504 El proceso de revisión es la parte fundamental del proceso de control de calidad utilizado por las revistas científicas que anteponen el rigor científico a cualquier otro, hasta el punto de que normalmente sólo se considera válida una publicación cuando ha pasado por un proceso de revisión por expertos. Formalmente, la comunidad científica no aceptará un nuevo hallazgo hasta que éste se publique en una revista científica que disponga de peer review en su proceso editorial. Este factor condiciona que los avances científicos propuestos por los investigadores no adquieran la condición de conocimiento hasta que hayan superado el proceso de publicación10. El sistema de revisión por expertos asume que el artículo analizado se escribió honestamente, de manera que el proceso no está diseñado formalmente para detectar fraudes, aunque en numerosas ocasiones los descubra. Sus objetivos son: a) evitar la publicación de trabajos de mala calidad; b) mejorar el contenido científico de los artículos, y c) ayudar a fortalecer el lenguaje y la presentación de los datos11. Sin embargo, lo habitual es que los expertos no tengan acceso completo a los datos a partir de los cuales se obtuvieron los resultados del trabajo. Los editores se sienten más cómodos al contar con la ayuda de expertos externos para tomar sus decisiones, aunque no tienen por qué seguir las recomendaciones de los revisores. Algunas revistas publican anualmente los nombres de todos aquellos que han evaluado manuscritos durante dicho año, como muestra de agradecimiento por la colaboración recibida. Asimismo, cada vez más, los comités editoriales elaboran certificados de colaboración para los revisores externos a fin de su inclusión en el currículum vítae y a efectos de méritos en su carrera profesional.

'*"#*-*%"%:7"-*%&;%&-"3&7*4*Î/103&91&3504 La revisión por expertos debe tener cuatro atributos esenciales (tabla 19-1): objetividad, fiabilidad, validez y coherencia. La objetividad es una de las condiciones ineludibles que debe cumplir cualquier revisión. El referee debe evaluar el manuscrito desconociendo la autoría del mismo (doble ciego o double blind peer review) o sin tenerla en cuenta, en caso de que la revista emplee el sistema open peer review. Por esta razón deberá rechazar la revisión de trabajos en los que haya participado o con cuyos auto-

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Tabla 19-1. Atributos de la revisión por expertos Objetividad

Independencia de factores externos en las evaluaciones de manuscritos

Fiabilidad

Consistencia de los juicios emitidos por un revisor determinado sobre un mismo artículo en ocasiones sucesivas, o la concordancia entre los juicios emitidos por diversos revisores sobre un mismo original

Validez

Grado hasta el cual las mediciones de una revisión miden exactamente la calidad de la investigación

Coherencia

Relación lógica entre las decisiones del revisor y la línea editorial de la revista

res o instituciones esté vinculado. También habrá de evitar considerar más válidos los resultados que coincidan con su propia experiencia que los que no, valorando objetivamente el rigor y la aplicabilidad de los mismos. Se entiende por fiabilidad la concordancia (agreement) entre los juicios emitidos por un mismo revisor sobre un mismo artículo en ocasiones sucesivas, o la concordancia de los juicios emitidos por diversos revisores de un mismo original12. Uno de los estudios que analizaron más exhaustivamente la fiabilidad del sistema de revisión por expertos es el de Cicchetti et al.13. Estos autores examinaron una amplia variedad de diseños de investigación en distintas áreas, desde la física a las ciencias de la conducta. El principal resultado de su investigación fue la detección de un bajo nivel de fiabilidad en la mayoría de las revisiones. Muchos de los trabajos que revisaron mostraban un acuerdo entre referees incluso menor que el que se produciría si éstos tomasen sus decisiones al azar. Cuando se estudió la fiabilidad del sistema de revisión, se comprobó que los expertos pueden coincidir al aceptar un original, al pedir cambios y modificaciones, o al rechazarlo, pero a veces lo hacen por razones distintas e incluso por motivos contradictorios. También se observó que se daba el caso contrario, es decir, que los revisores coincidían a menudo en la evaluación de la calidad de un original determinado, pero llegaban a diferentes conclusiones sobre su posible publicación. Fiske et al. obtuvieron hallazgos similares cuando analizaron los informes de los referees de nueve revistas de la American Psychological Association14. A pesar de lo llamativo de estos resultados, resultan difíciles de interpretar. Para algunos investigadores, esta baja fiabilidad del sistema de revisión por expertos es inaceptable y debería reducirse a toda costa mediante formularios de evaluación estructurados que hagan referencia a los puntos esenciales que el editor considere que deben determinar la decisión final de aceptar el manuscrito o a través de listas de comprobación (checklist) de los puntos clave del análisis del manuscrito. Por el contrario, otros autores argumentan que el objetivo de la revisión por expertos no es obtener una alta fiabilidad en el proceso de evaluación, sino ayudar a los editores a tomar una decisión, ya que el origen del bajo nivel de acuerdo entre referees se debe a que muchos editores no los seleccionan al azar, sino que buscan la máxima diversidad de puntos de vista posible15. En consecuencia, resulta poco probable que exista un elevado nivel de acuerdo en sus

& - 4 * 4 5 & . " % & 3 & 7 * 4 * Î / 1 0 3 & 9 1 & 35 0 4

opiniones. La validez del sistema de revisión por expertos tiene relación con la capacidad del método para aceptar los buenos originales y rechazar la investigación de baja calidad. Existen estudios que sugieren que el proceso editorial mejora la calidad de los trabajos enviados a las revistas. Fletcher et al. observaron que la legibilidad de los artículos publicados a principios de los noventa en Annals of Internal Medicine, medida por los índices de Gunning, mejoró levemente tras la revisión y los procesos editoriales16, mientras que Laband et al.17 descubrieron que la longitud de los informes de los referees tenía un impacto positivo en los manuscritos enviados posteriormente por los mismos autores a las siete revistas principales de economía. Contrariamente, otras investigaciones ponen énfasis en las limitaciones de este método. Garfunkel et al.18 enviaron, a finales de los ochenta, 25 artículos que ya habían sido revisados y aceptados para su publicación en Journal of Pediatrics a una nueva revisión por un equipo adicional de dos referees, los cuales descubrieron suficientes problemas en la mayoría de los trabajos como para no dar fácilmente el visto bueno a su posible publicación. Respecto a la coherencia de la revisión por expertos, debe tenerse en cuenta la gran variabilidad entre los revisores respecto a su conocimiento de las líneas editoriales de las revistas con las que colaboran. Corresponde a los editores reconducir este factor para homogeneizar los contenidos de los informes de revisión.

© Elsevier. Fotocopiar sin autorización es un delito.

4&4(04%&-"3&7*4*Î/103&91&3504 Durante el proceso de revisión se pueden producir varios tipos de sesgos19: de publicación, de selección de revisor y de autoría. El sesgo de publicación adopta varias formas. Una de ellas es la publicación de estudios con resultados estadísticamente significativos en detrimento de los estudios negativos, que podrían clarificar aun mejor las incógnitas en una determinada área del conocimiento. Deben detectarse aquellos manuscritos que no son más que unidades mínimas de publicación integradas en un único artículo (publicación fragmentaria), lo que se conoce en el argot coloquial como publicación salami. En otras ocasiones, este sesgo se debe a las características personales, profesionales o institucionales de los revisores. De este modo, suelen publicarse con más frecuencia artículos elaborados de forma purista que otros realizados con una metodología que no lo es tanto, aunque no por ello sean menos interesantes. Del mismo modo, no es infrecuente que se favorezcan las publicaciones de un autor en una revista si éste ha publicado con anterioridad otros trabajos en la misma (68% frente a 35% si no han publicado el primer estudio)20. El sesgo en la elección inadecuada del revisor es otro de los problemas que deben evitarse. El equipo editorial ejerce un papel fundamental a la hora de realizar la selección de revisores que puedan juzgar de forma objetiva el trabajo del autor.

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Los sesgos que comportan mayor gravedad son los relacionados con la falta de detección de infracciones de la ética, como la ausencia de consentimiento informado cuando el diseño del estudio la hace imprescindible, o los sesgos de usurpación de la autoría de los artículos científicos y de omisión del crédito debido al trabajo de otros. Mención aparte requieren los sesgos en la detección de actuaciones delictivas o moralmente reprobables, como la falsificación de datos, el plagio y las publicaciones duplicadas sin autorización editorial21. Cualquier intento de publicación duplicada supone una conducta impropia. La primera revista que publique un estudio posee los derechos de autor y sólo permite su publicación con permiso. Más aún cuando los artículos duplicados pueden sesgar las revisiones sistemáticas y los metaanálisis, en los que los datos se contarían dos o más veces22. Cuando se produce este caso, los editores tienen la obligación de retirar la segunda publicación. No obstante, hay algunos casos en los que se autoriza la republicación de artículos en otro idioma y también otros en los que varias revistas publican un mismo trabajo, como, por ejemplo, cuando éste es obra de grupos multidisciplinarios que afectan a varios colectivos, aunque en ambos casos se deja constancia de la autorización. Es obvio que aunque se eviten estos sesgos, no siempre podrán detectarse los errores científicos en la fase de revisión por expertos. Incluso los ganadores de premios Nobel han publicado artículos erróneos. Un ejemplo es el modelo de la molécula de ADN, de Pauling y Corey, con tres hélices, que posteriormente resultó ser incorrecto23.

3&$-65".*&/50%&-04 3&'&3&&4 Los revisores no perciben remuneración económica alguna por su trabajo, lo que supone una garantía de su objetividad y profesionalidad en el desarrollo de su arbitraje. Y esta falta de remuneración económica del experto por su trabajo es, seguramente, la mejor garantía de la integridad moral de los revisores11. La mayoría de los científicos aceptan ser revisores porque consideran que forma parte de sus deberes generales para con la ciencia, representa una confirmación de su prestigio profesional y aporta posibilidades de enriquecimiento intelectual al tener acceso a la información más actualizada en su campo. De acuerdo con el estudio de Evans et al.24, se considera que el experto ideal debe reunir las siguientes características: edad inferior a 40 años, experiencia en investigación, pertenencia a instituciones de prestigio científico, conocimiento de los miembros del equipo editorial y desconocimiento de la identidad de los autores del trabajo que revisa. Llama la atención que un grado académico o profesional mayor no se correlacione con una mejor calidad de la evaluación efectuada. Los evaluadores deben dominar la especialidad y sus conocimientos han de estar actualizados. Sin embargo, han transcurrido más de dos décadas desde la publicación del estudio, y la edad de los revisores no parece ser un factor determinante en la práctica, sino que la experien-

& - 4 * 4 5 & . " % & 3 & 7 * 4 * Î / 1 0 3 & 9 1 & 35 0 4

cia indica más bien que el factor que más influye es la personalidad de los mismos, su capacidad crítica y su interés por el progreso en el conocimiento. Todo apunta a que son estos factores los que les llevan a realizar esta importante labor, que en el contexto editorial actual supone una de las pocas aportaciones altruistas que subsisten en un mercado legítimamente establecido como un negocio. Los criterios para elegir a los referees son muy diversos. En general los editores seleccionan el panel de revisores por el prestigio y la disponibilidad de los expertos. Hamermesh et al.25 estudió los procesos de selección de referees por parte de los editores de siete revistas de economía y observó que casi el 12% de los mismos pertenecían al mismo departamento universitario que sus colegas editores (en una de las revistas esta proporción superó el 30%). Es frecuente que los investigadores más prestigiosos estén ocupados en otras actividades y, por tanto, los editores de las revistas se vean obligados a buscar a veces revisores menos eminentes, más jóvenes e inexpertos, que a veces pueden aceptar actuar como referee para promocionar sus carreras. Así, por ejemplo, en un estudio sobre la calidad de 1.600 revisiones realizadas para el Journal of Clinical Investigation, se comprobó que la proporción de revisiones de baja calidad era mayor en el grupo de los revisores de alto estatus, mientras que los referees de menor estatus eran los que proporcionaban la mayor parte de las revisiones calificadas como de alta calidad26. Aunque probablemente no exista el revisor ideal, existe acuerdo a la hora de considerar que la selección de estos árbitros debería hacerse según los criterios que se muestran en la tabla 19-2. Tabla 19-2. Características del buen revisor Excelente conocimiento del tema Debe ser una persona conocedora del campo científico afín al tema del artículo que revisa y estar en las mejores condiciones para evaluar su pertinencia, la solidez de los conceptos, la generación de innovaciones en ese campo, la importancia de publicarlo prontamente y la prioridad que indica su difusión para la comunidad científica

© Elsevier. Fotocopiar sin autorización es un delito.

Imparcialidad Un buen revisor debe ser capaz de mantener total objetividad frente al artículo que se le ha pedido analizar. Debe leer el artículo con un ánimo de crítica muy constructiva y señalar, en función de su experiencia y sus criterios, aquellos puntos débiles que considera merecedores de modificación Academicidad El buen revisor debe afrontar el artículo de la misma forma que quisiera que le revisaran sus trabajos; es decir, ha de ser justo, ecuánime, imparcial, rápido y confidencial. Debe sugerir referencias importantes que en su opinión faltan en el artículo, así como comentar los defectos metodológicos que sesgan o invalidan los resultados que se encontraron. Debe ayudar a los editores en la difícil tarea de seleccionar los mejores artículos que van en favor de una mejor calidad de la revista Ser innovador Debe estar atento a lo nuevo y ser capaz de descubrir aquellas aportaciones que implican generación de ideas y conceptos diferentes de lo tradicional, pero con una buena base técnica y con solidez en sus razonamientos Responsabilidad El buen revisor debe contestar inmediatamente si acepta el manuscrito o, por el contrario, rechazar la evaluación si carece de tiempo para dar una respuesta entre 2 y 4 semanas

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

$Î.0'6/$*0/"&- 1&&33&7*&8 La revisión por expertos somete un trabajo al examen de al menos dos expertos en el área. Los árbitros responden con una evaluación del trabajo, que incluye sugerencias sobre cómo mejorarlo. El editor del manuscrito suele analizarlas y lo habitual es que las envíe a los autores, incluyendo recomendaciones explícitas sobre lo que deben hacer para mejorar el manuscrito. Sin embargo, el papel de los árbitros en el proceso de revisión es consultivo: el editor no tiene ninguna obligación formal de seguir su opinión; es más, en muchos casos puede producirse una discordancia entre los árbitros, que habitualmente no se comunican entre sí y por lo general no tienen conocimiento ni de la identidad ni de la opinión de los otros. En general, no existe la necesidad de llegar a un consenso y es el editor quien decide teniendo en cuenta las evaluaciones de los revisores. Tradicionalmente, el trabajo de los árbitros era anónimo, pero poco a poco ha ido cambiando. Actualmente, en algunas áreas de conocimiento, las revistas arbitradas ofrecen al experto la posibilidad de mantener su anonimato. De hecho, cuando los autores tienen conocimiento de la identidad de los revisores, pueden llegar, en función de su contribución a la mejora del artículo, a incluir a los evaluadores en la sección de agradecimientos. En una revista, la selección de expertos suele recaer sobre el editor o el consejo editorial. Al llegar un nuevo manuscrito, el editor selecciona los árbitros, escogidos entre expertos en el área. Los árbitros no han solicitado necesariamente participar de esa forma en el proceso editorial de la revista. Algunas veces se les elige porque se les conoce en el área de la publicación, porque han publicado trabajos en esa área o por recomendación de otras personas. Las agencias financiadoras generalmente seleccionan sus árbitros bajo la forma de un comité de revisión, como paso previo a la recepción de solicitudes. Las sociedades científicas utilizan este mismo método para admitir los trabajos a fin de su presentación en sus congresos. Los autores deben proponer primero un resumen, que revisa un comité científico, el cual, bien directamente o a través de otros árbitros, evalúa la calidad de los trabajos propuestos, y decide su aceptación o no para su presentación en el congreso. El problema reside en muchos casos en que los intereses de la organización del evento van más dirigidos a conseguir un mayor número de participantes que a garantizar mínimos de calidad científica de los trabajos presentados. Lo habitual es evitar la elección de árbitros entre los investigadores cercanos o relacionados con los autores. Se solicita a los revisores que informen a los editores sobre cualquier conflicto de interés que pueda existir para realizar la evaluación. Algunas publicaciones o editores solicitan a los autores una lista de posibles árbitros, que incluya una justificación de su elección. La razón de esto es que puede ocurrir que el tema de un trabajo sea tan especializado que los editores no puedan ubicar especialistas en esa área por sí mismos. La selección de los autores se toma como una sugerencia y no compromete en modo alguno a los editores. El proceso seguido casi siempre es el mismo: se escogen dos o tres árbitros, quienes envían al editor su evaluación del artículo y sus propuestas de mejora. El editor analiza los comentarios, los sintetiza y se los envía al autor. Basándose

& - 4 * 4 5 & . " % & 3 & 7 * 4 * Î / 1 0 3 & 9 1 & 35 0 4

en los comentarios de los árbitros, el editor decide si acepta o no el manuscrito. Cuando un artículo recibe al mismo tiempo evaluaciones muy positivas y otras muy negativas, el editor puede solicitar evaluaciones adicionales para intentar resolver el empate. Otra forma de desempate es que los editores soliciten a los autores que respondan a las críticas de los árbitros como forma de refutar una mala evaluación. En esos casos, el editor generalmente solicita al árbitro que comente la respuesta del autor. No es habitual que los diferentes árbitros se comuniquen entre sí, ni se espera que lleguen a un consenso, aunque en algunas publicaciones se remite la evaluación del otro a cada evaluador. Después de la revisión y de la resolución de los empates que pudieran producirse, el resultado del proceso de evaluación puede ser la aceptación o el rechazo del manuscrito, aunque en muchos casos se propone una tercera opción, que es la solicitud a los autores para que revisen el documento, con los requerimientos específicos de los cambios provenientes de los árbitros que deben realizarse. El sistema de gestión de cada revista varía, pero las propuestas más habituales son las siguientes: t Aceptación incondicional del manuscrito. t Aceptación sujeta a las mejoras propuestas por los árbitros. t Rechazo, animando a los autores a revisar el documento y someterlo a una nueva revisión. t Rechazo definitivo. Sin embargo, algunas publicaciones médicas han adoptado un modelo de acceso abierto (open peer review) y publican en Internet el historial de los artículos, incluyendo el manuscrito enviado originalmente, la evaluación de los árbitros y los sucesivos cambios que ha sufrido hasta la publicación definitiva del trabajo.

© Elsevier. Fotocopiar sin autorización es un delito.

26c)"$&6/3&7*403 Un artículo puede rechazarse por razones de tipo formal (publicación duplicada, inadecuación a la temática de la revista) o científico (falta de originalidad o de interés científico, defectos de método, etc.). Sin embargo, no en todos los casos se justifica el rechazo. Existen varios sistemas de evaluación de un artículo más o menos explícitos. Para evitar la subjetividad, cada vez se usan más las listas de comprobación o checklists, en las que el experto contesta a una serie de preguntas previamente estandarizadas según el tipo de artículo, que luego se envían al comité editorial de la revista27. La mayoría de las revistas biomédicas utilizan un modelo de checklist inspirado en el utilizado por el BMJ, que es el que mejor refleja las directrices señaladas por las Normas de Uniformidad de los Manuscritos presentados a las Revistas Biomédicas28. La mayoría de los evaluadores prefiere recibir directrices o formularios estructurados para la evaluación como el que muestra la tabla 19-3, pendiente de aproba-

%FMFOWrPEFMNBOVTDSJUPBTVQVCMJDBDJwOZEJGVTJwO

Tabla 19-3. Nuevo checklist de Revista de Calidad Asistencial 1. ¿Es descriptivo, preciso y conciso?

Sí / Parcialmente / No

Resumen 2. ¿Define claramente los objetivos del estudio? 3. ¿Señala el tipo de estudio? 4. ¿Indica el ámbito donde se ha realizado? 5. ¿Especifica el tamaño de la muestra? 6. ¿Proporciona los resultados numéricos más importantes? 7. ¿Expone las conclusiones principales del estudio? 8. ¿Su extensión es