Ensaio clínico: o desfecho foi positivo, posso acreditar?

Estamos diante de um ensaio clínico sobre um assunto palpitante, quando nos deparamos com um desfecho positivo para o nosso questionamento inicial.

Tempo de leitura: [rt_reading_time] minutos.

Estamos diante de um ensaio clínico sobre um assunto palpitante, quando nos deparamos com um desfecho positivo para o nosso questionamento inicial. Há uma tendência natural em nos agarrarmos a este resultado como verdade absoluta, mas será que podemos de fato confiar? Foi publicado um artigo no New England Journal of Medicine que nos traz alguns questionamentos que precisamos fazer ao texto para interpretar melhor os resultados quando o desfecho é positivo. Traremos a seguir os principais pontos da publicação.

1. O P VALOR SER MENOR QUE 0.05 É SUFICIENTE?

Um valor P de 0,05 tem um risco de 5% de um resultado falso positivo (ou seja, não existe diferença real entre os tratamentos). Se um teste tiver a intenção de fornecer prova de uma diferença real de tratamento, além de qualquer dúvida razoável, um valor de P muito menor, ou seja, P <0,001, é necessário.

2. QUAL É O MAGNITUDE DO BENEFÍCIO DO TRATAMENTO?

Além da significância estatística, precisamos avaliar se o tratamento traz uma diferença clinicamente significativa. Essa determinação requer o exame do efeito do tratamento em uma escala relativa (por exemplo, pelo cálculo do risco relativo ou da razão de riscos) e uma escala absoluta (por exemplo, pelo cálculo das diferenças nas taxas de eventos durante o acompanhamento e o número necessário para tratar).

Outro ponto essencial é o exame do intervalo de confiança de 95%. Por exemplo, se o valor P estiver próximo de 0,05, o intervalo de confiança variará de quase nenhum efeito a um limite superior que é consideravelmente maior que a estimativa pontual.

No artigo, eles trazem um exemplo concreto desta análise, usando o estudo IMPROVE-IT 7, no qual a ezetimiba foi comparada com placebo em pacientes com síndromes coronarianas agudas que estavam sendo tratados com sinvastatina; a razão de risco para o desfecho primário composto de morte cardiovascular, infarto do miocárdio, angina instável, revascularização ou acidente vascular cerebral foi de 0,94 (intervalo de confiança de 95% [IC], 0,89 a 0,98; P = 0,016). As taxas de eventos primários em sete anos foram de 32,7% com ezetimiba versus 34,7% com placebo, uma diferença de dois pontos percentuais, com um intervalo de confiança de 95% que variou de quase 0 a 4 pontos percentuais. Embora os achados deste estudo tenham sido descritos como “positivos”, pode-se questionar se o benefício da ezetimiba é grande o suficiente para justificar seu custo e possíveis complicações. O Food and Drug Administration (FDA) recomendou contra a expansão do rótulo de ezetimiba para incluir uma indicação para uma redução nos eventos cardiovasculares.

3. OS RESULTADOS SECUNDÁRIOS SE RELACIONAM COM O PRIMÁRIO?

A confiança na “positividade” global de um estudo é aumentada se os desfechos secundários pré-especificados também mostrarem um benefício no tratamento. Por outro lado, se os desfechos secundários não mostrarem qualquer indício de benefício, as dúvidas plainarão.

4. OS RESULTADOS SE CONFIRMAM EM DIFERENTES SUBGRUPOS?

Quando o desfecho se mostra significativo de forma consistente em diferentes subgrupos, nossa confiança aumenta. Os efeitos do tratamento podem variar de acordo com as características do paciente. Podemos observar um efeito consistente em todos os tipos de pacientes, mas certos subgrupos de alto risco podem ter benefícios absolutos maiores, como foi observado com estatinas em pacientes com múltiplos fatores de risco cardíaco. Uma situação complicada ocorre quando há um subgrupo onde o resultado do estudo não pareça ser benéfico. Recomenda-se cautela, pois descobertas ilegítimas podem surgir quando vários subgrupos são analisados.

5. O ENSAIO É GRANDE O SUFICIENTE PARA SER CONVINCENTE?

Quando um pequeno ensaio clínico atinge significância estatística para seu desfecho primário, precisamos de uma interpretação cautelosa. Nos testes com amostra muito pequena, efeitos positivos do tratamento são suscetíveis a exageros e falsos positivos podem ocorrer.

O exemplo usado para ilustrar este conceito foi um ensaio de N-acetilcisteína versus placebo para prevenir a nefropatia induzida por radiocontraste, em que 1 de 41 pacientes que receberam N-acetilcisteína tiveram um desfecho primário, em comparação com 9 de 42 pacientes que receberam placebo, resultando em um risco relativo com N-acetilcisteína de 0,10 (IC 95%, 0,02 a 0,90; P = 0,01). Com base nesse pequeno ensaio, a conclusão mais apropriada é de que a N-acetilcisteína “pode ser eficaz”. Tal conclusão motivaria a conduta de um ensaio maior e mais definitivo. Posteriormente, uma metanálise subseqüente de 10 estudos randomizados (1.916 pacientes) relataram que a evidência era muito fraca e heterogênea para apoiar o uso de N-acetilcisteína para essa indicação.

6. O ENSAIO FOI INTERROMPIDO PRECOCEMENTE?

Há testes que são interrompidos precocemente porque os resultados provisórios mostram fortes evidências de superioridade do tratamento. Porém, esta prática pode exagerar a eficácia do tratamento, tendo em vista que o efeito estimado do tratamento varia aleatoriamente em relação ao efeito verdadeiro. Se a estimativa provisória for baseada em uma indicação aleatoriamente alta de eficácia, é mais provável que ela cruze um limite estatístico de parada e convença um comitê de monitoramento de dados e segurança de que existem evidências contundentes de benefício.

7.  EFICÁCIA X SEGURANÇA: O BALANÇO É POSITIVO?

Quando um novo tratamento tem eficácia superior, é importante identificar preocupações sobre segurança que possam compensar os benefícios. Uma descrição equilibrada de eficácia e segurança deve ser fornecida. Uma boa alternativa é avaliar a relação entre o número necessário para tratar do benefício versus o número necessário para prejudicar.

8. EXISTEM FALHAS NO DESIGN OU NA CONDUÇÃO DO TESTE?

Diante de um resultado altamente significativo para o desfecho primário há um longo caminho para fundamentar a visão de que as descobertas não podem ser atribuídas ao acaso. Deve-se estar atento para os vieses gerados por estudos em que não haja cegamento. Além disso, limitações na integridade e qualidade dos dados também podem corromper a validade de um teste. Nem todos os pacientes cumprem totalmente os esquemas de tratamento pretendidos, e alguns desistem do acompanhamento.  

Por exemplo, o estudo ATLAS ACS 2 – TIMI 51 de rivaroxabana versus placebo em pacientes com síndromes coronarianas agudas mostrou diferenças altamente significativas entre grupos em favor da dose mais baixa de rivaroxabana em relação a ambos os desfechos primários e morte cardiovascular sozinho. Mas 27,6% dos pacientes descontinuaram o tratamento prematuramente, e os dados sobre o estado vital estavam faltando para 7,2% dos pacientes – fatores que introduziram a incerteza. Esses problemas pareciam ser maiores neste estudo do que em outros grandes estudos que abordam síndromes coronarianas agudas e contribuíram para a decisão da FDA de suspender a aprovação do rivaroxaban para essa indicação.

9. AS AVALIAÇÕES APLICAM-SE AOS MEUS PACIENTES?

Este é um ponto crucial. As descobertas de qualquer estudo aplicam-se aos pacientes específicos inscritos e às terapias administradas. Neste contexto, devemos avaliar com cautela se os resultados podem ser generalizados para outros pacientes. Por exemplo, o estudo SPRINT31 excluiu pacientes com menos de 50 anos de idade e aqueles com diabetes ou história de acidente vascular cerebral. Os resultados dos ensaios aplicam-se a apenas 20% de todos os pacientes com hipertensão observados na prática. A representação geográfica em um ensaio também pode afetar a generalização de seus resultados. Muitos ensaios importantes são multinacionais, o que é uma vantagem em conferir significado global. Se o recrutamento de pacientes for focado em uma região, a aplicabilidade mundial pode ser limitada. Além disso, as diferenças genéticas, anatômicas, ambientais e dietéticas entre os povos às vezes dificultam a generalização dos resultados entre os países.  

Enfim, um resultado positivo em um estudo clínico não significa uma verdade absoluta. Precisamos exercitar o pensamento crítico para avaliar os resultados dos ensaios. Neste contexto, o artigo do NEJM nos traz um bom caminho para alcançarmos conclusões mais confiáveis.

LEIA MAIS: ‘The Primary Outcome Fails’: quando nem tudo se resume ao valor de p

Referências:

  • The Primary Outcome Is Positive — Is That Good Enough? September 8, 2016. N Engl J Med 2016; 375:971-979. DOI: 10.1056/NEJMra1601511

Avaliar artigo

Dê sua nota para esse conteúdo

Selecione o motivo:
Errado
Incompleto
Desatualizado
Confuso
Outros

Sucesso!

Sua avaliação foi registrada com sucesso.

Avaliar artigo

Dê sua nota para esse conteúdo.

Você avaliou esse artigo

Sua avaliação foi registrada com sucesso.

Baixe o Whitebook Tenha o melhor suporte
na sua tomada de decisão.

Tags