Bioestatística em ensaios clínicos

A bioestatística fornece a estrutura matemática para projetar ensaios clínicos, analisar seus resultados e tirar conclusões válidas sobre os efeitos do tratamento. Sem uma metodologia estatística rigorosa, os dados clínicos não podem distinguir com segurança os efeitos genuínos do tratamento da variação aleatória ou viés sistemático. Os estatísticos são membros integrantes das equipes de desenvolvimento clínico desde os estágios iniciais de planejamento até a submissão regulatória final.

Teste de hipóteses

A base da análise de ensaios clínicos é o teste de hipóteses, em que a hipótese nula (H0) afirma que não há diferença entre os grupos de tratamento e controle, e a hipótese alternativa (H1) afirma que existe uma diferença. O teste estatístico calcula a probabilidade de observar os resultados obtidos, ou resultados mais extremos, caso a hipótese nula fosse verdadeira. Essa probabilidade é o valor p. Um valor p abaixo de um nível de significância pré-especificado, convencionalmente 0,05, leva à rejeição da hipótese nula em favor da alternativa. É essencial compreender que o valor p não é a probabilidade de a hipótese nula ser verdadeira; em vez disso, mede a compatibilidade dos dados com a hipótese nula.

Valores P e intervalos de confiança

Embora os valores p indiquem se um efeito do tratamento é estatisticamente significativo, os intervalos de confiança fornecem informações sobre a magnitude e a precisão do efeito. Um intervalo de confiança de 95 por cento define um intervalo de valores dentro dos quais o verdadeiro efeito do tratamento se encontra com 95 por cento de confiança. Os intervalos de confiança são mais informativos do que os valores p sozinhos porque transmitem a direção e a faixa plausível do tamanho do efeito. Por exemplo, uma taxa de risco de 0,75 com um intervalo de confiança de 95 por cento de 0,62 a 0,91 indica não só que o efeito é estatisticamente significativo (o intervalo não ultrapassa 1,0), mas também que o verdadeiro benefício pode ser tão pequeno como 9 por cento ou tão grande como 38 por cento.

Superioridade, Não Inferioridade, Equivalência

O objetivo de um ensaio clínico determina a abordagem estatística. Ensaios de superioridade visam demonstrar que o tratamento experimental é melhor que o comparador. Ensaios de não inferioridade visam mostrar que o tratamento experimental não é pior que o comparador por mais do que uma margem pré-especificada. Desenhos de não inferioridade são utilizados quando o medicamento experimental oferece vantagens em segurança, conveniência ou custo que justificam uma pequena perda de eficácia. Ensaios de equivalência visam demonstrar que dois tratamentos são terapeuticamente equivalentes dentro de um intervalo especificado. A escolha do desenho afeta o tamanho da amostra, o método de análise e a interpretação, e deve ser especificada no plano de análise estatística antes da revelação.

Análise de intenção de tratar versus análise por protocolo

O princípio da intenção de tratar (ITT) exige que todos os participantes randomizados sejam analisados de acordo com o grupo de tratamento designado, independentemente de terem recebido o tratamento, concluído o estudo ou se desviado do protocolo. A análise ITT preserva os benefícios da randomização e fornece uma estimativa imparcial do efeito do tratamento no cenário do mundo real, onde ocorrem não adesão e abandonos. A análise por protocolo (PP) inclui apenas os participantes que completaram o estudo sem grandes desvios de protocolo. A análise PP pode superestimar os efeitos do tratamento porque exclui participantes não aderentes. A maioria das agências reguladoras exige ITT como análise primária, com PP como análise de sensibilidade para avaliar a robustez dos resultados.

Análises de subgrupo

Análises de subgrupos examinam se o efeito do tratamento varia de acordo com as características do paciente, como idade, sexo, gravidade da doença ou status do biomarcador. Embora as análises de subgrupos possam gerar hipóteses sobre os efeitos diferenciais do tratamento, elas são propensas a resultados falso-positivos devido a múltiplos testes e ao tamanho reduzido das amostras dentro de cada subgrupo. O teste estatístico de interação avalia se o efeito do tratamento difere significativamente entre os subgrupos. Os resultados dos subgrupos devem ser interpretados com cautela e são considerados exploratórios, a menos que sejam pré-especificados, devidamente fundamentados e confirmados em vários estudos. As autoridades reguladoras podem exigir análises de subgrupos para apoiar as alegações de rotulagem para populações específicas de pacientes.

Análises Provisórias e Regras de Parada

Análises provisórias são exames pré-planejados de acumulação de dados de ensaios realizados antes da análise final. Eles servem a dois propósitos: parada antecipada para eficácia ou futilidade esmagadora e reestimativa adaptativa do tamanho da amostra. Os testes repetidos de dados acumulados aumentam a taxa de erro Tipo I, portanto, limites de parada devem ser aplicados para controlar o nível de significância geral. Os métodos comuns incluem os limites O’Brien-Fleming e Haybittle-Peto, que exigem evidências muito fortes de benefício ou dano para interromper um ensaio precocemente. Um conselho de monitoramento de segurança de dados (DSMB) analisa os resultados provisórios independentemente do patrocinador e recomenda a continuação, modificação ou encerramento do estudo com base em regras pré-especificadas.

Projetos de teste adaptativos

Desenhos adaptativos permitem modificações pré-especificadas no ensaio com base em resultados provisórios sem comprometer a validade estatística. As adaptações comuns incluem reestimativa do tamanho da amostra, seleção da dose, abandono do braço de tratamento e enriquecimento da população de pacientes. Projetos adaptativos podem melhorar a eficiência concentrando recursos nos regimes de tratamento e subgrupos de pacientes mais promissores. No entanto, requerem um planeamento cuidadoso, métodos estatísticos mais complexos e uma infra-estrutura robusta para recolha e análise de dados em tempo real. A aceitação regulatória de projetos adaptativos está crescendo, mas as adaptações devem ser totalmente descritas no protocolo e no plano de análise estatística antes de qualquer revisão não cega dos dados.

Conclusão

A bioestatística não é apenas uma ferramenta para analisar resultados de ensaios, mas um componente fundamental do desenho e interpretação dos ensaios. A aplicação adequada de métodos estatísticos garante que os ensaios clínicos produzam evidências confiáveis, reprodutíveis e interpretáveis. Os patrocinadores que investem num planeamento estatístico rigoroso na fase de concepção têm maior probabilidade de gerar dados convincentes que apoiam a aprovação regulamentar e informam a prática clínica.