DOU 28/11/2025 - Diário Oficial da União - Brasil

                            Documento assinado digitalmente conforme MP nº 2.200-2 de 24/08/2001,
que institui a Infraestrutura de Chaves Públicas Brasileira - ICP-Brasil.
Este documento pode ser verificado no endereço eletrônico
http://www.in.gov.br/autenticidade.html, pelo código 05152025112800229
229
Nº 227, sexta-feira, 28 de novembro de 2025
ISSN 1677-7042
Seção 1
A P Ê N D I C ES
APÊNDICE 1
PROCEDIMENTOS PARA CALIBRAÇÃO DOS ITENS QUE COMPÕEM OS TESTES
QUE AVALIAM A ALFABETIZAÇÃO
Na avaliação da Alfabetização do Saeb, a calibração dos itens pode ser realizada
por dois métodos: o método de grupos múltiplos com o uso da base clone, ou o método
de calibração com parâmetros fixos.
O
método 
de
grupos
múltiplos
com 
base
clone
(https://download.inep.gov.br/avaliacao_da_alfabetizacao/documentos_tecnicos/bases_
clones_facilitacao_equalizacao_medidas.pdf) utiliza uma base de dados simulada criada
para servir como grupo de referência no processo de equalização das medidas da avaliação
de Alfabetização ao longo do tempo. Seu objetivo é simplificar a aplicação do método de
fixação dos parâmetros dos itens comuns, procedimento amplamente utilizado pelo Inep
em avaliações baseadas na Teoria de Resposta ao Item (TRI).
Na prática, a base clone reproduz uma amostra fictícia de respostas geradas a
partir dos parâmetros originais dos itens calibrados na escala de referência. Ela substitui o
uso de bases reais de aplicações anteriores - tradicionalmente utilizadas como referência
nos modelos de grupos múltiplos da TRI - e, com isso, elimina a necessidade de
transformações adicionais nos parâmetros dos itens, mantendo todos os resultados
diretamente na escala original de calibração.
O segundo método, que vem sendo amplamente utilizado nas avaliações do
Saeb, é a calibração com parâmetros fixos (Fixed Item Parameter Calibration - FIPC) (Klein
& Ricarte, 2025). Esse método permite colocar diferentes aplicações de teste em uma
mesma escala, garantindo a comparabilidade dos resultados ao longo do tempo e entre
grupos distintos de estudantes.
O método FIPC parte de um conjunto de itens âncora, cujos parâmetros de
discriminação, dificuldade e acerto ao acaso foram previamente estimados em uma
calibração de referência. Esses itens funcionam como pontos fixos na escala e são
mantidos constantes durante o processo de estimação dos novos itens. Assim, os novos
itens são ajustados de forma coerente com a métrica original, dispensando a necessidade
de reestimar todos os parâmetros simultaneamente.
A estimação dos parâmetros é feita com base no modelo logístico de três
parâmetros (3PL), que considera a probabilidade de acerto ao acaso. O processo de
estimação dos parâmetros utiliza-se o pacote mirt, do software R, que aplica o algoritmo
de maximização da verossimilhança pelo método EM. Essa abordagem produz resultados
equivalentes aos obtidos pelo método de grupos múltiplos com base clone, mas com maior
simplicidade operacional, pois requer apenas as respostas dos novos itens e os parâmetros
fixados dos itens âncora.
Independentemente
do método
adotado, grupos
múltiplos
ou FIPC,
é
necessário definir especificações técnicas para garantir a comparabilidade entre as
diferentes edições da avaliação.
Na função mirt.model do software R, as distribuições a priori devem ser
definidas conforme os seguintes parâmetros:
PRIOR = (1-itens, a1, lnorm, 0.530628251, 0.5), (1-itens, g, expbeta, 5, 17)
Essas especificações indicam que o parâmetro de discriminação (a1) segue uma
distribuição log-normal, e o parâmetro de acerto ao acaso (g) segue uma distribuição beta
exponencial, o que contribui para uma estimação mais estável e coerente com os valores
esperados do modelo 3PL.
Na função mirt, também é necessário definir o número e o intervalo dos pontos
de quadratura, utilizados para aproximar a distribuição da proficiência dos respondentes.
Os valores recomendados são:
quadpts = 61,
technical = list(theta_lim = c(-6.0, 6.0), NCYCLES = 500)
Essas
configurações asseguram
maior precisão
na estimação,
cobrindo
adequadamente o intervalo de proficiência dos estudantes e favorecendo a convergência
do algoritmo de maximização da verossimilhança.
A calibração dos itens, seja pelo método de grupos múltiplos com base clone
ou pelo método FIPC, garante a continuidade da escala de proficiência e a comparabilidade
das estimativas entre edições da avaliação, assegurando a coerência psicométrica
necessária para o monitoramento do desempenho dos estudantes ao longo do tempo.
APÊNDICE 2
SINTAXE
DA
ESTIMAÇÃO
DAS 
PROFICIÊNCIAS
DOS
ALUNOS
DA
A L FA B E T I Z AÇ ÃO
A nota (proficiência) do aluno participante da avaliação de Alfabetização é
estimada utilizando o modelo de três parâmetros (3PL) da TRI, a nota representa seu o
nível de conhecimento demonstrado nas respostas aos itens. Como não é possível obter
esse valor por uma fórmula simples, utiliza-se um método estatístico específico da TRI.
O Inep adota o método EAP (Expected a Posteriori) para estimar as
proficiências em suas avaliações. Esse método combina as respostas do participante com
uma distribuição a priori (normal, com média 0 e desvio padrão 1) que reflete a
proficiência esperada do grupo de referência.