DOU 28/11/2025 - Diário Oficial da União - Brasil
Documento assinado digitalmente conforme MP nº 2.200-2 de 24/08/2001,
que institui a Infraestrutura de Chaves Públicas Brasileira - ICP-Brasil.
Este documento pode ser verificado no endereço eletrônico
http://www.in.gov.br/autenticidade.html, pelo código 05152025112800230
230
Nº 227, sexta-feira, 28 de novembro de 2025
ISSN 1677-7042
Seção 1
A proficiência é o valor esperado da distribuição a posteriori de q (parâmetro
que representa a proficiência do aluno no modelo 3PL), calculada com base nas respostas
e nos parâmetros dos itens (discriminação, dificuldade e acerto ao acaso). Essa abordagem
torna a estimação mais precisa.
A precisão da proficiência é avaliada por meio do desvio padrão a posteriori,
que indica o grau de confiança da estimativa, quanto menor o desvio padrão, mais precisa
é a nota estimada.
Com isso, o método EAP permite calcular proficiências consistentes e
comparáveis entre os alunos participantes e as edições diferentes da avaliação de
alfabetização, assegurando a estabilidade e a validade psicométrica das medidas de
proficiência.
Na estimação da proficiência do participante da avaliação é necessário definir
especificações técnicas para garantir a comparabilidade entre as diferentes edições da
avaliação.
Na função fscores do software R, é fundamental definir a média e o desvio-
padrão da distribuição a priori utilizada pelo método EAP, a fim de garantir a
comparabilidade dos resultados. Caso esses parâmetros não sejam especificados, o
software R aplicará valores padrão que podem divergir da distribuição desejada,
comprometendo a comparabilidade das estimativas definidas no momento da criação da
escala.
A distribuição a priori deve ser definida da seguinte forma:
fscores(nome_modelo, method = "EAP", mean=0, cov=1)
APÊNDICE 3
MONTAGEM DOS CADERNOS DE TESTE E SUAS FORMAS DE APLICAÇÃO
Montagem
Para montar os cadernos de prova, deve ser utilizada a metodologia
denominada Blocos Incompletos Balanceados (BIB), permitindo que um grande número de
itens seja aplicado ao conjunto de alunos avaliados, sem que cada aluno precise responder
a todos eles. Após os itens serem elaborados e revisados pedagógica e linguisticamente, o
processo de montagem dos cadernos de prova é iniciado com a seleção dos itens e a
montagem de blocos de itens. A seleção e a distribuição de itens para a composição dos
blocos devem ser orientadas por critérios pedagógicos, que considerem as habilidades da
matriz de referência, o nível de dificuldade dos itens, a adequação dos temas e dos textos
que compõem os suportes dos itens ao público avaliado, comandos e opções dos itens
tecnicamente bem construídos.
Devem ser contemplados, na montagem dos cadernos de teste, itens com
parâmetros na escala Saeb para as disciplinas de Língua Portuguesa e Matemática,
garantindo que os blocos estejam balanceados em termos da sua dificuldade. Para o teste
de Língua Portuguesa, adicionalmente, deve ser garantida a presença de itens próximos ao
ponto 743, limiar na escala que define o Indicador Criança Alfabetizada (ICA). Sempre que
possível, na seleção de itens comuns entre edições da avaliação, é importante tentar
manter a posição original dos itens dentro dos blocos.
Os testes na área de Língua Portuguesa devem ser montados a partir de três
blocos iniciais (Blocos A, B e C) contendo oito itens objetivos, mais 7 blocos de 4 itens
(Blocos 01 a 07) que vão ser rodiziados entre os blocos iniciais e 3 blocos com 2 itens de
escrita de palavra ditada (Blocos i, ii e iii) e um bloco final com um item de produção
textual (Texto); totalizando 52 itens de resposta selecionada e 7 itens de resposta
construída. Esses blocos devem ser apresentados em 21 modelos de cadernos, compostos
por 16 itens de múltipla escolha cada um, formados por 3 blocos: 1 bloco com 8 itens (A,
B ou C) e 2 blocos com 4 itens cada (1 ao 7) e 2 itens de escrita de palavra ditada, mais
um item de produção textual. A Figura 1 apresenta o esquema de montagem dos 21
modelos de cadernos de prova. Esta montagem permite que, em cada turma, o bloco
inicial seja comum e de aplicação totalmente mediada, enquanto os sete blocos que
compõem a seção seguinte do teste sejam de aplicação parcialmente mediada e rodiziados
na turma.
Figura 1: Esquema de montagem dos cadernos de prova de Língua Portuguesa
para o 2º ano
1_MEC_28_006
Para os testes de Matemática, devem ser montados 7 blocos contendo 9 itens
de múltipla escolha e 7 blocos com 1 item de resposta construída cada, totalizando 63
itens de múltipla escolha e 7 itens de resposta construída. Os itens devem ser
apresentados em 21 modelos de cadernos, cada um composto por 3 blocos: 2 blocos com
9 itens cada (múltipla escolha) e 2 blocos com 2 itens de resposta construída, combinados
de maneira única, conforme ilustrado na Figura 2.
Figura 2: Esquema de montagem dos cadernos de prova de Matemática para o 2º
1_MEC_28_007
Cada estudante responde apenas a um caderno de Língua Portuguesa com
19 itens, sendo 16 de múltipla escolha e 3 de resposta construída (escrita); e a um
caderno de Matemática com 20 itens, sendo 18 de múltipla escolha e 2 de resposta
construída.
A P L I C AÇ ÃO
Os cadernos de teste são individuais, um para cada área do conhecimento,
e devem ser aplicados em dias distintos. A aplicação dos testes de Língua Portuguesa
do 2º Ano do Ensino Fundamental deve ocorrer de forma mediada, considerando as
diferentes versões dos modelos de caderno de prova. Os três primeiros blocos (A, B
e C) são de aplicação totalmente mediada, de forma que, em cada turma, os
estudantes respondem a apenas um desses blocos e de maneira totalmente mediada.
Os sete blocos da seção seguinte do teste são de aplicação parcialmente mediada e
distribuídos em rodízio na turma. A aplicação dos testes de Matemática aos estudantes
do 2º Ano do Ensino Fundamental deve ocorrer de forma mediada, considerando as
diferentes versões dos modelos de caderno de prova. Isso porque, no 2º ano, o que
se objetiva avaliar através dos testes de Língua Portuguesa é, justamente, o domínio
do princípio alfabético, de habilidades de leitura e de produção escrita dos estudantes.
No teste de Matemática, por sua vez, objetiva-se avaliar o domínio de habilidades
relativas ao letramento matemático. Por esta razão, é importante que a aplicação dos
testes seja conduzida pelos aplicadores. Mas, isso deve ocorrer de forma padronizada
para todos os entes federados e escolas que estão participando da avaliação.
O aplicador, além de treinamento adequado à aplicação de testes na etapa
da alfabetização, deve contar com instrumento específico para orientá-lo no momento
da aplicação. Este instrumento deve orientar todo o procedimento, indicando
exatamente como o teste deve ser conduzido, ou seja, o que deve ser feito nas fases
de preparação, execução e consolidação da aplicação; o que deve ser lido e o que não
deve ser lido; bem como, o que pode e o que não pode ser respondido pelo aplicador
durante a prova. Todos os estudantes da turma devem resolver os itens ao mesmo
tempo, guiados pelo aplicador. Após a aplicação, cabe ao aplicador o preenchimento
dos cartões resposta dos estudantes.
Os aplicadores devem possuir ensino superior completo, preferencialmente
graduação em Pedagogia ou em Licenciaturas de áreas afins, além de experiência no
magistério nos anos iniciais do Ensino Fundamental e experiência comprovada em
avaliações externas de alunos ou sistemas de ensino ou concursos públicos ou
vestibulares. Ressalta-se que não podem atuar como aplicadores os professores da
escola avaliada, a fim de assegurar a imparcialidade do processo.
Quanto à duração da aplicação do teste, o tempo total de aplicação do
instrumento de Língua Portuguesa precisa ser de até 1 hora e 50 minutos, sendo: até
1 hora e 5 minutos destinados à aplicação das questões objetivas, 15 minutos de
intervalo e até 30 minutos dedicados à realização das questões abertas. O instrumento
de Matemática deve ser aplicado em até 1 hora e 15 minutos, sendo: até 30 minutos
destinados à aplicação do primeiro bloco, 15 minutos de intervalo e até 30 minutos
destinados à aplicação do segundo bloco.
Os estados, por meio das instituições aplicadoras contratadas, devem se
empenhar para oferecer, em parceria com os sistemas de ensino, atendimento
especializado aos alunos com deficiência ou outras necessidades educacionais especiais
nas avaliações. Em relação à aplicação dos testes para os estudantes com deficiência
ou transtornos do desenvolvimento, deve haver um tempo adicional de no mínimo 20
minutos de aplicação.
APÊNDICE 4
PROCEDIMENTO PARA O CÁLCULO DO PESO NA BASE DE DADOS
Na aplicação do sistema estadual de avaliação na Alfabetização, embora a
avaliação se destine a cobrir 100% dos alunos elegíveis, perdas durante a coleta
incentivaram a utilização
de um processo de ponderação
para preservar a
representatividade estatística. A ideia é expandir hierarquicamente os pesos dos
participantes, garantindo que a soma final dos pesos coincida com a população-alvo
(no
caso,
os
estudantes
previstos).
Esse
mecanismo
atua
em
cinco
níveis
interconectados - turma, escola, estrato, município e unidade federativa (UF).
Os cálculos dos pesos e dos resultados agregados são feitos utilizando
microdados dos estudantes, que contêm as informações sobre participação, medida de
proficiência e o valor do peso final atribuído a cada aluno.
1_MEC_28_008
1_MEC_28_009
Obs.: todos os alunos sem participação efetiva recebem peso zero.
1_MEC_28_010
1_MEC_28_011
Por exemplo: se há uma escola em que uma turma inteira não foi avaliada, mas
estava prevista, o peso auxiliar será responsável por compensar essa não participação no nível
k+1(escola). Os níveis estão descritos a seguir:
¸k=1: turma;
¸k=2: escola;
¸k=3: estrato do censo (município, dependência administrativa, localização);
¸k=4: município/dependência administrativa;
¸k=5: UF.
E o peso auxiliar para a expansão de turmas para escolas é o seguinte:
1_MEC_28_012
1_MEC_28_013
Em seguida, o peso é expandido para o nível da escola, multiplicando o peso do
aluno na turma pelo peso auxiliar 1, obtendo então o peso do aluno na escola:
1_MEC_28_014
Fechar