Metodologia

Na pesquisa conduzida pelo Fórum de Ciência e Cultura, buscou-se diretamente as Pró-Reitorias da UFRJ para obter informações estruturadas sobre a universidade em formato conveniente e modificável. Entre abril e outubro de 2020, foram consultadas as pró-reitorias de Graduação (PR-1), Pós-Graduação e Pesquisa (PR-2), Planejamento, Desenvolvimento e Finanças (PR-3), Pessoal (PR-4) e Extensão (PR-5). Também foram fontes de dados o Complexo Hospitalar; o projeto Ágora, de mapeamento das competências da UFRJ feito pelo LabNet (NCE); e fontes externas à UFRJ como o Museu de Astronomia e Ciências Afins (MAST). Os dados obtidos junto a esses órgãos e instituições e que foram utilizados nas visualizações serão detalhados abaixo.

Os dados foram coletados, quando possível, em Excel ou convertido para este formato, quando localizados em PDF. Para o desenvolvimento das visualizações de dados, foi utilizada linguagem de programação Javascript junto da biblioteca D3.js. Em geral, o processamento dos dados e a implementação de testes de visualização foram realizados na plataforma online Observable, que oferece um ecossistema reativo concebido para o desenvolvimento desse tipo de software. As bases de dados utilizadas pelas visualizações foram armazenadas em um repositório público na plataforma GitHub. Eventuais tratamentos dos dados que demandaram mais recursos computacionais foram realizados offline utilizando a linguagem de programação Python 3.8.6 e seus módulos e posteriormente enviados ao repositório GitHub.

Mapa da Graduação: expansão de cursos

Na universidade, não há dados sistematizados com informações sobre matriculados nos cursos da UFRJ desde sua fundação, em 1920. Os registros acadêmicos só deixaram de ser feitos manualmente em 1967, com a criação do Núcleo de Computação Eletrônica da UFRJ, responsável pelo processo de informatização da universidade. Atualmente, a principal fonte de informação sobre o tema é o Sistema Integrado de Gestão Acadêmica (SIGA), criado em 2001, tendo como gerenciador de banco de dados o SQLServer, da Microsoft. Os sistemas em funcionamento antes disso foram migrados para o Siga ainda naquele ano. Dessa forma, a série histórica do registro acadêmico da UFRJ se constrói com dados consistentes a partir da década de 1960, período em que a informatização se iniciou na universidade. Os dados ganham ainda mais qualidade a partir de 2001, com a criação do SIGA (ver o trabalho de Storino, 2017, aqui – https://bit.ly/3nrSopz).

A partir da base de dados do Siga, obtida em formato Excel, foi possível levantar, com a assistência do Coordenador Administrativo de Acesso à Graduação, Ricardo Storino, o total de estudantes de graduação ingressantes, matriculados e concluintes nas últimas décadas. As informações sobre ingressantes são geradas a partir das listas de classificados do Sistema de Seleção Unificada (Sisu) e das vagas do Teste de Verificação de Habilidade Específica da UFRJ. Dados complementares são preenchidos pelos estudantes na matrícula, entre eles um questionário socio-econômico. Já os matriculados são tanto os que estão ativos, inscritos em disciplinas, quanto quem trancou sua matrícula, enquanto os de concluintes são informados por cada unidade da UFRJ.

Com as informações, foi possível gerar visualizações a partir dos microdados sobre alunos de graduação, permitindo filtros tanto por curso quanto por centro da UFRJ. Os dados de uma forma geral demonstram a expansão da universidade em número de cursos e matriculados. O curso de Direito, por exemplo, o maior hoje em número de matrículas, passou de 312 estudantes matriculados em 1973 para 2.727 no segundo semestre de 2019. O dendrograma, uma das visualizações, permite acompanhar a criação de cursos desde o final da década de 1960.

Os perfis dos estudantes da UFRJ

Outra frente de produção de visualizações foi traçar um panorama dos diferentes perfis dos estudantes de graduação e sua representatividade na universidade. Esse recorte também foi possível a partir dos microdados do Siga. A base de dados do sistema forneceu, em formato Excel, a distribuição dos estudantes por gênero, cor e renda para cada curso de graduação da UFRJ.

Optou-se por trabalhar uma série histórica a partir do final da década de 1990, período que antecede o processo de implantação das cotas raciais e sociais, ocorrido em 2013, a partir da lei federal 12.711, de agosto de 2012. O percentual de cotas foi crescendo gradualmente até chegar em 50% em 2016.

Embora a informação sobre gênero se mostre mais completa, para boa parte da série histórica do Siga os dados sobre cor e renda dos estudantes estão incompletos mesmo para anos mais recentes. Os “não declarados” estão na casa dos 20% no quesito cor nos últimos anos, enquanto o mesmo indicador para renda vem caindo: passou de 80% do total em 2012 para 8% no segundo semestre de 2019. No sistema do Siga, a declaração de cor passou a ser obrigatória em 2019. No mesmo ano, os dados sobre renda passaram a ser obrigatórios para estudantes que ocupam vagas da Política de Ação Afirmativa. Essas informações constam como dados complementares nas matrículas.

Outras visualizações que ajudam a entender a mudança de perfil dos estudantes da UFRJ são os mapas com os estados, cidades fluminenses e bairros da cidade do Rio de Janeiro de origem dos ingressantes na universidade. Os dados indicam uma participação maior de estudantes de outros estados, com a implementação do Sisu como forma de ingresso na universidade, bem como crescimento de ingressantes em municípios do estado do Rio como Macaé e São Gonçalo, além da Baixada Fluminense. Na cidade do Rio, os ingressantes de bairros da Zonas Norte e Oeste também aumentaram em anos mais recentes. Os dados sobre estado, cidade e bairro de origem são preenchidos pelos próprios estudantes na inscrição do Sisu, THE ou como forma de complementação da matrícula.

Programas de Pós-Graduação

Os dados coletados sobre criação de programas partiram do livreto de cursos divulgado anualmente pela Pró-Reitoria de Pós-Graduação e Pesquisa (PR2) referente a 2018, último disponível no momento da coleta. Há informação sobre o ano de criação de cada curso de mestrado, mestrado profissional e doutorado, além do último conceito da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes).

Os dados são consultados na plataforma Sucupira, da Capes, e fornecidos pelas coordenações dos cursos à PR2. As informações foram convertidas de um arquivo PDF para uma planilha Excel. Os números indicam que há dois picos de criação de programas de pós-graduação na UFRJ: entre 1970 e 1972, durante a ditadura militar, e em 2009, durante o governo do ex-presidente Luiz Inácio Lula da Silva.

Pesquisa e produção científica

Para gerar visualizações sobre a pesquisa na universidade, foram usados dados organizados pelo projeto Ágora, mapeamento das competências da UFRJ feito pelo LabNet (NCE/UFRJ), coordenado pelo professor Claudio Miceli. O levantamento tem como fonte a base de dados do sistema de currículos Lattes, do Conselho Nacional de Desenvolvimento Científico e Tecnológico (Cnpq). As informações são referentes a janeiro de 2020 e foram coletadas pelo LabNet para professores vinculados à universidade. A lista de professores foi obtida na Pró-Reitoria de Pessoal (PR-4) e inclui pesquisadores vinculados à universidade em dezembro de 2019.

Cruzando as informações da PR-4 com a base do Lattes, o Ágora extraiu dados sobre artigos e eventos informados nos currículos dos docentes até janeiro de 2020. São informações como nome do artigo, palavras-chave, local de publicação e área de conhecimento. Para os eventos, é possível saber a cidade e país em que foram realizados. Os dados do Ágora foram fornecidos em Excel. Informações pessoais dos professores foram mantidas em sigilo.

Escolaridade e distribuição de professores

As informações partiram da base de dados da Superintendência Administrativa da Pró-Reitoria de Pessoal (PR4), que reúne cadastros dos docentes da UFRJ. As principais informações coletadas foram a escolaridade e a distribuição de professores em setores da universidade. Os dados são referentes a dezembro de 2019 e detalham carga horária, titulação e unidade em que os mais de 4 mil docentes da universidade atuam. Foram fornecidos em planilha de Excel.