Índice h, Google Scholar, Índice h5, Publish or Perish e Índice h10
Minha intenção com esta publicação será apresentar os elementos mínimos necessários para que os pesquisadores tenham condições de compreender o que são estes tópicos (Índice h, Google Scholar, Índice h5, Publish or Perish e Índice h10) que estarão diretamente relacionado com o processo de avaliação da produção veiculada via periódicos científicos (Qualis) no quadriênio 2017-2020 – especialmente para as áreas de humanidades, ensino e saúde coletiva, que tendem a utilizar o índice h.
Reforço que há detalhes técnicos e variações que não abordei nesta postagem, pois o ponto principal aqui é apresentar uma introdução a estes assuntos.
Uma das deliberações definidas pela CAPES, via decisão do CTC (Comitê Técnico-Científico), é de que serão utilizados índices bibliométricos1, sendo que o índice será definido pelos colégios e/ou áreas. Por padrão, serão utilizados CiteScore (Scopus) e JCR (Web of Science), com imputação via índice h5 para os periódicos que não são indexados por estas bases, para as áreas de Exatas e Ciência da Vida; enquanto o Colégio de Humanidades, Ensino e Saúde Coletiva usará o índice h (índice h5, índice h10 ou índice h-vida – apesar de não haver indícios de que esta última opção efetivamente será utilizada)2.
Índice h
Quaisquer discussões que envolve o índice h deve partir da explicação do que é o índice, quando foi criado, como foi criado, visando o quê e como ele funciona3.
O que é o índice h?
Jorge E. Hirsch partiu da seguinte questão: como medir e comparar o impacto4 da produção de um dado pesquisador? De modo a apresentar uma forma de realize mensuração, publica, em 2005, um artigo propondo a utilização de um índice bibliométricos que visasse quantificar o impacto da produção de um indivíduo por meio da contabilização das citações recebidas nos seus artigos publicados.
HIRSCH, J. E. An index to quantify an individual’s scientific research output. Proceedings of the National Academy of Sciences, v. 102, n. 46, p. 16569–16572, 15 nov. 2005. DOI 10.1073/pnas.0507655102. Disponível em: http://www.pnas.org/cgi/doi/10.1073/pnas.0507655102. Acesso em: 6 out. 2020.
Hirsh buscou uma maneira simples de quantificar o impacto da produção científica de um pesquisador, sendo que o mais comum, até aquele momento, era a utilização do índice JCR (da Clarivate) e considerar o impacto das revistas (não artigos) nas quais os trabalhos são publicados. O modelo proposto buscava criar um índice que refletisse a vida profissional, como autor, de um pesquisador, ou seja, englobava, no cálculo, de todos os artigos do pesquisador.
A proposta utilizou-se dos dados de citação da Thomson ISI Web of Science, que hoje transformou-se no Web of Science e pertence à Clarivate. Em última instância, ele buscava algo que permitisse esse tipo de afirmação: dois pesquisadores com índice h similares são comparáveis, em termos de impacto, independente se o número de publicações e citações não são iguais (por momentos distintos da carreira, por exemplo).
Como calculamos o índice h atualmente?
O índice h5 (independente do que – podemos calcular o índice de pesquisador, periódicos, instituição, grupo de pesquisa, país, entre outros), de modo simples, leva em consideração a seguinte formulação:
- X número de artigos, recebendo, no mínimo, X citações, é igual ao índice h.
Essa é a simplicidade que o Hirsch buscava. Um ponto importante e que não é abordado por Hirsch no artigo, mas terá impacto no índice h5 do Google é a possibilidade do recorte temporal.
Exemplo de cálculo
Um pesquisador (poderia ser, também, um periódico) com 7 artigos com as seguintes quantidades de citações em cada um:
- Artigo 1 – 1 citações;
- Artigo 2 – 3 citações;
- Artigo 3 – 0 citações;
- Artigo 4 – 9 citações;
- Artigo 5 – 253 citações;
- Artigo 6 – 83 citações;
- Artigo 7 – 3 citações.
Terá índice h igual a 3, pois há, no mínimo, três artigos com 3 ou mais citações (assinalados de amarelo). Para que ele passe a ter índice h igual a 4 será necessário que um dos artigos com menos do que 4 citações (qualquer um dos não assinalados) atinjam esta quantidade. Da mesma forma, para obter um índice h igual a 5 será necessário que dois artigos (qualquer um dos não assinalados) com menos do que cinco citações atinjam este número.
Google Scholar
E onde entra o Google isso tudo? Dentro do processo e coletar informações de sites, de modo a possibilitar a apresentação de resultados a partir de buscas (basicamente o que o Google faz em seu buscador tradicional) são identificados sites que veiculam conteúdo acadêmico – faz parte do algoritmo identificar estes sites e, normalmente, há elementos do código do site que permitem esta identificação. Considerando que há uma demanda específica por este tipo de conteúdo acadêmico (e provavelmente interessado na fatia de mercado dominada pelos grandes publishers (editoras), com relação a este tipo de conteúdo) o Google criou o Google Scholar (no Brasil, Google Acadêmico) de modo a disponibilizar resultados específicos de pesquisas, publicações científicas e patentes. O Google Scholar é considerado hoje a base de dados acadêmica (indexador) mais inclusiva, no sentido de reunir a maior quantidade de conteúdo científico indexado6.
Índice h5
A partir dos dados coletados e realizando um cruzamento entre as informações obtidas o Google Scholar passou a disponibilizar uma lista com o índice h5 das publicações científicas – é possível realizar buscas apenas por nome, através deste link https://scholar.google.com.br/citations?view_op=top_venues&hl=pt-BR – e também abriu a possibilidade de criação de Perfis (Profile) 7 de pesquisadores. Essa lista leva em conta os artigos publicados nos cinco anos anteriores (por isto o numeral 5 após o ‘h’, de modo a marcar o recorte temporal), atualmente sendo o intervalo 2015-2019, e é atualizada anualmente no meio do ano, junho/julho (em data próxima da atualização de outros indexadores bibliométricos internacionais, como CiteScore, Scimago, JCR, entre outros).
Para receber esse índice h5 do Google Scholar (que é gerado de forma automatizada) um periódico deve atender um conjunto de requisitos:
- Ter publicado, no mínimo, 100 documentos no intervalo de tempo definido (atualmente 2015-2019);
- Periódicos que não receberam citação no período não recebem o índice;
- Problemas no processo de indexação das revistas podem afetar o índice do periódico;
- Ver detalhes de indexação em https://scholar.google.com.br/intl/pt-BR/scholar/about.html.
Publish or Perish
O Publish or Perish é um software, gratuito (sem necessidade de cadastros), de análise de citação através de base de dados selecionadas (Google Scholar, Web of Science, Scopus ou com dados fornecidos a ele). Está disponível para várias plataformas (Windows, macOS, Linux) e pode ser obtido através do link https://harzing.com/resources/publish-or-perish.
O software realiza o cálculo do índice h (e de outros índices) a partir dos parâmetros fornecidos a ele e sua utilização em larga escala, quando utiliza a base de dados do Google Scholar, pode apresentar algumas limitações (no quesito número de buscas diárias)8.
Índice h10
Índice h10 foi uma proposta alternativa para avaliação bibliométrica que leva em consideração, especialmente, mas não só, que a cultura de citação das áreas de humanidades (não só no Brasil, mas também em vários outros países Latino-americanos e Europeus – não tenho análises realizadas a partir de dados Asiáticos e Africanos, apesar de acreditar que não irá divergir, consideravelmente, do diagnóstico que faço aqui) não correspondem a intervalos temporais imediatos (de 2 anos), como o utilizado no JCR/JIF e/ou curto (intervalor temporal de até 5 anos), como Scopus/Scimago e Índice h5 do Google Scholar9; deste modo, propôs-se considerar o tempo de 10 anos.
Não existe, hoje (novembro de 2020), um sistema automatizado que forneça o índice h10 e isto é o maior empecilho em sua utilização. Ele pode ser gerado e calculado através de qualquer base de dados, no entanto, no caso das Humanidades, a que melhor atende a critérios de representatividade e cobertura é o Google Scholar (como mencionado em uma nota anterior). Ao que tudo indica, as áreas que utilizarão o índice h5 ou índice h10, via Google Scholar, para o Qualis Periódicos do quadriênio 2017-2020, obterão os dados através do software Publish or Perish.
Doutorando em Letras pelo CEFET-MG (na temática de processos editoriais de periódicos científicos brasileiros).
- Uma informação importante, que se deve levar em conta nesta postagem, é o fato de que todos comentários realizados, relativos ao Qualis, são baseados em documentos e vídeos públicos e acessíveis por quaisquer pessoas.
COORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR. Ofício Circular no 31/2020-GAB/PR/CAPES. CAPES. 2020. Disponível em: http://uploads.capes.gov.br/files/OF_CIRCULAR_31-2020-GAB-PR-CAPES.pdf. Acesso em: 23 ago. 2020.
COORDENAÇÃO DE APERFEIÇOAMENTO DE PESSOAL DE NÍVEL SUPERIOR. Ofício Circular no 35/2020-GAB/PR/CAPES. CAPES. 1 de set. de 2020. Disponível em: http://www.prppg.ufpr.br/site/wp-content/uploads/2020/09/oficio_circular_35-2020-gab-pr-capes.pdf. Acesso em: 2 nov. 2020.
AUTORIA COLETIVA. Carta ao Presidente do CAPES e do CTC-ES. 14 de out. de 2020. Disponível em: http://pensaraeducacao.com.br/blogpensaraeducacao/wp-content/uploads/sites/6/2020/10/Carta_Humanidades_Presidente_CAPES-1.pdf. Acesso em: 2 nov. 2020.
SANTOS, Paulo Jorge dos. Novo Qualis – Live com Prof. Paulo Jorge dos Santos (membro do GT CAPES que elaborou a proposta). CPGSS UFPR. 14 de ago. de 2020. Disponível em: https://youtu.be/zTeT_k-wLqw. Acesso em: 24 ago. 2020.
Há um segundo vídeo do Paulo Santos, posterior a este, mas como ele não apresenta nenhuma informação adicional, que seja significativa para o fim proposto nesta publicação, ele não será citado mencionado, mas informamos que foi uma apresentação promovida pela Pró-reitoria de pesquisa da UFPE e encontra-se no Youtube.[↩] - Reforço que haverá exceções e a possibilidade de escolha foi dada às coordenações de áreas[↩]
- Na elaboração de parte deste tópico, assim como dos seguintes, foi utilizado o conteúdo dos slides de uma apresentação que realizei para editores de periódicos na primeira quinzena de outubro de 2020. Os slides utilizados na apresentação mencionada estão disponíveis no link https://doi.org/10.5281/zenodo.4084725[↩]
- Ao longo de toda esta postagem, sempre que foi mencionado impacto tenha em consideração impacto de citação. Pessoalmente defendo que impacto tem dimensões muito mais amplas, e que precisam ser tratadas de forma diferenciada, mas, neste momento, não entrarei nesta discussão – pretendo dedicar, posteriormente, uma postagem especificamente a isto.[↩]
- Importante mencionar que há variações (que recebem nomes específicos) a partir da proposta de Hirsh.[↩]
- O artigo citado abaixo mostra um estudo comparativo entre algumas bases de dados – há vários outros artigos neste sentido, com resultados semelhantes. Não é o foco desta publicação tratar das limitações e problemas que a base do Google Scholarpossui – e ela possui, são conhecidos e constam em bibliografias que tratam do assunto. No entanto, posteriormente, dedicarei uma postagem exclusivamente a isto. Detalhes sobre o processo de indexação podem ser obtidos no link https://scholar.google.com.br/intl/pt-BR/scholar/about.html. Apesar de dizer o contrário, o Google Scholar inclui, em sua base de citações, as citações obtidas através de, pelo menos alguns, livros, teses e dissertações.
MARTÍN-MARTÍN, Alberto; THELWALL, Mike; ORDUNA-MALEA, Enrique; DELGADO LÓPEZ-CÓZAR, Emilio. Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics, n. 0123456789, 2020. DOI 10.1007/s11192-020-03690-4. Disponível em: https://doi.org/10.1007/s11192-020-03690-4. Acesso em: 5 out. 2020.[↩] - Não entrarei no mérito de periódicos científico utilizarem a ferramenta de Profile do Google Scholar como forma de mostrar/acompanhar o impacto de citações de seus artigos, mas é importante mencionar que isto existe. [↩]
- Tecnicamente o software é tratado como um robô que está coletando os dados do Google. Por sua fez o Google, de modo a impedir isto, amplia o tempo entre as buscas autorizadas pelo equipamento que está utilizando o software[↩]
- Infelizmente carecemos de trabalhos, atuais, que apresentem informações sobre a meia vida dos artigos nacionais, de forma ampla, detalhado por área e subárea e não só restrito a periódicos que estão só no SciELO (ou qualquer outro indexador mais restrito), por exemplo.[↩]
One Reply to “Índice h, Google Scholar, Índice h5, Publish or Perish e Índice h10”