Itens de espécie no Wikidata com IRMNG

 Itens no Wikidata podem ser instância de taxon (ou fossil taxon) e podem ter taxon rank de espécie.

Uma das bases de dados de táxons ligados pelo Wikidata é o Interim Register of Marine and Nonmarine Genera (IRMNG). Pelo nome, parece que é focado em gêneros, e não em espécies.

 Meu interesse é em listas de espécies. Para isso, quero bases de dados com muitos nomes válidos de espécies. Será que o IRMNG é uma base interessante para isso?

Pode-se usar um query para saber quantos itens com ligação para o IRMNG são exatamente rank de espécie.

 O query é curto o suficiente para ser reproduzido aqui:

 SELECT 
  (COUNT(DISTINCT ?item) as ?total_items)
WHERE {
  ?item wdt:P5055 [];  # Has specific database taxon ID
        wdt:P105 wd:Q7432.  # Taxon rank = species
}

Ele seleciona os itens de determinada base de dados. No caso, é a base  IRMNG ID (P5055). Destes itens, ele observa quais tem o taxon rank (P105) de espécie (Q7432).

O resultado: 1131615 itens desta propriedade são espécies.

Para saber quantos itens totais há com esta propriedade, é fácil. Basta desativar (ou apagar) a linha que exige que o taxon rank seja species, com uma # malha antes. 

  SELECT 
  (COUNT(DISTINCT ?item) as ?total_items)
WHERE {
  ?item wdt:P5055 [];  # Has specific database taxon ID
     #   wdt:P105 wd:Q7432.  # Taxon rank = species
}

 Assim, são 1383278 itens com essa propriedade. Com uma conta simples,  1131615/1383278 = 0,818 percebemos que 81% dos itens desta base de dados se referem a espécie, e não a outros ranks como gênero.

Assim, esta base de dados parece interessante para meu objetivo de listar espécies. Apesar do nome. 

Nenhum comentário:

Postar um comentário

As cotas e a ampla concorrência na UFV

Em agosto de 2012 foi sancionada a Lei 12.711, conhecida popularmente como Lei das Cotas. A partir de então, todas as universidades federai...