Itens no Wikidata podem ser instância de taxon (ou fossil taxon) e podem ter taxon rank de espécie.
Uma das bases de dados de táxons ligados pelo Wikidata é o Interim Register of Marine and Nonmarine Genera (IRMNG). Pelo nome, parece que é focado em gêneros, e não em espécies.
Meu interesse é em listas de espécies. Para isso, quero bases de dados com muitos nomes válidos de espécies. Será que o IRMNG é uma base interessante para isso?
Pode-se usar um query para saber quantos itens com ligação para o IRMNG são exatamente rank de espécie.
O query é curto o suficiente para ser reproduzido aqui:
SELECT
(COUNT(DISTINCT ?item) as ?total_items)
WHERE {
?item wdt:P5055 []; # Has specific database taxon ID
wdt:P105 wd:Q7432. # Taxon rank = species
}
Ele seleciona os itens de determinada base de dados. No caso, é a base IRMNG ID (P5055). Destes itens, ele observa quais tem o taxon rank (P105) de espécie (Q7432).
O resultado: 1131615 itens desta propriedade são espécies.
Para saber quantos itens totais há com esta propriedade, é fácil. Basta desativar (ou apagar) a linha que exige que o taxon rank seja species, com uma # malha antes.
SELECT
(COUNT(DISTINCT ?item) as ?total_items)
WHERE {
?item wdt:P5055 []; # Has specific database taxon ID
# wdt:P105 wd:Q7432. # Taxon rank = species
}
Assim, são 1383278 itens com essa propriedade. Com uma conta simples, 1131615/1383278 = 0,818 percebemos que 81% dos itens desta base de dados se referem a espécie, e não a outros ranks como gênero.
Assim, esta base de dados parece interessante para meu objetivo de listar espécies. Apesar do nome.
Nenhum comentário:
Postar um comentário