Itens de espécie no Wikidata com IRMNG

 Itens no Wikidata podem ser instância de taxon (ou fossil taxon) e podem ter taxon rank de espécie.

Uma das bases de dados de táxons ligados pelo Wikidata é o Interim Register of Marine and Nonmarine Genera (IRMNG). Pelo nome, parece que é focado em gêneros, e não em espécies.

 Meu interesse é em listas de espécies. Para isso, quero bases de dados com muitos nomes válidos de espécies. Será que o IRMNG é uma base interessante para isso?

Pode-se usar um query para saber quantos itens com ligação para o IRMNG são exatamente rank de espécie.

 O query é curto o suficiente para ser reproduzido aqui:

 SELECT 
  (COUNT(DISTINCT ?item) as ?total_items)
WHERE {
  ?item wdt:P5055 [];  # Has specific database taxon ID
        wdt:P105 wd:Q7432.  # Taxon rank = species
}

Ele seleciona os itens de determinada base de dados. No caso, é a base  IRMNG ID (P5055). Destes itens, ele observa quais tem o taxon rank (P105) de espécie (Q7432).

O resultado: 1131615 itens desta propriedade são espécies.

Para saber quantos itens totais há com esta propriedade, é fácil. Basta desativar (ou apagar) a linha que exige que o taxon rank seja species, com uma # malha antes. 

  SELECT 
  (COUNT(DISTINCT ?item) as ?total_items)
WHERE {
  ?item wdt:P5055 [];  # Has specific database taxon ID
     #   wdt:P105 wd:Q7432.  # Taxon rank = species
}

 Assim, são 1383278 itens com essa propriedade. Com uma conta simples,  1131615/1383278 = 0,818 percebemos que 81% dos itens desta base de dados se referem a espécie, e não a outros ranks como gênero.

Assim, esta base de dados parece interessante para meu objetivo de listar espécies. Apesar do nome. 

GBIF, AFD e outras bases de dado de táxons no Wikidata

O Wikidata possui itens que podem representar espécies e outros táxons. Cada item tem propriedades, algumas das quais são ligações para bases de dados tradicionais de táxons. Dentre estas bases de dados de táxons estão o Global Biodiversity Information Facility (GBIF), COL (Catalogue of Life), OTOL (Open Tree of Life), etc. Estas propriedades recebem o código Wikidata property to identify taxa (Q42396390).

Construiu-se um query para obter todas essas propriedades: https://w.wiki/HEx4 (execução rápida).

Com uma query, é possível descobrir quantos items do Wikidata utilizam quais propriedades. As bases de dados com mais de um milhão de itens de táxons são: 

P846 GBIF taxon ID 3319448
P10585 Catalogue of Life ID 2288294
P9157 Open Tree of Life ID 2033527
P5055 IRMNG ID 1383278
P830 Encyclopedia of Life ID

1105767 

 A query completa encontra-se em https://qlever.dev/wikidata/tRIwGH (execução lenta).

 Assim, o GBIF é a base de dados com maior número de itens. No entanto, nem todos os itens de táxon possuem ligação para o GBIF. Isso pode ser simplesmente uma limitação do Wikidata (ex. há registro da espécie no GBIF, mas o item no Wikidata ainda não tem ligação para ele) ou pode representar uma lacuna real no GBIF (ex. espécie recém descoberta atualizada no Wikidata mas não no GBIF; ou espécie registrada em outra base de dados mas não no GBIF).

 Para testar a sobreposição do GBIF com outras bases de dados, foi feita uma query. A query seleciona um número aleatório de items com a propriedade da base menor (ex. iNaturalist taxon ID) e conta quantos deles tem ligação para o GBIF, retornando a porcentagem. É preciso atualizar a query para cada código P de cada propriedade. Query disponível em: https://w.wiki/HFTV (link para P6039 = Australian Faunal Directory ID).

 A maioria das bases de dados amostradas possui 90% ou mais de itens representados no GBIF. No entanto, Australian Faunal Directory ID (P6039) teve apenas 62% dos seus itens com ligação para o GBIF. O que explica essa baixa concordância?

 Uma nova query pode ajudar a entender. Essa query pega itens aleatórios da AFD e retorna seu label e seu link para o GBIF. Disponível em: https://w.wiki/HFTz. Vamos ver exemplos.

Kaimon plistonotius (Q111594552) não tem ligação para o GBIF (ainda), mas existe no GBIF (12231277). Assim, basta um voluntário adicionar a ligação. E eu fiz isso.

 Enchesphora poliophanes (Q111311085) não existe no GBIF (conforme esta busca), apenas seu gênero. Assim, se trata de fato de uma lacuna no GBIF.

 Uma explicação para a baixa representatividade no GBIF é que o AFD teria uma grande quantidade de itens que não são táxon. Isso pode ser conferido com outra query. Esta query a seguir pega itens que têm ligação para o AFD e retorna seu "instance of" (ou seja, se é um taxon, ou uma pessoa, ou um livro, etc.) e "instance of Label", além de "taxon rank level", para verificar se é realmente uma espécie, ou gênero, família, etc. Query em  https://w.wiki/HFVD (LIMIT 123 para executar rapidamente). 

Com a query, é possível verificar visualmente que não há desvios do esperado. Todos os itens vistos são táxon ou táxon fóssil, portanto dentro do escopo do que teria ligação para o GBIF. Em uma amostra de 12 mil itens, menos de 30 eram instâncias de algo fora do escopo (como "clado", "misspelling" ou "unavailable combination"). Assim, mantêm-se a hipótese de lacuna no GBIF.

   Para comparação, a query semelhante buscando a propriedade do Internet Archive (P724) retorna itens que são instância de edição, filme, revista científica, etc. (https://w.wiki/HFVY) 

Em contagem mais exata,  dos 168069 itens que utilizam P6039 (Australian Faunal Directory ID), 166068 são exatamente "taxon" ou "fossil taxon". Query: https://w.wiki/HFZU.

 Outra base de dados com baixa representatividade no GBIF é BHL page ID (P687), que possui 78618 itens. Em uma amostragem, 52,84% dos itens tinham ligação para o GBIF. No entanto, de todos os itens de BHL, apenas 751 são exatamente "fossil" ou "fossil taxon". Portanto, não é uma base de dados focada em táxons.
 

Sonho da nave espacial

A nave espacial surgiu sobre a cidade sem ninguém perceber. Um colega desapareceu. Depois apareceu de novo dizendo que tinha estado lá. Que bastava desejar ir pra lá que seríamos levados, e bastava desejar sair e seríamos devolvidos.

Estava procurando um lugar tranquilo com a mulher que eu estava no sonho, então desejei ir nós dois para lá. Fomos levados voando, de pé, atravessando prédios e estruturas. Fiz a pose em T, com os braços bem abertos, e vi a cidade lá em baixo, olhando para mim assustado. Finalmente chegamos num quarto arrumado, simples. Enfim poderíamos namorar. Mas toda hora alguma coisa interrompia a gente. Uma hora um robô bem rechonchudo perguntando se precisávamos de algo. Outra hora uma governanta explicando as regras do lugar, regras de convivência entre os hóspedes, apontando para uma placa, que entrava em detalhes sobre como, se houvesse um casal no quarto, as mulheres também deveriam sentir prazer. Outra vez ouvinos um choro de bebê vindo de fora, cortando totalmente o clima. Outra hora entraram algumas crianças e adolescentes, com idades em sequência, que eram de propriedade da nave e precisavam ser educadas. A cada vez desejei ficar a sós, um quarto a prova de som, etc, e os desejos foram sendo cumpridos. Tomava muito cuidado com a formulação do desejo, sempre desejando continuar seguro e com a minha parceira, e evitando uma linguagem vaga que levava a consequências terríveis em histórias de gênios.

Enfim, quisemos ir embora. Desejei isso, com cuidado, mas a governanta apareceu e disse que não podia ser tão explícito assim. Meu amigo tinha desejado acordar do lado de fora, por isso foi levado. Mas só desejar sair não ia funcionar. Aí comecei a achar que algo muito errado estava acontecendo.

Perdi a noção do tempo. Achei que estava lá a poucas horas, achei que estava lá a dias, achei que estava lá a anos. A memória picada não contava uma história única. Estava andando pelo corredor e no instante seguinte num quarto? Encontrava pessoas totalmente apáticas, e depois eram outras, conversadeiras e cheias de emoção no rosto. Queria me encontrar com uma pessoa, mas outra aparecia no lugar, e nada fluía tão bem.

Meu amigo aparece, aparentemente também prisioneiro daquele sistema esquisito. Ele logo comenta algo sobre tornozeleiras de contas, tipo um artesanato barato de praça, colocado após cada intervenção dos alienígenas sobre os "hóspedes". Que eu deveria prestar atenção em quem eu encontrava pelos corredores. Dou um passo e ouço um chacoalhar vindo de baixo. Tiro o tênis, e por debaixo da meia, contas prendendo meu pé esquerdo. Chacoalho a perna e uma dúzia de tornozeleiras aparecem. Dou um grito típico de final de episódio de Além da Imaginação. Quantas vezes eu teria passado por aquele tal procedimento? O que teriam feito comigo, e o que eu teria feito nos momentos que não me lembrava? As pessoas que encontrei estavam controlando a si mesmas ou estavam sob controle dos nossos anfitriões?

Começamos a bolar um plano de fuga. A nave já não estava mais flutuando sobre a cidade, mas se tornara um prédio com várias saídas. Quais seriam verdadeiras?

Chega a hora da rebelião. Arrombo portas dos quartos individuais, chamando os demais para a fuga. Eu e os colegas corremos pelos vários corredores, convocando todos a fugir. Pulo os degraus, pulo os corrimões, querendo fazer isso o mais rápido. A cada quarto, de uma a três pessoas que não esperava a convocação, algumas conhecidas, mas todas se animam a tentar. Logo somos dezenas, talvez duas centenas de pessoas correndo para o saguão de "entrada". Qualquer pessoa de fora acharia que ali é a sede de uma empresa moderna, com a entrada ampla, pé direito alto, vidraças nas paredes deixando a luz natural entrar e se combinar com a iluminação artificial sobre a portaria. Nem imaginariam a prisão.

A multidão não sabe para onde ir. A fuga por cima dá numa varanda sem rampa de descida, e os três que tentam pular caem pela última vez. A saída mais pra baixo, eu sabia, estava fechada. Como eu sabia? Lembrava de um sonho, ou uma simulação, como um videogame? Eu já havia tentado todos esses caminhos, na memória turva típica dos sonhos. E sabia o caminho mais certo.

Oriento que se concentrem em determinado saguão. Pelo canto do olho percebo funcionários do local, olhando atentos mas sem intervir, provavelmente armados. Naquela rota de fuga haveria mais soldados no caminho, esperando os primeiros sacrifícios a sair pelas portas e janelas? Talvez eu devesse esperar alguns outros irem na frente, para só então tentar fugir no meio da confusão. Mesmo que nem todos chegassem à cidade, era necessário tentar, nem que fosse para causar dor de cabeça em nossos captores.

No saguão, procuramos pontos fracos. A porta trancada, os vidros grossos. Jogo um banco nas janelas baixas, depois nas janelas altas, mas ele só quica e volta. Encontro uma fresta numa janela baixa, e percebo as três camadas do vidro. Se eu quebrar uma de cada vez talvez tenha sucesso. Enfio a perna de um banco sem jeito na fresta, peço para outro prisioneiro me passar um banco para me apoiar, e subo no apoio sem pernas que ele me oferece. Melhor do que nada. Consigo um ângulo melhor, estouro o primeiro vidro. O primeiro ar de liberdade.

Estando do lado de fora, consigo estourar mais duas janelas, e um pequeno fragmento plástico pendendo de cima não atrapalha a multidão saindo pelos buracos na parede. Atrás de mim, um jardim com arbustos, duas árvores, e um caminho que pode dar para a cidade, com alguma sorte. Não sei se iremos conseguir, mas não há sinal de resistência da empresa, e com toda certeza vale a pena tentar.

Lendo ciência: "and colleagues" substituindo et al.

Artigo utiliza "Losos and colleagues" em vez de "et al." para se referir a referência com diversos artigos.

 

Nas referências, os colegas são distintos em cada artigo, mas são citados juntos devido ao primeiro autor em comum.

 

Ghalambor et al. (2007). doi: 10.1111/j.1365-2435.2007.01283.x


As cotas e a ampla concorrência na UFV

Em agosto de 2012 foi sancionada a Lei 12.711, conhecida popularmente como Lei das Cotas. A partir de então, todas as universidades federai...