-
Notifications
You must be signed in to change notification settings - Fork 12
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
dependence relations found in corpus, not in the UD #66
Comments
@vcvpaiva as relações existem em UD sim http://universaldependencies.org/u/dep/index.html As duas primeiras ocorrências de remnant no bosque_CF estão certas, compatíveis com a explicação em http://universaldependencies.org/u/dep/remnant.html. A terceira parece errada, 20 -remnant-> 9 para mim!
|
O caso de reparandum é mais difícil, mas acho que está errado: "Escavou quanto quis, imediatamente atrás do muro que deitou abaixo para as máquinas poderem passar -- diz o autarca que com a promessa de, depois, reconstruir o muro." que reparandum com promessa?! |
Para os vocatives alguns exemplos são: O "Gente" vocative para piranhão! Como [piranhão] é o root da oração seguinte, parece estar certo para mim.
O [mãe] vocative com o [acode-] abaixo:
Aqui estou em dúvida se a direção está correta no [vítimas] vocative com [Alô]. Não seria o inverso pela documentação http://universaldependencies.org/u/dep/vocative.html ?
|
@livyreal exemplos ajudam! Veja como anda a documentação! Tente construir exemplos deste caso! Obviamente minhas considerações acima não esgotam os comentários, mas podemos revisar todos estes casos sim, dado que eles são os que não ocorrem no corpus do Dan. |
well, everything that doesn't exist in Zeman's analysis and exists in Bick's should be checked, no?
|
@vcvpaiva todos estes casos já estão em outros issues sobre tokenização. mwe e name são casos particulares de compound. mwe none do Bick é porque os mwe estão aglutinados com underscore em um único token. name idem. compound temos que investigar os casos, como compound é a relação mais geral, provavelmente foram casos de mwe discontínuas. mas isto já está no #4, #13, #23 e #46 |
Concordo que o caso do 'reparendum' 'e complicado, pois o anotador precisa adivinhar o que o autor de uma frase que nao faz sentido, queria ter dito. mas e' so' um exemplo, podemos relevar, talvez.
o anotador acha que a frase era pra ser
|
os exemplos dessas 5 relacoes sao interessantes, pois elas nao existiam (eu acho) quando o Dan fez a conversao dele. mas sao cafe pequeno, pois sao um total de 75 sentencas no maximo. e fenomenos dificeis que nem ellipsis. muito mais importante quantitativamente 'e decidir que tipo de reconciliacao faz sentido fazer com as named entities e mwes. eu acho que fazia sentido re-escrever as mwes do Dan no novo corpus, verificando que as 3168 mwes do Dan foram achadas do mesmo jeito no novo corpus, se for facil, se os identificadores de sentenca forem bons pra isso. |
Este issue é outro muito antigo que não lista problemas concretos no corpus. As considerações foram da época onde estávamos consolidando as duas versões do corpus Bosque, vide Rademaker, Alexandre, et al. "Universal dependencies for Portuguese." Proceedings of the Fourth International Conference on Dependency Linguistics (Depling 2017). 2017. Vou fechar este issue. Qualquer problema ainda existente no corpus que tenha sido listado aqui, me parece estar já sendo tratato em outras issues. |
Bicks' dependencies have 5 dependency relation types that Dan's UD do not have:
very small numbers,but still, they do not seem to exist in official UDs. what should they be? from the stats lines 97, 98 and 100. and 83, 84.
The text was updated successfully, but these errors were encountered: