Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

revisão dos lemmas #384

Open
6 tasks
arademaker opened this issue Nov 4, 2021 · 0 comments
Open
6 tasks

revisão dos lemmas #384

arademaker opened this issue Nov 4, 2021 · 0 comments
Milestone

Comments

@arademaker
Copy link
Collaborator

arademaker commented Nov 4, 2021

issues relacionados

Sobre este assunto, se quisermos consistência com o MorphoBr, lembro de comentário do @leoalenc antigo e decisão que tomamos no MorphoBr:

problema: atribuir a palavras como meninas o lema menino. Isso é bastante problemático para compreensão textual. Veja: a sentença as meninas ficaram grávidas recebem como representação lógica expressão onde consta menino como predicado! Ou seja O sistema vai entender que os meninos homens ficaram grávidos!

na linguística gerativa, acredita-se que o traço de gênero não é interpretável, ou seja, é destituído de valor semântico. O gênero é uma propriedade intrínseca de cada substantivo, advogado e advogada são substantivos diferentes, mas que podem ser relacionados por meio de uma derivação morfológica, mas cada um tem seu próprio gênero. Se alguém resolver atribuir um valor semântico ao gênero feminino na representação semântica, vai ter problema atribuindo sexo a palavras como mesa, cadeira, carro etc. por outro lado, em sentenças como "um membro do grupo ajudou a vítima", a pessoa que ajudou só poderia ser do sexo masculino e a vítima, apenas feminina, o que contraria os fatos.

A consulta abaixo pode ser um ponto de partida para correção dos substantivos:

% awk 'tolower($2) != tolower($3) && $4 ~ /NOUN/ && $6 ~ /Number=Sing/ && $6 !~ /Abbr=Yes/' documents/* | wc -l
     155
% awk 'tolower($2) != tolower($3) && $4 ~ /NOUN/ && $6 ~ /Number=Sing/ && $6 !~ /Abbr=Yes/' documents/* | head
13	setença	sentença	NOUN	<np-def>|N|F|S|@P<	Gender=Fem|Number=Sing|Typo=Yes	10	obj	_	CorrectForm=sentença
36	antepassada	antepassado	NOUN	<n>|<np-def>|ADJ|F|S|@P<	Gender=Fem|Number=Sing	33	nmod	_	_
6	mínimo	pequeno	NOUN	<n>|<SUP>|<np-def>|ADJ|M|S|@P<	Gender=Masc|Number=Sing	2	obl	_	SpaceAfter=No
8	Bonequinha	bonequinho	NOUN	<first-cjt>|PROP|M|S|@S<	ExtPos=PROPN|Gender=Fem|Number=Sing	4	appos	_	_
13	secretária	secretário	NOUN	<np-idf>|N|F|S|@P<	Gender=Fem|Number=Sing	9	obl	_	_
1	Advogada	advogado	NOUN	<np-idf>|N|F|S|@SUBJ>	Gender=Fem|Number=Sing	2	nsubj	_	_
4	advogada	advogado	NOUN	<np-def>|N|F|S|@P<	Gender=Fem|Number=Sing	1	nmod	_	_
7	goiás	goiá	NOUN	<np-idf>|N|F|S|@N<	Gender=Fem|Number=Sing	6	nmod	_	_
4	apresentadora	apresentador	NOUN	<cjt>|<np-idf>|N|F|S|@SUBJ>	Gender=Fem|Number=Sing	2	conj	_	_
29	Santos	santo	NOUN	<prop>|<np-idf>|N|M|S|@N<PRED	Gender=Masc|Number=Sing	22	conj	_	SpaceAfter=No
@arademaker arademaker added this to the release 2.10 milestone Nov 4, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant