当前位置: 首页 > 知识库问答 >
问题:

我如何从他/她在python中的职业中找到人的性别

朱通
2023-03-14

我是一个宠物项目,我正在调查亚洲的女性大多被描述为做劳工或家务,而男性大多做更体面的工作,如医生、外科医生、教授等。

我正在编写一个python脚本,其中给定一个句子将估计在给定文本中找到的职业的性别。

病人向医生咨询治疗,他对自己的东西非常了解,过去治好了很多病人。我们可以看到这里的医生显然是男性。这就是我想做的。从文本中找到从事这项职业的人的性别。

我做了什么:我想计算男性单词/代词,如他/她/他/她,然后计算它们的总数,看看谁有更多的频率来估计性别。

问题是:我使用的方法不是问题的好估计器。

例如:

他要求医生像她过去那样对待他。在这个例子中,男性单词的数量(他、他、他)多于女性单词(她),而医生显然是女性。

我在找什么?我正在从kaggle社区寻找更聪明的想法,以帮助我在这个问题上取得进展。任何大大小小的潜在客户都会被告知。

共有1个答案

司马德水
2023-03-14

可以使用Stanford OpenIE。

您可以从OpenIE给出的输出中计算主题的数量及其与职业的关系(名词)。

输出与职业相关的主题的性别。

下面是一个句子依赖的例子:

 类似资料:
  • 如果用户有一条邮件消息,其中包含指向内置于flask中的my webapp的链接。用户点击链接并访问我的网站。 现在的问题是:我如何配置我的flask应用程序来检测该用户是否通过电子邮件访问了该网站?

  • 我想这样打印: 谢谢你们的回答伙计们 HTML:

  • 问题内容: 我想找出Python中某个方法的优点(它接收的参数数量)。现在我正在这样做: 我希望能够实现这一目标: 更新 :现在上面的函数无法使用内置类型,对此的任何帮助也将不胜感激: 问题答案: Python标准库中的模块是您的朋友- 请参阅在线文档! 返回四个选项的元组,:是“主元数”,但参数数量可以从任何东西到无穷大,如果你有和/或没有,而一些参数可以省略(默认和)如果不是。你怎么把它变成一

  • 程序描述:人们使用jsliders输入用户分数,然后在游戏结束时点击按钮检查分数,它会告诉你谁得了第一、第二、第三等分数。 我不确定的是如何让程序告诉我得分最高的球员姓名。我把它分类了,它告诉你实际的分数,只是没有名字。 我基本上是在寻找: 代码:

  • 我的项目的 python 模块有问题。这是我的项目树: 依赖关系如下: GUI.py 使用 Correcteur.py Loader.py 使用 GUI.py 我正在为这个项目使用两台计算机,一台使用PyCharm,一台使用VSCode。问题是我使用PyCharm运行Loader.py配置,它向PYTHONPATH添加了内容根和源根。但是当我回到另一台计算机,想检查一切是否正常时,我遇到了这个错误

  • 问题内容: 我试过函数,但它给出了声明的值。该函数给出一个错误。 码: 输出在这里,我需要数组中的全部项目(即)。 问题答案: Go中的数组是固定大小的:在Go中创建数组后,以后就无法更改其大小。这是这样一种程度,即一个阵列的长度是阵列类型的一部分(这意味着类型和2层不同的类型)。就是说,某种数组类型的值的长度始终是相同的,并且由其类型决定。例如,类型为array的值的长度始终为,(可以使用内置函