当前位置: 首页 > 知识库问答 >
问题:

我如何从他/她在python中的职业中找到人的性别

朱通
2023-03-14

我是一个宠物项目,我正在调查亚洲的女性大多被描述为做劳工或家务,而男性大多做更体面的工作,如医生、外科医生、教授等。

我正在编写一个python脚本,其中给定一个句子将估计在给定文本中找到的职业的性别。

病人向医生咨询治疗,他对自己的东西非常了解,过去治好了很多病人。我们可以看到这里的医生显然是男性。这就是我想做的。从文本中找到从事这项职业的人的性别。

我做了什么:我想计算男性单词/代词,如他/她/他/她,然后计算它们的总数,看看谁有更多的频率来估计性别。

问题是:我使用的方法不是问题的好估计器。

例如:

他要求医生像她过去那样对待他。在这个例子中,男性单词的数量(他、他、他)多于女性单词(她),而医生显然是女性。

我在找什么?我正在从kaggle社区寻找更聪明的想法,以帮助我在这个问题上取得进展。任何大大小小的潜在客户都会被告知。

共有1个答案

司马德水
2023-03-14

可以使用Stanford OpenIE。

您可以从OpenIE给出的输出中计算主题的数量及其与职业的关系(名词)。

输出与职业相关的主题的性别。

下面是一个句子依赖的例子:

 类似资料:
  • 如果用户有一条邮件消息,其中包含指向内置于flask中的my webapp的链接。用户点击链接并访问我的网站。 现在的问题是:我如何配置我的flask应用程序来检测该用户是否通过电子邮件访问了该网站?

  • 我想这样打印: 谢谢你们的回答伙计们 HTML:

  • 问题内容: 我想找出Python中某个方法的优点(它接收的参数数量)。现在我正在这样做: 我希望能够实现这一目标: 更新 :现在上面的函数无法使用内置类型,对此的任何帮助也将不胜感激: 问题答案: Python标准库中的模块是您的朋友- 请参阅在线文档! 返回四个选项的元组,:是“主元数”,但参数数量可以从任何东西到无穷大,如果你有和/或没有,而一些参数可以省略(默认和)如果不是。你怎么把它变成一

  • 程序描述:人们使用jsliders输入用户分数,然后在游戏结束时点击按钮检查分数,它会告诉你谁得了第一、第二、第三等分数。 我不确定的是如何让程序告诉我得分最高的球员姓名。我把它分类了,它告诉你实际的分数,只是没有名字。 我基本上是在寻找: 代码:

  • 问题内容: 这是一个较集中的问题,是由此处的早期发布引发的。我需要通过证明他/她可以访问它来验证用户的电子邮件地址。我已在下面复制了一个通用的电子邮件身份验证,您希望在加入开发人员论坛或用户组时会看到该身份验证。在注册过程中,您需要提供电子邮件地址,然后会收到一封电子邮件,要求您单击某些内容来验证您的电子邮件地址。 我需要对用户单击电子邮件中的链接时发生的任何情况进行编码。所以我的问题是-我该怎么

  • 我的项目的 python 模块有问题。这是我的项目树: 依赖关系如下: GUI.py 使用 Correcteur.py Loader.py 使用 GUI.py 我正在为这个项目使用两台计算机,一台使用PyCharm,一台使用VSCode。问题是我使用PyCharm运行Loader.py配置,它向PYTHONPATH添加了内容根和源根。但是当我回到另一台计算机,想检查一切是否正常时,我遇到了这个错误