当前位置: 首页 > 面试题库 >

Python阿拉伯语NLP

龙弘济
2023-03-14
问题内容

我正在评估NLTK处理阿拉伯文本的能力,这项研究旨在分析和提取情感。

问题如下:

  1. NTLK是否可以处理并允许分析阿拉伯文本?
  2. python是否能够操纵\标记阿拉伯文本?
  3. 我可以使用Python解析和存储阿拉伯文本吗?

如果python和NTLK不是完成这项工作的工具,那么您会推荐哪些工具(如果存在)?

谢谢。

编辑

根据研究:

  1. NTLK仅能阻止阿拉伯文本:链接
  2. Python支持UTF-8 Unicode,因此能够处理阿拉伯文本:链接
  3. 阿拉伯文本的解析和合法化可以使用:SNLPG(斯坦福自然语言处理小组)统计解析器:链接

问题答案:

一个简单的谷歌搜索导致这些链接:

阿拉伯自然语言处理

在古兰经阿拉伯语语料库中使用Python

HOWTO:使用Python,Unicode和阿拉伯语

这些有用吗?



 类似资料:
  • 我正在尝试使用最新的雅虎天气apihttps://weather-ydn-yql.media.yahoo.com/forecastrss它工作得很好,但当我设置语言(lang=ar AE)时,它返回带问号的json响应,而不是阿拉伯字符。例如“城市”:“城市”对于英语来说,这是可以的。 我没看到留档里有关于utf设置的东西 当我打开雅虎的天气页面https://www.yahoo.com/news

  • Adobe 亚洲语言书写器 借助 Adobe 亚洲语言书写器,您可以使用中东和南亚语言创建内容。您可以键入或混合键入阿拉伯语、希伯来语、英语和其他语言。 您可以在“段落”面板菜单(窗口 > 段落 > 面板菜单)中的可用书写器之间进行选择。例如,您可以使用中东和南亚语言单行书写器或中东和南亚语言逐行书写器。 有关 Illustrator 中支持的其他亚洲语言的更多信息,请参阅适用于亚洲语言文字的书写

  • 启用中东语言功能 若要在 Photoshop 界面中显示中东文字选项,请执行以下操作: 选取“编辑”>“首选项”>“文字”(Windows) 或“Photoshop”>“首选项”>“文字”(Mac OS)。 在“选取文本引擎选项”部分中,选取“中东”。 单击“确定”,并重新启动 Photoshop。 选取“文字”>“语言选项”>“中东语言功能”。 文本方向 要创建阿拉伯语和希伯来语内容,您可以将默

  • 问题内容: 我有一个要排序的阿拉伯语单词列表。我曾尝试使用不同的语言环境(例如英语或法语,但希望不高)使用标准的Collat​​or,甚至创建了自己的RuleBasedCollat​​or,但无济于事。显然,默认排序依赖于unicode值顺序,该顺序在许多情况下都有效,但显然不适用于此顺序。 按照javadocs的说明,RuleBasedCollat​​or需要一个字符串,该字符串以您希望它们排序

  • 我有一个关于阿拉伯语编码和将阿拉伯语存储到mysql的问题。 我应用了以下所有步骤: set-MySQL字符集:UTF-8 Unicode(utf8) 设置MySQL连接排序规则:utf8\u常规\u ci 集合数据库和表排序规则设置为:utf8\U general\U ci或utf8\U unicode\U ci mysql_查询(“设置名称‘utf8’”); mysql_查询('SET CHA

  • 我有一个移动应用程序,它的rest Api是使用eclipse用Jakarta EE编写的,数据库是oracle,当然,我们将war文件上传到apache服务器上,用于实时应用程序,我们为此使用的apache服务器版本是tomcat apache V8.5。当我们在使用本地服务器时通过应用程序插入数据时,阿拉伯语文本可以正常工作,并在Oracle中正确显示。但是当我们上传war文件并通过tomca