当前位置: 首页 > 知识库问答 >
问题:

R中的土耳其语字符编码

欧君之
2023-03-14

有没有办法根据土耳其语改变R中的字符编码系统?

我试图在将R脚本保存为iso-8859-9、windows-1254或latin5时更改编码。最后的编码给了我最好的结果,但是当我重新加载R脚本时,并不是所有的字符都被正确保存。例如:

原件:

hâkimiyetinin
çıkıyor

重新加载(第二个示例中的字符已刷新):

hâkimiyetinin
çýkýyor

有人有主意吗?提前谢谢!

共有2个答案

朱欣荣
2023-03-14

此函数应该告诉您机器中有哪些编码

iconvlist()

这应该告诉你哪个编码是字符串pal

Encoding(pal)

这应该会更改pal的编码

 Encoding(pal) <- "latin1"

这应该将pal翻译成特定的编码

pal <- iconv(pal, to='ASCII//TRANSLIT')

我不知道这个编码是否是你要找的

"x-mac-turkish" or "macturkish"  

希望这有帮助

柳刚豪
2023-03-14

我有一个类似的问题,我尝试了几件事,包括以色列的答案,但唯一帮助我的是改变了地点。

我刚刚在RStudio控制台中键入以下命令。

Sys.setlocale(category = "LC_ALL", locale = "Turkish")

现在每当我键入伊斯坦布尔,我都会在I上得到点。在我将其设置为UTF-8之前,但它仍然会导致问题。

我发现了这个关于希腊字符的问题,但本质上是一样的原则。只要把“希腊语”换成“土耳其语”。

 类似资料:
  • 问题内容: 我想在英语和土耳其语区域设置中将土耳其语字符串翻译成小写。我正在这样做: 输出为: 但是我想要这样的输出: 这在Java中可行吗? 问题答案: 如果使用构造函数,则可以并且必须将语言,国家和变量设置为单独的参数: 因此,您的测试程序使用语言“ tr-TR”和“ en_US”创建语言环境。对于测试程序,可以使用和。 如果您使用的是Java 1.7+,则还可以使用以下命令解析语言标签: 创

  • Byte[]utf8=str1.getBytes(“Windows-1254”);test3=新字符串(“windows-1254”); 输出为I:3/Ortakl:1/2:°:1/2 但上述代码在控制台程序中工作良好,即main method main method打印类似 isortakli的输出 任何建议都必须是可行的

  • 问题内容: 我没有找到有关如何在 Windows 上处理此问题的良好说明,因此我在这里进行了介绍。 土耳其语()和()中有两个字母,它们是python错误处理的。 鉴于区域设置正确,应该如何: 和 我尝试甚至没有帮助。 如何让python正确处理这两个字母? 问题答案: 您应该使用PyICU

  • 问题内容: 在Java 6中, 打印i(),但是在Java 7中,它用双点()打印i 。 我知道这是土耳其语字符,但是如何使用此代码使Java 7输出与v6相同的输出? 还要确保该代码可以处理国际文本,而无需对该函数进行硬编码以仅使用土耳其语区域设置。 问题答案: 关于此iLowerCase问题,有一篇非常详细的博客文章 让我尝试总结以下主要部分: 在Java 7中,此方法的确发生了变化,并且与J

  • 问题内容: 我正在尝试读取UTF-8编码的txt文件,其中包含一些土耳其字符。基本上,我已经编写了一个基于轴的Web服务,该服务读取此文件并将输出作为字符串发送回。不知何故我无法正确读取字符。代码非常简单,如下所述: 这是turkish.txt的内容,仅一行 我得到标准输出 请在这里提出我在做什么错。 问题答案: 您似乎正在正确地将文件数据从UTF-8字符串解码为UTF-16字符串。 执行从UTF

  • 问题内容: 使用python 2.7: 尝试了一些解码(例如,myCity.decode(“ utf-8”)。lower()),但找不到执行该操作的方法。 如何降低这种字母?(“ I”>“ı”,“İ”>“ i”等) 编辑:在土耳其语中,“ I”的小写字母是“ı”。“ i”的大写字母为“İ” 问题答案: 有些人建议使用语言环境。至少在Ubuntu上,也许与此bug有关,设置此语言环境不会产生预期的结