当前位置: 首页 > 面试题库 >

默认的内容类型/字符集是什么?

姬温文
2023-03-14
问题内容

根据此答案:urllib2读取为Unicode

我必须获取内容类型才能更改为unicode。但是,某些网站没有“字符集”。

例如,此页面的[‘content-type’]是“ text / html”。我无法将其转换为unicode。

encoding=urlResponse.headers['content-type'].split('charset=')[-1]
htmlSource = unicode(htmlSource, encoding)
TypeError: 'int' object is not callable

是否有默认的“编码”(当然是英文)…,以便在找不到任何内容的情况下可以使用它?


问题答案:

是否有默认的“编码”(当然是英文)…,以便在找不到任何内容的情况下可以使用它?

不,没有。你必须猜。

平凡的方法:尝试将解码为UTF-8。如果有效,则可能是UTF-8。如果不是,请为您正在浏览的页面类型选择最可能的编码。对于英文页面cp1252,即Windows西欧编码。(这就像ISO-8859-1;实际上cp1252iso-8859-1即使您指定了该字符集,大多数浏览器也会使用而不是,因此值得复制该行为。)

如果您需要猜测其他语言,它将变得非常冗长。现有模块可以帮助您在这些情况下进行猜测。参见例如。沙丁鱼。



 类似资料:
  • Logback 1.1.3留档没有指出如果用户不设置默认字符集,它将是什么,但源代码说: 默认情况下,此属性的值为null,对应于系统的默认字符集。 然而,我使用的是PatternLayoutCoder(带有滚动文件附加器),它似乎是以UTF-8格式输出文件(我的Windows 7 Professional系统的默认字符集可能不是UTF-8)。 UTF-8输出实际上是我想要的,但我想确保我不是偶然

  • 问题内容: 我一直在弄乱JSON一段时间,只是将其作为文本推出,它并没有伤害任何人(据我所知),但是我想开始做正确的事情。 我见过 这么 多所谓的“标准”为JSON内容类型: 但是哪一个是正确的,还是最好的?我发现在它们之间存在安全性和浏览器支持问题。 我知道有一个类似的问题, [如果RESTAPI返回JSON,则为哪种MIME类型?,但我想要一个更有针对性的答案。 问题答案: 对于JSON文本:

  • 问题内容: 我还找不到任何能说明默认显示等于CSS显示属性的内容。我问,因为每当我尝试向标签添加填充或边距时,它都不会添加,因此我必须为其添加display属性。 我不知道这是否是特定于浏览器的,但是它的默认显示是否会说(我显然知道不是)。 问题答案: 默认情况下始终为。水平边距和所有侧面的填充都应该起作用,而不必更改其属性。 即使在HTML5中也是如此。如果将样式应用于包含流程元素或CSS中以表

  • 问题内容: 如果我写这样的话 哪种类型带有“ 18”?是 int 还是 byte ?还是还没有类型? 它不能是int,因为这样是正确的: 这是不正确的: 编辑:我想我在工作分配转换的规范中找到了正确的部分: 常量的编译时缩小意味着代码如下: 字节theAnswer = 42; 被允许。如果不进行缩小,则整数文字42具有int类型的事实意味着将需要强制转换为字节: 字节theAnswer =(字节)

  • 在步骤5.7->8.0.23中从5.6->5.7->8.0.23升级mysql时,我收到一个警告: 在'mysql-schema的默认字符集:utf8'中,'mysql'是什么意思?是Innodb吗?

  • 本文向大家介绍浅谈python中的变量默认是什么类型,包括了浅谈python中的变量默认是什么类型的使用技巧和注意事项,需要的朋友参考一下 1、type(变量名),输出的结果就是变量的类型; 例如 >>> type(6) <type 'int'> 2、在Python里面变量在声明时,不需要指定变量的类型,变量的类型是动态指定的;>>> x=5 >>> type(x) <type 'int'> >>