当前位置: 首页 > 面试题库 >

JavaScript从字符串中提取主机名

姬奇思
2023-03-14
问题内容

我想仅匹配URL的根,而不匹配文本字符串中的整个URL。鉴于:

http://www.youtube.com/watch?v=ClkQA2Lb_iE
http://youtu.be/ClkQA2Lb_iE
http://www.example.com/12xy45
http://example.com/random

我想将最后2个实例解析为www.example.comexample.com域。

我听说正则表达式很慢,这将是我在页面上的第二个正则表达式表达式,因此,如果仍然需要不使用正则表达式,请告诉我。

我正在寻找此解决方案的JS / jQuery版本。


问题答案:

我建议使用npm软件包psl公共后缀列表。“公共后缀列表”是所有有效域后缀和规则的列表,不仅包括国家/地区代码顶级域,还包括将被视为根域的unicode字符(即www。食狮。公司.cn,bckobe.jp等)。

尝试:

npm install --save psl

然后用我的“ extractHostname”实现运行:

let psl = require('psl');
let url = 'http://www.youtube.com/watch?v=ClkQA2Lb_iE';
psl.get(extractHostname(url)); // returns youtube.com

我不能使用npm软件包,因此下面仅测试extractHostname。

function extractHostname(url) {

    var hostname;

    //find & remove protocol (http, ftp, etc.) and get hostname



    if (url.indexOf("//") > -1) {

        hostname = url.split('/')[2];

    }

    else {

        hostname = url.split('/')[0];

    }



    //find & remove port number

    hostname = hostname.split(':')[0];

    //find & remove "?"

    hostname = hostname.split('?')[0];



    return hostname;

}



//test the code

console.log("== Testing extractHostname: ==");

console.log(extractHostname("http://www.blog.classroom.me.uk/index.php"));

console.log(extractHostname("http://www.youtube.com/watch?v=ClkQA2Lb_iE"));

console.log(extractHostname("https://www.youtube.com/watch?v=ClkQA2Lb_iE"));

console.log(extractHostname("www.youtube.com/watch?v=ClkQA2Lb_iE"));

console.log(extractHostname("ftps://ftp.websitename.com/dir/file.txt"));

console.log(extractHostname("websitename.com:1234/dir/file.txt"));

console.log(extractHostname("ftps://websitename.com:1234/dir/file.txt"));

console.log(extractHostname("example.com?param=value"));

console.log(extractHostname("https://facebook.github.io/jest/"));

console.log(extractHostname("//youtube.com/watch?v=ClkQA2Lb_iE"));

console.log(extractHostname("http://localhost:4200/watch?v=ClkQA2Lb_iE"));

无论具有协议或什至端口号,都可以提取域。这是一个非常简化的非正则表达式解决方案,所以我认为这可以做到。



 类似资料:
  • 问题内容: 我正在使用select2中的multiselect元素来输入多个“标签”。当我想从元素中获取值时,我会得到如下信息(对于我在框中输入的tag1和tag2): 如何从数组中的文本中获取结果,如下所示: 而我该如何逆转这一过程呢? 问题答案: 试试这个简单的迭代。

  • 我有以下字符串 从上面,我需要提取下面的文字 第一个数字和文本之间总是有一个空格,所以2129和This is page1之间有一个空格。有时第一个数字被省略,就像2129不见了。文本和下一个数字之间总是有一个空格,所以在This is a Page1和6754001之间有一个空格,有时可能有两个空格。我只需要提取这些线这些线总是从空格开始,所以它可以 它们的后面总是有一个空格,有时是一个空格,有

  • 所谓字符串,指的就是字符的序列或者“串”。我们要在字符串上执行的第一个操作是提取所有字符中的一个。C++使用方括号([和])执行该操作: apstring fruit = "banana"; char letter = fruit[1]; cout << letter << endl; 表达式fruit[1]表明我们要从字符串变量fruit中取得编号为1的字符,并将结果保存在字符变量letter

  • 问题内容: 我想从包含数字和字母的字符串中提取数字: 我想在这里获取号码或任何其他号码。 问题答案:

  • 问题内容: 我正在尝试找到一种可靠的解决方案,以从字符串中提取URL。我有一个站点,用户可以在其中回答问题,并且可以在源框中输入他们的信息源,并允许他们输入网址。我想提取该URL并使其成为超链接。类似于Yahoo Answers的操作方式。 有谁知道可以做到这一点的可靠解决方案? 我发现的所有解决方案都适用于某些URL,但不适用于其他URL。 谢谢 问题答案: 约翰·格鲁伯(John Gruber

  • 我有以下格式的字符串: 让str=“url(#123456)”; 我的字符串中只有数字。它可以在任何地方。我想从上面的字符串中提取数字。 我正在使用es6。