来源判定

优质
小牛编辑
135浏览
2023-12-01

我们知道:

当一个用户与网站开始会话(访问)时,用户的来源信息便被记录下来,贯穿整个会话始终,直至会话结束(或新的会话开启)。 新的会话,就会重新判断来源。

对于使用JS脚本进行网站流量监测分析的系统而言, 网站流量来源的识别办法,不外乎以下3种:

  1. HTTP请求信息中包含的来源referrer
  2. 进入网站访问时,落地页URL的后缀参数(学名为 查询字符串参数,简称查询参数)
  3. Cookie信息(比如第三方广告监测公司,如秒针,在用户点击广告,请求转至秒针服务器时,写入广告信息于Cookie中)

以下细说:

1.依靠 HTTP请求信息中包含的来源Referrer信息。

举例: (如下图) Step 1. 搜索引擎(搜狗)搜索“网易云音乐”

Step 2. 点击链接,来到网易云音乐网站 http://music.163.com

Step 3. 查看用Fiddler 抓包捕获的来源referrer。 (或另一种方式:在网易云音乐网站的页面地址栏中输入 javascript:alert(document.referrer);)

Referer:

http://www.sogou.com/web?query=%E7%BD%91%E6%98%93%E4%BA%91%E9%9F%B3%E4%B9%90&_asf=www.sogou.com&_ast=&w=01019900&p=40040100&ie=utf8&sut=2739&sst0=1440585700211&lkt=0%2C0%2C0

观察到来源referrer中包含www.sogou.com 的域名。 这说明用户来到该网站之前,是从www.sogou.com 这个域名跳转过来的。

通常网站分析系统提供的 来源列表(引荐列表),来源域名,搜索引擎,搜索词等模块,都是依靠来源referrer 识别的来源。

2. 依靠 落地页URL的后缀参数进行流量标记

我们知道,来源referrer不是在任何情况下都可以获取到的。 因此,网站分析工具还利用落地页URL后缀参数,进行流量来源识别。

原理:URL后缀参数,通常被用在广告来源流量的标记。 然后网站分析系统根据标记,解析出相应的来源信息。

当用户点击某个媒体网站的广告位,用户将被转至广告位对应的落地页,而落地页URL后缀中含有广告来源标记参数,参数的值代表了一些含义,如广告活动信息,广告位信息。 通过查表的方式,即可解析出对应的信息。

广告来源流量标记及识别机制示意如下:

SiteMonitor中常见的,用于标记广告来源的URL后缀参数包括:

秒针规范(mz_参数)

维度对应mz_参数释义
广告活动mz_ca广告推广活动
媒体无,通过广告位查询广告活动所投放之媒体
广告位mz_sp具体投放广告位
关键词mz_kwSEM广告的所购买的关键词,不等同于用户搜索词

谷歌规范(utm_参数)

维度对应utm参数释义
谷歌广告系列utm_campaign用以标识不同广告活动名称,如utm_campaign=winterpromotion
谷歌广告来源utm_source用以标识不同网站来源,如utm_source=sina
谷歌广告媒介utm_medium用以标识广告形式,如通栏,utm_medium=leaderboard, 画中画, utm_medium=PIP
谷歌广告内容utm_content用以标识广告内容,如不同创意版本 utm_content=creativeA
谷歌广告关键字utm_term用以标识付费搜索广告的关键字

3. 依靠 Cookie信息

Cookie,是一段小文本(txt)。它是浏览器用于记录访客信息的一种机制。 不同浏览器之间不共用Cookie文本,同时,每个域名有自己独立的Cookie信息,也不共有。

Cookie信息里记录了该网民(实际是浏览器)的一些信息,比如平时上京东等电商网站, 登录框里会默认填写你的用户名。而切换到另一个从未登录过的浏览器,则不会知道账户名称。

对于广告流量识别而言,通常是以下机制,以秒针广告监测为例。

Step1. 用户点击媒体上的广告位

Step2. 浏览器将请求跳转至秒针服务器

Step3. 秒针服务器收到广告点击请求, 并写下广告相关的Cookie信息于浏览器Cookie文本中,隶属于秒针域名下。 秒针服务器将请求转至下一页面对应的服务器(通常是网站落地页)

Step4. 网站分析系统,如SiteMonitor 读取Cookie中的广告信息相关字段, 并解析出用户与网站会话的广告来源信息,如广告活动,广告位等。

重要的话,再说一遍:

当一个用户与网站开始会话(访问)时,用户的来源信息便被记录下来,贯穿整个会话始终,直至会话结束(或新的会话开启)。 新的会话,就会重新判断来源。