来源判定
我们知道:
当一个用户与网站开始会话(访问)时,用户的来源信息便被记录下来,贯穿整个会话始终,直至会话结束(或新的会话开启)。 新的会话,就会重新判断来源。
对于使用JS脚本进行网站流量监测分析的系统而言, 网站流量来源的识别办法,不外乎以下3种:
- HTTP请求信息中包含的来源referrer
- 进入网站访问时,落地页URL的后缀参数(学名为 查询字符串参数,简称查询参数)
- Cookie信息(比如第三方广告监测公司,如秒针,在用户点击广告,请求转至秒针服务器时,写入广告信息于Cookie中)
以下细说:
1.依靠 HTTP请求信息中包含的来源Referrer信息。
举例: (如下图) Step 1. 搜索引擎(搜狗)搜索“网易云音乐”
Step 2. 点击链接,来到网易云音乐网站 http://music.163.com
Step 3. 查看用Fiddler 抓包捕获的来源referrer。 (或另一种方式:在网易云音乐网站的页面地址栏中输入 javascript:alert(document.referrer);)
Referer:
观察到来源referrer中包含www.sogou.com 的域名。 这说明用户来到该网站之前,是从www.sogou.com 这个域名跳转过来的。
通常网站分析系统提供的 来源列表(引荐列表),来源域名,搜索引擎,搜索词等模块,都是依靠来源referrer 识别的来源。
2. 依靠 落地页URL的后缀参数进行流量标记
我们知道,来源referrer不是在任何情况下都可以获取到的。 因此,网站分析工具还利用落地页URL后缀参数,进行流量来源识别。
原理:URL后缀参数,通常被用在广告来源流量的标记。 然后网站分析系统根据标记,解析出相应的来源信息。
当用户点击某个媒体网站的广告位,用户将被转至广告位对应的落地页,而落地页URL后缀中含有广告来源标记参数,参数的值代表了一些含义,如广告活动信息,广告位信息。 通过查表的方式,即可解析出对应的信息。
广告来源流量标记及识别机制示意如下:
SiteMonitor中常见的,用于标记广告来源的URL后缀参数包括:
秒针规范(mz_参数)
维度 | 对应mz_参数 | 释义 |
---|---|---|
广告活动 | mz_ca | 广告推广活动 |
媒体 | 无,通过广告位查询 | 广告活动所投放之媒体 |
广告位 | mz_sp | 具体投放广告位 |
关键词 | mz_kw | SEM广告的所购买的关键词,不等同于用户搜索词 |
谷歌规范(utm_参数)
维度 | 对应utm参数 | 释义 |
---|---|---|
谷歌广告系列 | utm_campaign | 用以标识不同广告活动名称,如utm_campaign=winterpromotion |
谷歌广告来源 | utm_source | 用以标识不同网站来源,如utm_source=sina |
谷歌广告媒介 | utm_medium | 用以标识广告形式,如通栏,utm_medium=leaderboard, 画中画, utm_medium=PIP |
谷歌广告内容 | utm_content | 用以标识广告内容,如不同创意版本 utm_content=creativeA |
谷歌广告关键字 | utm_term | 用以标识付费搜索广告的关键字 |
3. 依靠 Cookie信息
Cookie,是一段小文本(txt)。它是浏览器用于记录访客信息的一种机制。 不同浏览器之间不共用Cookie文本,同时,每个域名有自己独立的Cookie信息,也不共有。
Cookie信息里记录了该网民(实际是浏览器)的一些信息,比如平时上京东等电商网站, 登录框里会默认填写你的用户名。而切换到另一个从未登录过的浏览器,则不会知道账户名称。
对于广告流量识别而言,通常是以下机制,以秒针广告监测为例。
Step1. 用户点击媒体上的广告位
Step2. 浏览器将请求跳转至秒针服务器
Step3. 秒针服务器收到广告点击请求, 并写下广告相关的Cookie信息于浏览器Cookie文本中,隶属于秒针域名下。 秒针服务器将请求转至下一页面对应的服务器(通常是网站落地页)
Step4. 网站分析系统,如SiteMonitor 读取Cookie中的广告信息相关字段, 并解析出用户与网站会话的广告来源信息,如广告活动,广告位等。
重要的话,再说一遍:
当一个用户与网站开始会话(访问)时,用户的来源信息便被记录下来,贯穿整个会话始终,直至会话结束(或新的会话开启)。 新的会话,就会重新判断来源。