【网站数据统计解决方案】快速了解pv、uv、spm、utm_source、埋点

已被阅读 1845 次 | 文章分类:日常随笔 | 2022-03-14 22:59

在访问阿里网站或者一些博客网站的时候,发现地址后面跟了?spm=1010.2135.3001.4477这种参数,以及在访问国外网站的时候会跟?utm_source=google&utm_medium=cpc&utm_campaign=599956724^122652817832等参数;他们到底是用来干嘛的,我们简单一探究竟

1 举个例子

我们随便打开一篇csdn博客:

                                            
https://blog.csdn.net/weixin_45842494/article/details/123058639?spm=1001.2100.3001.7377&utm_medium=distribute.pc_feed_blog_category.none-task-blog-classify_tag-1.nonecase&depth_1-utm_source=distribute.pc_feed_blog_category.none-task-blog-classify_tag-1.nonecase
                                            
                                        

再看一下国外网站地址:

                                            
https://www.wix.com/html5en/hiker-create?utm_source=google&utm_medium=cpc&utm_campaign=599956724%5E122652817832&experiment_id=website%5Ep%5E520855792038%5E&gclid=Cj0KCQiAybaRBhDtARIsAIEG3kk1EEGiIAlV2iFUea428tgDEuNL9k1DXiVvI0BIqWVcFP7XRvtuU7caAnPtEALw_wcB
                                            
                                        

要解释上面两个参数,咱从下面几个逐步解释下

2 什么叫PV和UV

PV(Page View)访问量, 即页面浏览量或点击量,衡量网站用户访问的网页数量;在一定统计周期内用户每打开或刷新一个页面就记录1次,多次打开或刷新同一页面则浏览量累计。

UV(Unique Visitor)独立访客,统计1天内访问某站点的用户数(以cookie为依据);访问网站的一台电脑客户端为一个访客。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过来访电脑的cookies实现的。如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的。如果用户不保存cookies访问、清除了cookies或者更换设备访问,计数会加1。

3 如何统计某个页面的PV

一种思路:服务器主动记录;直接统计服务端nginx请求日志,只要统计该页面的请求数就知道pv了

另一种思路:客户端主动发送;直接在客户端埋点,当访问到某个页面时,同时向日志服务器发送一条埋点日志,日志服务器处理后拿到pv。

注: 埋点就是记录用户在使用应用的流程中,服务器收集一些信息,用来跟踪应用使用状况;后续用来优化产品或提供运营的数据支撑;包括访问数(Visits),访客数(Visitor),停留时长(Time On Site),页面浏览数(Page Views)和跳出率(Bounce Rate)。这样的信息收集可以大致分为两种:页面统计(track this virtual page view),统计操作行为(track this button by an event);

埋点方式:其一可以在产品中注入代码统计,并实现对应的后台查询接口配合;其二可以借助第三方工具,比如友盟等等

4  如何追踪某个页面的来源

一种思路:统计nginx日志下该页面请求的referer头信息

注: referer头信息在浏览器向服务器发送请求的时候,请求头信息里面都包含这个Referer;他表示来源;比如从一个网站点击跳转到另一个网站,那么另一个网站的referer就是前一个网站的地址

举例如下:在小白GIS网站中找到一篇文章里面的外链地址,然后点击

/net/upload/image/20220314/ab3c2bf94d854aeeb0a61236f08191ab.png

看一下跳转后页面的Referer的值;f12 打开network,找到页面请求连接,点击查看请求头信息如下

/net/upload/image/20220314/fcf98a7612a141a8b14f0ff406663b13.png

提到这里顺便说下Referer的一个作用: 防止盗链.

盗链:就是服务提供商不提供自己的内容,通过技术手段直接在自己的服务网站里面提供其他服务商的资源内容,骗取最终用户的浏览和点击率;导致真正的服务商收益减少的行为。

所以别的服务提供商的收费资源,我们一定做一个有素质的服务提供商,不盗取资源;免费资源也要注明出处。

言归正传,如果请求头里面有了Referer,那么服务提供商就可以根据这个字段值,判断是不是从本站发出的请求,这样可以加一层防护。

5 如何知道来源页面具体是通过那个链接跳过来呢?

上面的referer字段 只能记录跳过来的服务器域名,也就是ip;但不能知道具体是哪个页面的那个链接跳过来的

所以终于到 spm的解释了;spm是为了能记录更加精细的埋点;方式就是为某一个页面内部的所有链接地址进行编码,这样的话,点击某一个链接,我们就可以获取他的编码值了;正常情况如下:

                                            
SPM格式为 spm=spmA.spmB.spmC.spmD.spmE
                                            
                                        
                                            
spmA 唯一标识一个站点

spmB 唯一标识某站点的一个页面

spmC 唯一标识某页面的一个区块

spmD 唯一标识某区块的一个具体位置

spmE 随机生成的字串,跟时间有关系,在循环页面计算时可以区分点击的时序
                                            
                                        

所以上面这个地址?spm=1010.2135.3001.4477即表示1010站点的2135页面3991区块的数据;

SPM (super position model 超级位置模型) 跟Google Analytics在URL里面拼上utm_source, utm_medium等参数大同小异。现如今很多网站都有这个参数;咱可以联想到精准投放这个概念;因为用户量巨大,更加精细的掌握每个用户的趋向爱好变得更加重要了

UTM 是 “Urchin Tracking Module”的简写,大意就是跟踪模块

简单记录下utm几个参数

                                            
广告系列来源(utm_source)
必填属性。使用 utm_source 来标识搜索引擎、简报名称或其他来源。
示例:utm_source=google

广告系列媒介(utm_medium)
必填属性。使用 utm_medium 来标识媒介,比如电子邮件或每次点击费用。
示例:utm_medium=cpc

广告系列字词(utm_term)
用于付费搜索。使用utm_term来注明此广告的关键字。
示例:utm_term=running+shoes

广告系列内容 (utm_content)
用于A/B测试和按内容进行定位的广告。使用utm_content区分指向同一网址的广告或链接。
示例:utm_content=logolink或utm_content=textlink

广告系列名称(utm_campaign)
用于关键字分析。使用utm_campaign来标识特定的产品促销活动或战略性广告系列。
示例:utm_campaign=spring_sale
                                            
                                        

QQ:3410192267 | 技术支持 微信:popstarqqsmall

Copyright ©2017 xiaobaigis.com . 版权所有 鲁ICP备17027716号