原始数据是来自于企业网站IP统计系统,下面表格是数据演示。数据库中表的名字是"ips"。
id | ips(ip地址) | 来源页 | 当前页 | 访问者编号 | times(访问时间) |
---|---|---|---|---|---|
89 | 113.226.39.4 | /mysoft_msg4.php | http://kilinos.com/mysoft.php | 0 | 2023-07-20 15:50:55 |
120 | 66.249.68.4 | /mysearch4.php | http://www.kilinos.com/index.php?t=d | 0 | 2023-07-23 04:37:03 |
…… | …… | …… | …… |
原始数据字段解释
id是数据表的主键,
Ip地址来自于访问者终端
来源页是记录访问信息的前一页,例如示例:从mysoft_msg4.php页面点击链接到mysoft.php页面。
当前页是IP记录程序执行的页面。
访问者编号是用来区分会员与一般访客。一般访客编号是0,会员编号是1开始到十位数的数字。
访问时间是记录这条信息的时间,精确到了小时分秒。
页面每一次点击,记录每一条都是一个页面访问。因此统计页面访问信息就是看总数据一共多少条。
select count(id) from ips;
返回结果是7254条记录,说明我们拿到数据是7254个访问记录。
但这里面有多少人那?人数和访问次数不一样,一个人可能多次访问。
select count(distinct(ips)) from ips
返回结果是85条信息,说明只有85个IP地址访问了但却点了7254次。网站还是很让人喜欢的以至于反复访问。
首先要知道数据中访问都在那个时间段,我们先按天统计,看都是哪几天的访问数据。
select date(times) from ips group by date(times);
date(times) | |
---|
| 2023-07-20 | | 2023-07-21 | | 2023-07-22 | | 2023-07-23 | | 2023-07-24 | | 2023-07-25 | | 2023-07-26 | | 2023-07-27 | |
从返回结果可知案例数据只有7月20日到7月27日这八天的数据。接下来做个折线图吧,对比一下这八天的页面访问次数与访问人数。
以2023-07-27日为例页面访问次数与访问者人数分别是:
select count(distinct(ips)) from ips where date(times) ="2023-07-27";
//当天页面访问次数
select count(ips) from ips where date(times) ="2023-07-27";
//当天访问者人数
下面的图标是最后统计的结果,按照从20到27日分别是:
22日访问人数是8人,但只有9次点击,也许都是走错了点后转身就走,没有什么有效浏览量。
26日访问人数是40人访问次数达到了6636次,应该有什么活动让这40人反复点击浏览网站的信息。
很多人都想知道这么多访问量中,谁点的次数最多?下面就找出最多的那个IP地址。
select ips,count(ips) as zs from ips group by ips order by zs desc;
//将ips字段分组,并统计每组的数量。
ips | zs(访问次数) |
---|---|
135.181.212.177 | 898 |
65.108.0.71 | 368 |
192.99.13.69 | 300 |
65.108.46.72 | 300 |
…… | …… |
最后访问次数最多的是135.181.212.177这个IP。在网上又查了一下信息来自国外。
归属地:
芬兰 新地区 赫尔辛基
运营商:
Hetzner Online GmbH
IPV4:
135.181.212.177
以上信息来自www.ip138.com