最新消息:网站旨在学习交流,转载文章会尽力标明出处,如有侵权行为请联系(联系方式见页面底部)本站删除

zero:浅谈SEO的原始数据分析

SEO教程 爱立排 来源:SEO方法 3浏览 0评论

之前有几篇文章,提到了尤对于SEO的数据分析思路,主要是这篇:http://www.SEOqianxian.com/36.seo

但实际情况中,虽然没人乐意,但技术上如何去实现分析却仍往往是最耗时的。

越深入数据分析,越容易发现现有的工具无法满足需求。哪怕Google Analytics等专业工具,在经过针对性的配置后,也只能在其界面上完成日常性的分析需求。更不论各公司内部自己开发的报表系统,绝大多数情况下比GA等差距很远,数据的可靠性尚待验证,想在报表上面进行细致的分析更无法苛求。

报表系统,需要事先定义其可能需要的功能,总是不可能满足临时的奇怪的需求。所以需要一直备着原始数据,在有特殊需求时就要靠它。(一般来说SEO做得越深入,特殊分析需求就越多)

以下是我对于SEO流量的原始数据,使用的技术解决方案概述:

1. 原始数据

1.1. 从Hadoop或服务器日志等原始数据源,仅抽取出核心维度与指标。(主要维度如着陆页URL、来源关键词,主要指标如访问深度)

1.2. 将维度与指标以制表符分隔,每行一条访问记录,将每日数据存到单独文件中。文件名需要包含日期信息。

数据如:域名 URL 关键词 访问深度

www /shouji/ 二手手机 5

1.3. 如果有需要的话,将文件以ftp等方式传到其它服务器上面去。

2. 数据计算(Python实现)

2.1. 通过命令行参数等方式来确定各维度的筛选规则,然后将各维度合并成一整个正则,编译正则后过用它筛选数据。

”’计算满足筛选条件的总访问次数”’

filters = {

‘host’: ‘^www$’,

‘url’: ‘^/shouji/$’,

}

filter = merge_filter(filters)

# filter = ‘^www\t/shouji/\t.*?\t.*?$’

filter = re.compile(filter)

count = 0

for line in open(log_file):

if not filter.search(line):

continue

count += 1

print count

2.2. 如果有额外的指标,将它/它们提取出来并累加。

2.3. 给定起始日期、截止日期,应能输出期间所有日期的流量。

def date_range(start, end, input_format=’%y%m%d’, output_format=’%y%m%d’):

”’如print date_range(140130, 140202)

输出[‘140130’, ‘140131’, ‘140201’, ‘140202’]

”’

start = str(start)

end = str(end)

start = datetime.datetime.strptime(start, input_format)

end = datetime.datetime.strptime(end, input_format)

one_day = datetime.timedelta(days=1)

range_ = []

d = start – one_day

while 1:

d = d + one_day

if d > end:

break

range_.append(datetime.datetime.strftime(d, output_format))

return range_

3. 分析系统

web界面的分析系统虽然我也是做过,无奈前端技术糟糕,实现的比较凑合,此处便不展开提了。只要前面一步完成,那么把输出的数值放到Excel里面画图表也是种解决方案。

作者:ZERO 来源:ZERO博客

转载请注明:爱立排 » zero:浅谈SEO的原始数据分析

猜你喜欢

B2B网站网站SEO优化的问题

您是否已经聘请了搜索营销机构或内部资源的使用,你怎么知道,如果你的B2B搜索引擎优化专家正在做一项伟大的工作?三个简单的问题,所有业务营销人员应询问他们的B2B搜索引擎优化方案是: 我们的SEO计划如何从面向消费者(B2C)的SEO方案有所不同? B...

SEO深度解析:全面挖掘搜索引擎优化的核心秘密

前言 SEO圈好基友@痞子瑞出书啦!期待了快一年了,终于等到消息说最快这个月21号就能与我们见面了!这是一本非常值得我们SEO从业人员人手一本的好书,有很多一线SEO人员的干货分享,像途牛网的夜息、美团网的陈慧大美女等等。好了,废话不多说,大家...

ZERO:明确化SEO的目标

(搬自之前自己的博客) 做SEO的人经常是瞎折腾,因为目标没有明确。 前几篇文章提到过,数据分析的思路中,有一点很重要的是“细分”。对于目标,我们也可以细分出很多: 网站收益 = 流量 * 转化率 SEO流量 = 收录量 * 排名 *...

夜息:对SEO行业的看法

最近看了不少同行的博客,质量高低参差不齐。有的人写的相当专业,有的人写的都是泛泛而谈。但对自己的定位,高手们总是说自己不是高手,菜鸟们总是吹嘘自己有多么多么厉害。 做SEO已经有一年半了,随着技术的深入,发现SEO是一个边缘学科,不是说它不重要,...

如何寻找目标关键词

很多人都明白做seo就是要活的高质量的流量,要获取流量的前天就是我们要寻找更多的关键词,今天说下如何寻找热门搜索关键词。 1、百度搜索风云榜(http://top.baidu.com) 查看目前的最新的热门关键词,把握先机,获取流量。 如下图: 2...

avatar
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址