易搜关键词排名优化 让客户更容易搜索到您!

立即致电: 体验易搜关键词排名优化为您带来的高效服务。

当前位置:易搜网络技术公司 >> 关键词排名 >> 关键词排名优化 >> 浏览文章

竞品数据偷窥

文章标签:数据,偷窥

2011年的时候,我在 Qing 做产品设计师。

刚入行时最长做的义务就是竞品分析,当时国内的轻博客产品有许多,Qing、点点、Lofter、人人小站等,如何分析竞品的数据变为一个紧张的题目。

这类内容开放的产品,一样平常搜索引擎的爬取率很高。当时突发奇想是不是我通过搜索 Google 高级搜索来获取竞品的数据。

首先,我们来了解下 Google 的高级搜索功能。

竞品数据偷窥

传送门:http://www.google2164.hk/advanced_search

表单功能很壮大,可以通过关键词进行搜索,也可以选择字词出现的位置。比如,我们如今想看简书有多少文章。根据文章的链接,http://www.jianshu2164/p/cba3e43cd5b0

我们可设置参数,包含关键字: "p" ,域名为:"www.jianshu2164"。

allinurl:  "p" site:www.jianshu2164

竞品数据偷窥

可以看出简书也许 1,100,000 条发布的文章,那么这个数据是不是正确的呢?除了 Google 这个渠道,还有另外获得数据的体例么!

通常我们还可以通过 URL 来看数据,以知乎的链接为例,许多网站的链接中均会包含数字,有些数字是未经过处理的自增 ID 。也就是说你想知道该产品的数据,可以通过创建一个用户、一个文章、一个题目的体例,来让对象+1,然后查看链接中的数字,就可以大致判断出。

https://www.zhihu2164/question/24325481

但对于简书这种在 URL 中做过放爬处理的产品,就很难看出,这个时候我们可以通过 API 调用来查看,比如喜好文章、关注用户等。

http://www.jianshu2164/p/cba3e43cd5b0

正常情况下,产品很难把所有的路径都堵上。比如简书虽然在 URL 和前端 API 上都做了 hash 处理。但是当用户新建文章时,URL中依然有对应的文集ID、文章ID。

http://www.jianshu2164/writer#/notebooks/3126817/notes/2938972

由此通过重新创建用户创建文章,可推断出文集数为 3126817(通过文集数可以大致推断用户数),文章数为 2938972。

这与我们通过 Google 获取的数据相比,差了3倍左右。可能的缘故原由:一是搜索引擎没有全量抓取,二是有大量的草稿被创建而没有发布。

尽管通过这些体例获得的数据不是完全正确,但是也可以通过数据曲线的转变,了解产品发展的趋势。

注:相干网站建设技巧阅读请移步到建站教程频道。

>> 查看更多相似文章