主页 > 2019开奖记录结果019开奖记录 >
Python与SEO工具开发:百度移动相关搜索词挖掘
发布日期:2019-08-21 03:44   来源:未知   阅读:

  今天的教程是用python开发百度移动端相关搜索词挖掘工具。百度移动端相关搜索词就是下图这个部分的内容,是跟我们搜索词非常相关的一些推荐词语。挖掘出这些词语后可以选取高频词作为我们网站文章优化的关键词。

  挖掘层级3层,5秒钟运行完成得到约2000个关键词的文件(关键词+出现次数):

  1.移动端流量大。目前流量很大部分都集中在了移动端,移动端的市场越来越大,因此做好移动端的优化必定能让网站流量有很大的 提升。

  2.直接反应用户需求。用户移动搜索的特点,由于移动设备比较小,不适宜输入很长的关键词(或者说用户懒),那么相关搜索词和下拉框就 成为了用户搜索的入口,还有一部分原因是历史遗留的问题,那就是很多的用户并不能很清楚的表达自己的搜索需求,只能表述大概的,因此当用户发现自己的输入的关键词没有找到而相关搜索又提供了跟用户意图相关的关键词 时,那么很有可能用户就会去点击了。

  3.挖掘高搜索低竞争词语。一个关键词在相关搜索词中出现的次数越多,那么被点击的机会就越大,那么就潜在的说明该词的用户需求就越大 (搜索量也越大)。那么如果能够找到一大批这样的词出来,同时再结合竞争度分析(后面课程会说),那么就可 以拥有一批高搜索低竞争的词了。最后只需要给这些词配上高质量的内容,那么获取排名相对来说应该就不是啥问 题了(只要网站本身没有被惩罚,或作弊过度),流量就不用说了。

  4.易于做排名。一般情况下,移动端的效果表现比较明显,当PC端有收录之后(PC端收录移动端一般也会收录了,除非移动端被 降权了),如果做好了适配,而且词的竞争不大的时候,一般都可以在移动端看到排名了(不知道是不是所有行业 都这样哈,有待验证)。基本都可以在统计工具中表现出来(建议用CNZZ)。

  因为一个关键词正常情况下能够获取到10个相关搜索词,但是如果只获取一层关键词是拓展不出多少关键词的(比 如母词有1000个,香港最快开奖现场直播开奖记录,那么如果只拓展一次的线个词,而这些词中出现高频词的概率比较下,或者 说高频词表现没那么明显),因此需要将前面拓展出来的词再次进行拓展N次,这样就可以拓展出很多的词出来 啦。

  那么问题就来了,如果之前已经搜索过的关键词,那么就不能再次搜索了,因为得到的结果是一样的,这样做没有 必要,反而会影响统计结果,www.kk0033.com!因此需要对已经搜索过的词进行过滤掉。

  还有程序不应该无限次的拓展下去,因为拓展次数越多,得出来的结果就越不相关,同时需要的内存就越大(我们 的数据都是放在内存中的),关键词数量就越多(比如母词有100个,第一次拓展得到约1000个,第二次拓展得到 10000个,第三次得到10万个,第四次得到100万,第五次就得到1000万了,如果拓展10次那么估计电脑都跑死 掉,而且那么多的数据需要抓取的时间就越长)。因此程序需要可以指定拓展次数,到达拓展次数之后就不再往下 拓展了。

  这里我们使用消息队列和多线程的方式来实现,消息队列能够很好的管理关键词以及对多个线程间的数据共享。

  对于关键词过滤我们使用集合的方式,因为集合里的元素是唯一的,能够很好的节省内存。

  我们还需要使用双元素元组来作为独立的一条消息放到消息队列里面去,一个代表关键词,一个代表当前的拓展是第几次。

  同时我们使用类属性在所有类实例中共享的方式来进行关键词的过滤和临时结果存储,因此我们的需要重写线程 类,制定属于我们自己的关键词拓展类。

  具体代码如下(代码太长,这里只展示部分,完整代码公众号(陈东尧)回复“百度移动端挖词工具”即可获得下载链接及密码,下载后在keywords.txt文档内填入你需要挖掘的母词,运行挖词脚本就可以了):

  声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。

  【介绍】北京SEO顾问,专注SEO推广10年,【项目】☑SEO ☑网站优化 ☑SEM竞价 ☑网站建站 】

  【介绍】北京SEM顾问,专注SEO推广10年,【项目】☑SEO ☑网站优化 ☑SEM竞价 ☑网站建站 】