说下背景,该算法由好朋友天伟提出,我来代码实现,虽不算复杂,但是最后得出值也能算有参考性,基本上和预测值能对上,不论哪个行业,百度自己的产品(百度贴吧、百度知道、百度文库等)都能占到至少百分之30%的量,换句话说,蛋糕就那么大,每个行业百度的产品都能截流30%以上。
">
1、找行业根词算法,写脚本去凤巢系统抓相关词和对应的搜索量。
2、MySQL步骤:
1.安装MySQL,使用navicat for mysq新建数据库rank;
2.数据库新建两个表t_keyword、t_rank_copy;
3.表t_keyword含有三列:id、keyword、searchnum,id自增;
4.表t_rank_copy含有四列:id、keyword、url、pcrank,id自增;
3、关键词入库算法:在目录中新建keyword.xlsx,行业热搜词放入第一列,每个热搜词对应的搜索量放入第二列,cmd执行Import,将excel数据导入表t_keyword;
4、抓取排名算法:cmd执行Crawler
5、分析数据算法:cmd执行Calculate.py,最后结果保存在result.xlsx,去往github