使用python爬虫框架scrapy对实时新闻进行抓取并存入数据库
写在前面每天的新闻更新很快,如果要全面了解非常困难,更可恶的是一些门户网站还经常取一些乱七八糟的标题,点进去是文不对题。所以萌生了一个想法:自己抓取不同门户网站的新闻更新信息,然后将这些内容进行整合,推送一些当日的热点新闻。想的很简单,真的做起来,发现自己还是太年轻,到写这篇博客为止,我也就是完成了一个基本的抓取框架,连内容都没有获得多少。不过本来就是抱着学习python的想法使用scrapy来抓
...