林天宇用Pytho
3学习编写网络爬虫(之一:入门实践)
作者:林天宇
一、写在前面1、本文适应的读者范围
会一点点Pytho
的基本语法;已经安装好了Pytho
3和PyCharm;网络爬虫新手
2、本文所使用的开发环境
MacproiOSPytho
3PyCharm
3、本文不纠结以下内容
为什么选择Pytho
3而不是Pytho
2?答:没什么特别原因,个人喜好。如何安装Pyho
3?请查阅其他文档。PyCharm是什么?为什么不用其他工具。一个常用的Pytho
开发工具,个人喜欢,可参阅其他文档。如果你不喜欢,你也可以用其他工具编码和调试。
118
f二、快速开始
东北人有句话说:能动手,尽量不瞎叨叨。少些废话,快速开干。
1、新建项目和文件
启动PyCharm,“CreateNewProject”。因为估计不需要到特别的框架,所以类型就默认地选择了“PurePytho
”,名字就起成了“WebSpider”(我瞎命名的,就是觉得Spider比较帅气而已),然后“Create”如下图:
新建一个Pytho
文件,命名为Spider001,毕竟也是我的第一只小爬虫嘛。
218
fOK,到目前为止,已经新建一个名字叫做Spider001的Pytho
空白文件了。
可以在项目等资源管理器中看到WebSpider项目下面,有一个
318
fSider001py的文件。我们接下来就对这个Sider001py文件进行编辑和测试。
2、第一爬
先写代码,感受一下效果,找找成就感,然后再详细分析和思考。代码如下:importurllibrequest
url