
您好,希望您过得愉快。 学习新事物永远不会太晚,因此我最近一直在学习Web爬网和API的概念,因此我正在尝试这些东西,并使用OMDB API制作了一个小型的爬网脚本:bowtie:,它使用户可以正确获取电影信息从控制台。 因此,让我们更轻松地进入代码。

首先,我们导入执行抓取任务所需的模块。 Requests是一个Python HTTP库,根据Apache2许可发布。 该模块的目标是使HTTP请求更简单,更人性化。 JSON是用于存储和交换数据的语法。 Python有一个名为json的内置程序包,可用于处理JSON数据。
生成从这个链接自己的API密钥- – – http://www.omdbapi.com/apikey.aspx?__EVENTTARGET=freeAcct&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=%2FwEPDwUKLTIwNDY4MTIzNQ9kFgYCAQ9kFgICBw8WAh4HVmlzaWJsZWhkAgIPFgIfAGhkAgMPFgIfAGhkGAEFHl9fQ29udHJvbHNSZXF1aXJlUG9zdEJhY2tLZXlfXxYDBQtwYXRyZW9uQWNjdAUIZnJlZUFjY3QFCGZyZWVBY2N0x0euvR%2FzVv1jLU3mGetH4R3kWtYKWACCaYcfoP1IY8g%3D&__VIEWSTATEGENERATOR=5E550F58&__EVENTVALIDATION=%2FwEdAAU5GG7XylwYou%2BzznFv7FbZmSzhXfnlWWVdWIamVouVTzfZJuQDpLVS6HZFWq5fYpioiDjxFjSdCQfbG0SWduXFd8BcWGH1ot0k0SO7CfuulN6vYN8IikxxqwtGWTciOwQ4e4xie4N992dlfbpyqd1D&at=freeAcct&Email=

现在您已经生成了您的个人API密钥(警告:永远不要与任何人共享您的API密钥),让我们运行while循环,以便我们可以与脚本进行交互,直到脱离该脚本为止。 因此,api_key = input()将获取您的API密钥并存储在api_key变量中。 现在开始棘手的部分,了解API如何使用url并从主数据库获取数据请求。 使用它,创建一个base_url并将其存储在变量中。 从用户那里获取电影名称输入,并将其存储在title变量中。 现在,使用大多数API提供程序提供的Playground创建final_url ,以了解数据请求操作的发生方式。
当final_url看起来合适时,使用request.get ()函数将GET请求发送到url并检索url详细信息。 现在,使用json模块检索json格式的树元素,该元素用于以类似字典的结构存储电影的各种细节。

运行try-except块,以防万一发生404错误或输入错误的API或无法获取数据等情况。现在使用包含类字典结构的data变量,一次检索一个详细信息并打印出值。 在除外块中,显示错误消息并终止代码。

现在,通过询问用户是否要显示更多电影信息或停止该过程并退出循环来结束代码。 因此,您将拥有自己的抓取脚本,该脚本可让您直接从编辑器或终端显示任何电影数据。 那不是很酷,我喜欢这样做,并且会进行更多尝试。 这是代码的Github链接,请使用它并加以改进— https://github.com/SubhamPaul21/Python_Projects/blob/master/Movie_Info_Scrapper_OMBD_API.py
谢谢:yum:并且下面的视频显示了该应用程序的一个快速小型演示。
Subham Paul在LinkedIn上的文章:“最近开始使用Python来学习API和Web爬虫,而今天…
2019年1月22日:Subham Paul在LinkedIn www.linkedin.com上发布