Libri:适用于藏书爱好者的CLI刮板RubyGem
Eugenio Mazzone在Unsplash上拍摄的照片 我将分享有关如何创建Libri并将其发布在RubyGems.org上的基于过程的方法,以及在开发阶段遇到的一些技术障碍。 该项目专门针对抓取,该术语用于描述从网站页面检索基于HTML和CSS的数据的行为。 以下是有关Libri工作原理的演示视频: Libri演练 在仔细研究了一些刮除想法(包括刮除Noti.st或80,000 Hours的问题简介或Adafruit的Raspberry Pi项目)之后,我决定回到一个可以简单,有意义且可供许多人使用的主题:书籍。 在搜索要从哪个网站刮取时,我有几种选择:Man Booker网站,Goodreads奖项部分以及Penguin的获奖者列表。 我选择了Barnes&Noble的奖项网页,因为它似乎是最全面的,而且也是最新的。 为了使用Bundler构建gem,我首先在Libri工作目录的终端中运行bundle gem libri 。 这将为我们的gem创建文件结构(称为scaffold目录),因此我们可以立即开始编码。 我确保我的计算机还安装了以下依赖项:…