这篇帖子最初是我在努法尔·易卜拉欣(Noufal Ibrahim) 指导班上 学习的一部分, 并写在该 学生的博客 中。 原始文件的链接在 这里 。
我选择测试我的UNIX文本操作技能的书是Mary Shelley的Frankenstein 。 我听说过,但以前没看过。

我从Gutenberg项目网站以纯文本UTF-8格式下载了它。 使用file命令检查文件类型,这给了我,
- 书评:人体故事,作者丹尼尔·利伯曼(Daniel Lieberman)
- 怀特
- 您的行销有效吗? 使用Sean D'Souza的Brain Audit进行审核
- Lo que no podemos saber
- 已中断-评论
Ligin%文件frankenstein.txt
frankenstein.txt:UTF-8 Unicode(带有BOM)文本,带有CRLF行终止符
该文件的开头和结尾处还包含Gutenberg项目许可的一些段落以及其他内容; 删除并使用另一个名为dos2unix的程序,我转换文件。 现在显示为
Ligin%dos2unix frankenstein.txt
dos2unix:将文件frankenstein.txt转换为Unix格式...
Ligin%文件frankenstein.txt
frankenstein.txt:ASCII文本