LCC是组织资源的层次结构,但个人负责创建这些资源。 由于我们能够在LCC的每个范围中找到突出的主题标题,因此我们应该能够找到突出的人物。 如果我们能看到谁是整个LCC分类中的主要声音,那该怎么办? 例如,哲学各个分支中的“谁是谁”。 如果我们假设
- 在同一LCC范围内创作了许多资源的人是权威
- 或者,某个在LCC范围内撰写了很多文章的人很重要。
为此,我们可以汇总LCC范围内的记录,并提取在其MARC 100和600字段中找到的名称。 如果在多个资源中都找到一个名称,我们可以推断出它们是该LCC范围“重要”的人。
我对同一本LC书籍,连续出版物,音乐,地图和视觉材料MARC记录进行了此操作。 此类分析对您使用的馆藏非常主观,其结果反映了国会图书馆的馆藏。
除了他们的名字,我还想要其他东西。 因此,我使用通过VIAF / Wikidata / DBpedia找到的名称来丰富其数据。
处理:
- 汇总LCC范围内的所有资源,采用在至少3次出现的100或600字段中找到的前10个名称。
- 通过VIAF运行每个名称以获取其Wikidata ID
- 从Wikidata下载性别(P21),图像(P18)职业(P106)和种族(P17)。
- 从DBpedia下载“主题”
名称协调非常困难,如果我在VIAF中使用了Wikidata ID,那么我就使用它,否则我将不会花费任何时间来协调名称。
总共31,000个名字
在VIAF中找不到4,600个名称
16,300个名称具有Wikidata ID
我想收集尽可能多的信息,因为我有一种预感,结果看起来会非常男性化和白人化。 当然,这反映了材料/收藏,但我认为,如果可以突出显示LCC范围,例如女性在前10名,那就会更有趣。
但是,即使对于大多数记录填充了该名称,也仍然有大约一半的名称不在Wikidata上,因此没有性别数据可供使用。
我想尝试使用来自Wikidata的“族裔群体”或来自DBpedia的“主题”创建更多的方式来切入列表,但是并没有很多数据可以使用。
有了更多的数据,这可能会变得非常有趣,但是现在它是发现个人的好工具。 给名字起名字总是很不错的。

