如何教汉学数字方法
数字方法革新了许多研究领域,不仅提供了更有效的沿传统方式进行研究和教学的方法,而且还提出了全新的方向和研究问题,这些问题在数字化之前是不切实际甚至是不可能的。年龄。 这场数字革命为包括中国研究在内的许多人文学科提供了新的令人兴奋的机会。 通过使用计算机软件,数字技术使大规模研究材料成为可能,由于组装和处理原始材料需要时间和人工,因此深入研究曾经是完全不切实际的。 更令人兴奋的是,它们为应用复杂的统计技术(由于科学和工业的应用而在其他领域已经广泛开发)提供了机会,以对重要的人文问题提供新的见解和理解。 墨子,X子和庄子之间的文字关系(图片:C-Text项目) 在此背景下,2016年,作为费尔班克斯中心“数字中国计划”的一部分,并在东亚语言与文化部的支持下,首次向哈佛社区开设了名为“ 中国研究数字方法 ”的研究生课程。 。 本课程旨在向主要从事汉语研究的学生介绍实用的编程技能和数字人文技术,以便将来将其应用于自己的研究中。 尽管没有编程或数字技术方面的技术背景,但在整个学期中,学生获得了用于分析和可视化文本资料的现代软件技术的动手经验。 首先是对使用Python进行编程的实用介绍,它是其余部分的基础,它为学生提供了创建软件“胶水”的实践经验,这些胶水通常是将不同技术和实际数据源绑定在一起所必需的,使用数字方法进行有意义的研究。 虽然不是编程课程,因此没有尝试全面涵盖整个编程语言,但是编程元素对于使学生能够独立地使用数字技术开展有用的研究这一总体目标至关重要,这既是课程的一部分,也是其未来工作的一部分。 通过允许学生学习如何将大量数据从当前可用的任何形式(例如网页,学术数据库以及其他各种主要源数据集合)转换为可以应用有用的分析的形式,该课程的编程部分也使每个学生都可以直接使用与他或她自己的研究相关的材料,而不是简单地使用教师选择的示例。 [数字人文科学]提供了应用复杂的统计技术的机会,以使人们对重要的人文问题提出新的见解和理解。 在介绍基本程序设计的同时,本课程还涵盖了范围广泛的数字方法,重点是适用于文本材料研究的方法。 这些始于简单但高度灵活的技术,例如正则表达式,一种用于指定和识别文本数据中的模式的标准机制,以及一种特别适合汉语的材料,因为后者具有很高的每个字符的语义内容。 然后,本课程转向更专业和更先进的技术,从从网站和在线存储库自动收集大量数据的实用方法开始,这是学生获取研究项目所需数据的方式之一。…