在《 Le Ton Beau de Marot》中 ,作家Douglas Hofstadter描述了亚历山大·普希金史诗诗《 尤金·奥涅金》中的几种不同译本。 “ Pushkin十四行诗”或“ Onegin节”具有其自己的度量标准规则,这些规则使该形式在俄语文字中具有标志性的地位。 霍夫施塔特通常使用不同的翻译来解释不同的翻译方法。
俄语具有复杂的案例系统,这是普希金十四行诗规则的重要组成部分。 弗拉基米尔·纳博科夫(Vladimir Nabokov)认为,在英文译本中,音符和韵律无法得到充分保存,至少在没有严重扭曲原始文本的情况下如此。 当他解释这首诗时,他专注于单词和句法,并且他的翻译极其文字,而且脚注很多。 其他翻译也尝试了移调韵律的方法,其中包括霍夫施塔特(Hofstadter)撰写的一本无法阅读俄语的书。 他并排使用多种翻译,他觉得自己有能力得到一种“纯”的诗,下面是俄文。
诸如Google Translate之类的机器翻译工具非常适合解释,但对于这类更复杂的语法翻译工作而言,用处不大。 因此,我对这种多重翻译项目以及如何设计一些便利的项目很感兴趣:是否有可能制作出使用多次翻译的工具,以使用户能够查看翻译文本的形状而无需诉诸于其他语言。机器翻译?
我开始研究伊利亚特(Iliad)的公共领域翻译,部分原因是它的经典地位,但主要是受大量翻译以及其中许多自由被原始古希腊韵律和计量表所吸引的。
因此,我的目标是允许用户玩文字,或者以浏览为目的操纵较大的数据集。 与其给予直接或集中的搜索访问权限,不如说是鼓励用户形成有关数据的总体思路。 由于用户与数据的交互是不确定的,因此我们无法立即了解如何组织数据。 实际上,一开始诗歌的组织是最佳选择。
但是,由于我们正在考虑将翻译彼此“分层”以进行浏览和比较,因此我们可以单独收集行,并允许用户在第一行,第二行的不同翻译版本之间循环, 等等。
因此,现在我们有了此下拉菜单,允许用户为每行选择特定的翻译。 但这还不是该分层的最大可能范围:我们希望用户能够操纵单个的单词和短语,因此每个单词或短语都应该能够在每次翻译中循环。 因此,为了解决这个问题,我仍然以每行为基础,将每个单词存储在该想法的翻译数组中,并用数组索引替换了必要单词的行。 在更大的范围内,创建一个Translator对象可能会更有效,该对象充当必要单词的字典。
ln1a = [“有益”,“深沉而致命”,“破坏性”]
ln1b = [“愤怒”,“复仇”]
ln1c = [“ Achilles'”,“ Peleus的儿子,阿喀琉斯”,“ Achilles,Peleus的儿子”]
ln1d = [“声音”,“唱歌”]
ln1e = [“ o女神”,“ o缪斯”]
chapmanLineOne =“#{ln1c [0]}#{ln1a [0]}#{ln1b [0]}#{ln1d [0]}#{ln1e [0]}”
smithStanleyLineOne =“的#{ln1c [1]}#{ln1d [1]}#{ln1e [1]} ## ln1b [1]}#{ln1a [1]}”
BuckyLineOne =“#{ln1c [2]}的#{ln1a [2]}#{ln1b [0]}的## ln1d [1]}#{ln1e [0]}”
因此,现在您可以比较不同翻译之间的线条和文字-从某种意义上说,您自己可以创建Iliad的新译文,而无需回到古希腊。
这种方法显然存在一些问题。
正如卡罗琳·亚历山大(Caroline Alexander)在撰写她的《伊利亚特》(Iliad)译本时所指出的那样,尽管人们对文本的字面意思有合理的分歧,但人们在某些地方已经以某种方式翻译了特定的短语已经足够习惯。 该工具不允许用户说出希腊语中的交叉引用单词以及它们在其他文本中的出现,这将是帮助解决该问题的一种方法。
另一方面,自动化并不容易! 通过添加更多的翻译,它可以获得“解析度”,但是从数据输入的角度来看,这是一项复杂的任务。 部分原因是我对单词和短语的分类实际上是一项编辑决定:谁说“阿基里斯,佩勒斯的儿子”与“阿喀琉斯”相同,或者说希腊语的真正超文字翻译,只是“贝勒斯的儿子”,我们应该理解为谁是阿喀琉斯。
最重要的是,为了使语法可靠地起作用,我只留下了不是每个翻译都出现的单词。 介词最多,在古希腊语中多数是通过使用大小写出现的,因此自动会保留一些介词。 它更像一个玩具,而不是一个强大的计算语言学工具,但我相信它对于教授翻译方法学可能很有用。
将来,我希望尝试使用矢量化文本来实现用户翻译,或者看看我是否可以在Python中使用Stanford词性标记器或Natural Language Toolkit来获得更多功能。 Tufts的Perseus项目还提供了一个非常有用的Iliad注释版本,其中包含许多翻译版本的注释。
将更复杂的工具添加到组合中可以帮助摆脱翻译行提供的语法框架,并可以帮助扩展该工具,以便与其被硬编码为这十行,还可以解析翻译集合并提供与读者。