陇药汉英平行语料库构建研究(2)
2 构建语料库依据语料库是指在随机采样基础上收集到有代表性的真实语言材料集合,是语言运用的样本。基于语料库的翻译研究也称语料库翻译学,是以语言理论和翻译理论为指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,对翻译现象历时或共时描写和解释,探索翻译本质的一种翻译学研究方法。语料库具有强大的检索功能,可以利用语言频率的统计概率计算出高频词和低频词。因此,如果把某个中医药术语输入ECPCGM,可通过ECPCGM及其检索工具对词频进行搜索,选择词频最高的翻译版本作为翻译参考。从双语文本“共现”(coexistent)中,可发现最易被人接受的词与词的搭配形式,对语法研究和词汇在语言中的使用转向做了语域再现式的翻译实例和量化数据,从而提高翻译的可信度。中医语言具有辞简、文约、言炼等语言美学特点,如“滋阴补阳”这类具有特定文化信息的词,ECPCGM可提供具体语境,突破单句层面上词对词的翻译,使释义更准确。
3 建立语料库的基本思路
3.1 总体设计
研究目的决定语料库的采样,建立ECPCGM的目的是客观描述、考察中国学者对陇药英语研究所表现出的总体特征及陇药翻译过程中呈现的共性特征。语言本身是动态发展的,笔者通过初建一个50万字容的ECPCGM,其他研究者可随研究的进展,添加适合的语料对该库进行更新扩容。ECPCGM的建设过程包括总体设计、框架设计、语料采集、语料导入、双语对齐、语料校对和语料优化管理等步骤,见图1。
ECPCGM包含2个一级子库 ......
您现在查看是摘要页,全文长 5952 字符。