句子不是词语的堆砌。一个句子是有语法在里面的。
如果完整的解析一个句子的意思,生成另一个中间语言。这个中间语言被叫做元语言。
这个元语言必须是图灵完全而且是自描述的。
然后再依据元语言,构造符合目标语言语法的,语义一致的一系列语句。
接着使用统计模型,从中选择一条最有可能,正确的概率最大的作为最终的翻译结果。
所以,机器翻译就被分解成几个子任务了。
首先,需要构建一种元语言。这个语言应该是图灵完全和自描述的,并且可以在内存中用数据结构表示出来。由于我对英语最熟悉,所以我打算使用英语做为基础来构建元语言。
第二,源语言到元语言的翻译。这个过程就是词法分析。找出每个单词的含义,并结合上下文和所处的环境,唯一确定下对应的元语言。如果含义无法唯一确定,可以构造多条元语言语句。待后续分析后再做决定
第三,元语言的到目标语言的表达。这个时候必须依靠统计学,因为无法唯一确定元语言单词到目标语言单词的映射。需要基于统计学进行筛选。
这是拜读 GCC 而得出的。先感想国家,然后 感谢 GCC ......
此文的引用地址:
UTF-8 http://microcai.gsalex.net/trackback.php?id=23&encode=utf-8
元语言到目标语言的语法表达怎么办?
只是找到词语了.语法句型问题怎么解决