落寒考虑的是采用数学思维,另辟蹊径,将每个词语设定为向量,并且分类为名词,动词等等。
将此与设定为向量的好处就是将长难句进行肢解,翻译选件处理时会将每个词语准确翻译。
接下来就是根据语言的语境,将所有词语的意思,按照语言环境进行筛选,剔除明显不符合语境的释义。
接着再让不同的词语,根据翻译对象所需要的语言的语法和含义进行组合,并对缺少的与语法要素进行补充。
落寒反复检查了几遍,软件整体的逻辑是正确,接下来就要正儿八经的开工了。
逻辑正确只是第一步,怎么让用向量的词语按照指定语言的语法进行重组为新的语句,就是个难题,这也是市场上翻译软件最大的难点。
就拿英语和汉语来举例,在语法上主谓宾的顺序就不同,翻译机器没有办法进行自我重组,所以经常闹出,饭吃了我的笑话来。
市面上的翻译软件都是采用语言学家总结的语法库,少部分软件有自我学习功能,也不能做到了解和统计当今所有的语言习惯并对其作出分析。
这项工作最大的难点就编译量非常大,毕竟要统计一种语言的所有语法习惯,这基本是不可能的。
不过没有关系,这些难不倒落寒,盘古语言最擅长如此。
落寒开始在屏幕上敲敲打打起来,他首先需要编译出一个可以自我学习的,搜集一切可用资料的数据库。
然后通过数据库搜集各地的语音和语气将其归类分析,最后形成文字数据库来给翻译提供基本理论支持。
落寒预留了几个接口,方便今后导入大量的中英文资料。
然后......
笔记本开始变慢,发烫。
最后它卡...卡死了。
落寒这大半天的功夫转眼就化为乌有。
我去...劳资...
落寒刚想骂人,结果看了看周围室友都在睡觉