如何构建准确的翻译引擎?

我几个月前找到了一种公式,可以将任何源语言(计算机字符)翻译成目标语言(计算机字符)。使用Lua(桌面用户)和C++类(用于本地访问),以便可以将其嵌入Web浏览器等等。我想知道我们是否已经在C++或Lua中拥有更好的方法。

我的有时不能正确翻译语法甚至规则,在构建它之前,我认为它将是完成的最佳方式,但现在它需要太长时间了,我担心它可能会变得错误。现在我想检查其他人并比较我的。

我使用了Google翻译或其他不是我的目标的程序,我正在构建一个翻译引擎(像Google或其他引擎) ,可以将其字典放入其中并创建规则。

存在哪些现有的翻译框架或库(OpenCOG或Moses)可实现源语言到目标语言的翻译?例如:从阿拉伯语到中文或从英语到日语?或者 Google/其他正在使用什么?

任何建议都将不胜感激。

提前感谢。

原文链接 https://stackoverflow.com/questions/4509811

点赞
stackoverflow用户114029
stackoverflow用户114029

你有看过Google Translator Toolkit API吗?通过分析它的方面,你可以瞥见它实现了什么以及你可能需要开发自己的翻译框架所需要的东西(顺便说一下,这需要大量的工作)。

创建/上传翻译文档

支持的源语言和目标语言的完整列表

更多资源:

免费/开源机器翻译系统和工具

GNU gettext

TinyTM - 开源翻译记忆

2010-12-22 13:56:25
stackoverflow用户8899
stackoverflow用户8899

我很不想打击你的积极性,但是你正试图单枪匹马地解决 机器翻译 的问题。像 Systran 这样的机器翻译系统是由科学家和工程师团队开发了数十年,但仍然远远不完美。

2010-12-22 13:59:51
stackoverflow用户166749
stackoverflow用户166749

Moses

Moses 是一个相当出色的 C++ 开源翻译库。cdec 是目前最先进的翻译库(但是需要源语言和目标语言的无上下文语法)。这两个工具都需要大量的训练数据,即平行语料库。

当你翻译完这段话后,请跑到你的大学并要求授予你博士学位。

2010-12-22 14:11:02