mathAI

一个拍照做题程序。输入一张包含数学计算题的图片，输出识别出的数学计算式以及计算结果。请查看系统文档说明来运行程序。注意，这是一个半开源的项目，目前上传的版本只能处理简单的一维加减乘除算术表达式（如果想要识别更加复杂的表达式，可以参考数学公式识别的论文）。可以参考的代码是前面字符识别部分以及整个算法处理框架。

整个程序使用python实现，具体处理流程包括了图像预处理、字符识别、数学公式识别、数学公式语义理解、结果输出。

本程序使用opencv对输入的图像进行预处理，并将字符裁剪出来再归一化成固定大小的矩阵。我在TensorFlow上实现了一个lenet5 的卷积神经网络用来识别数学字符，训练使用CHROME数据集。对于数学公式的识别，主要是将识别出的独立的字符组织成计算机能够理解的数学公式（这里的数学公式就是纯字符的可求解的数学计算题）。大概的方法是使用编译原理的算符优先法和递归下降法进行实现。然后根据属性文法的值传递思想，将数学公式的值计算出来。最后使用python的matlibplot库把计算过程和答案打印出来。

优点：这是一整套拍照做题的算法框架，同时能够处理多种多样的计算题，目前市面上还没有看到实现。OCR技术如此成熟的今天字符识别已经不算有挑战的东西了。缺点：字符空间关系判断只用了人类启发式规则，图像预处理不够鲁棒，数学公式的结构识别算法不够完美（可以考虑使用二维文法来做）。系统还有很大的提升空间。

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
系统代码(code)		系统代码(code)
.gitignore		.gitignore
LICENSE		LICENSE
MathAI配置（Windows）By oruizn.docx		MathAI配置（Windows）By oruizn.docx
README.md		README.md
test.png		test.png
系统展示(system presentation).pptx		系统展示(system presentation).pptx
系统文档(system development document).doc		系统文档(system development document).doc
系统演示(Demo).mp4		系统演示(Demo).mp4

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

mathAI

About

Releases

Packages

Languages

License

Roujack/mathAI

Folders and files

Latest commit

History

Repository files navigation

mathAI

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages