拍张照片求解数独，计算机如何看懂题目，这个GitHub项目告诉你

晓查 2019-12-30 13:11:55 来源：量子位

晓查发自凹非寺
量子位报道 | 公众号 QbitAI

现在只需拍张照片，就能快速解决数独问题了。

数独对计算机来说不是什么难事，但就是这样一个“平平无奇”的项目却登上了GitHub今日的热榜。

这个登上热榜的项目，名字就叫AI Sudoku，其实就是用AI里的计算机视觉，把照片变成计算机能看懂的网格和数字。

接下来求解数独问题当然不难。重要的是，在这个过程中，我们也学习到了一些常用的计算机图片处理算法。

拍张照片解数独

智能数独求解器（Smart Sudoku Solver）的安装使用并不复杂，只需把项目代码克隆到本地即可。

Windows系统下支持图形化界面，把拍摄图片传输到电脑上就能给出答案。

首次运行需要连接网络下载MNIST数据集，训练模型并创建knn.sav文件，整个过程可能需要5~10分钟，之后就可以离线运行了。

python Run.py

运行上面的代码后，将显示KNN算法的训练结果

之后将很快出现GUI界面，选择上传你拍摄的数独谜题图片。

一直点击下一步，就能得到这道题的答案：

原理

作者在程序中提供了卷积神经网络或k近邻两种算法，供你选择。

运行应用程序之前，只需将Run.py文件中的modeltype变量设置为“CNN”或“KNN”。默认情况下，程序设置为“ KNN”，而且现阶段使用KNN可以获得更高的准确性。

'''Run this file to run the application'''
from MainUI import MainUI
from CNN import CNN
from KNN import KNN
import os
# Change the model type variable value to "CNN" to use the Convolutional Neural Network
# Change the model type variable value to "KNN" to use the K Nearest Neighbours Classifier
modeltype = "KNN"

在我们点击“下一步”的过程中，程序展示了图片处理的步骤。

首先是对图片进行高斯模糊处理，去除噪声和其他细节。

接下来，生成一张清晰的扫描图。由于一张图片中不同区域的光照，采用自适应高斯阈值的方法可以避免这一问题：

反转图片，让文字和网格都变成白色，背景变成黑色。

之后找出边缘的四条线，通过这四条线，将拍到的数独题目变成一张正方形图片。

最后将图片切割成81个小块，识别出每个小块里的数字。

传送门

求解数独问题并不是很难，这个开源项目的作用其实是帮你了解图像识别和处理的各种算法，例如高斯模糊、自适应高斯阈值等等。

项目对这些算法的名称和介绍都做了适当的加粗处理，如果你对这些感兴趣，不妨前去观摩学习一下。

源代码地址：
https://github.com/neeru1207/AI_Sudoku

计算机视觉

晓查

拍张照片求解数独，计算机如何看懂题目，这个GitHub项目告诉你

拍张照片解数独

原理

传送门

相关阅读

谷歌开源缩放模型EfficientNets：ImageNet准确率创纪录，效率提高10倍

助力AI创新众智生态，全球首个十亿像素级CV挑战赛GigaVision圆满落幕

深度学习论文TOP10，2019一季度研究进展大盘点

一个算法同时解决两大CV任务，让目标检测和实例分割互相帮助，地平线实习生论文被AAAI 2020收录

博士答辩人没来，导师还能赞不绝口！上海交大ACM校友实力演绎学以致用

AI分割一切！智源提出通用分割模型SegGPT，「一通百通」的那种

热门文章

业界首创，海螺集团携手华为发布水泥建材人工智能大模型

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

分化浪潮中的投资新局｜第19届中国投资年会·年度峰会在京召开

智能车速度刷新：仅10个月，首个纯端侧大模型上车量产！

一手实测！文心X1/4.5 Turbo推理和多模态双双变强，还把模型成本降了6成？！