收集数据

当光学字符识别软件第一次处理文件时,它将文件划分成一个矩阵,从而网格中的每一个单元包含一个单一的图像字符,当图像字符被扫描到计算机中,它们将转换成像素,并且具有16个统计属性。这里我们使用W.Frey和D.J.Slate捐赠给UCI机器学习数据库的一个数据集。该数据集包含了26个大写英文字母的2000个案例,使用随机重塑和扭曲的20种不同的黑白字体印刷。

1
2
3
<code class=“language-r” …