怎样将uci数据集中字符串转换成数字
1、UCI数据可以使用Matlab的dlmread或textread读取,不过,需要先将不是数字的类别用数字,比如1/2/3等替换,否则读入不了数值,当字符了。

2、每个数据文件(.data)包含以“属性-值”对形式描述的很多个体样本的记录。对应的.info文件包含的大量的文档资料。(有些文件generatedatabases;他们不包含*.data文件。)作为数据集和领域知识的补充,在utilities目录里包含了一些在使用这一数据集时的有用资料。

3、下面以UCI中IRIS为例介绍一下数据集:ucidata\iris中有三个文件:Indexiris.datairis.namesindex为文件夹目录,列出了本文件夹里的所有文件,如iris中index的内容如下:Index of iris 。

4、属性直接以逗号隔开,中间没有空格(5.1,3.5,1.4,0.2,),最后一列为本行属性对应的值,即决策属性Iris-setosa ,iris.names介绍了irir数据的一些相关信息。


5、如数据标题、数据来源、以前使用情况、最近信息、实例数目、实例的属性等,如下所示部分:Attribute Information,sepal length in cm 。

6、每个数据文件(*.data)包含以“属性-值”对形式描述的很多个体样本的记录。对应的*.info文件包含的大量的文档资料。(有些文件_generate_ databases;他们不包含*.data文件。)作为数据集和领域知识的补充,在utilities目录里包含了一些在使用这一数据集时的有用资料。
