Paso 4: Usa el Pre procesamiento de datos para el árbol de decisión
A diferencia de los algoritmos HMM y DTW, árbol de decisión no está preparado para lidiar con el problema de la clasificación en series cronológicas. Una serie de tiempo es una secuencia de datos medidos. Cada gesto tiene su propia información de serie de tiempo. Cada serie de tiempo puede tener diferente número de medidas, aun siendo los datos de un mismo gesto. Para utilizar árboles de decisión Weka en este caso, tenemos que extraer algunas características de la serie de tiempo y generar un archivo con. extensión ARFF .
Waleed Kadous investigado en su tesis doctoral y proponemos dos métodos para extraer características de una serie de tiempo. He utilizado un enfoque que, según él, trabajó asombrosamente bien incluso siendo un simple algoritmo. Este enfoque consiste en dividir cada serie de tiempo (independientemente de la longitud) en un número de ventanas. Así, si un ejemplo es largas, que la primera ventana tendrá los valores de la primera a novena medida 45 muestras, la segunda ventana tendrá los valores de la medida de x a XVIII y así sucesivamente. Luego calcular estadísticas para cada una de las ventanas.
Una aplicación R fue desarrollada, basado en el archivo de texto generado por la aplicación del proceso, pre la serie de tiempo de proceso y generar la parte de datos del archivo arff Weka tren. Esta aplicación calcula la media y la desviación estándar de cada ventana de cada eje (x, y y z) como las características.