covid
Buscar en
Ingeniería, Investigación y Tecnología
Toda la web
Inicio Ingeniería, Investigación y Tecnología Un algoritmo para el Strip Packing Problem obtenido mediante la extracción de h...
Información de la revista
Vol. 17. Núm. 2.
Páginas 179-190 (abril - junio 2016)
Compartir
Compartir
Descargar PDF
Más opciones de artículo
Visitas
3666
Vol. 17. Núm. 2.
Páginas 179-190 (abril - junio 2016)
Open Access
Un algoritmo para el Strip Packing Problem obtenido mediante la extracción de habilidades de expertos usando minería de datos
An Algorithm for the Strip Packing Problem Obtained by Extracting Expert Skills Using Data Mining
Visitas
3666
Gatica Gustavoa,
Autor para correspondencia
ggatica@unab.cl

Autor para correspondencia.
, Reyes Pablob, Contreras-Bolton Carlosc, Linfati Rodrigod, Escobar John Willmere
a Universidad Andrés Bello, Chile, Universidad de Santiago de Chile, Facultad de Ingeniería
b Universidad Andrés Bello, Chile, Facultad de Ingeniería
c Universidad de Santiago de Chile, Departamento de Ingeniería Informática
d Universidad del Bío-Bío, Chile, Departamento de Ingeniería Industrial, Chile
e Universidad del Valle, Colombia, Departamento de Contabilidad y Finanzas
Este artículo ha recibido

Under a Creative Commons license
Información del artículo
Resumen
Texto completo
Bibliografía
Descargar PDF
Estadísticas
Figuras (7)
Mostrar másMostrar menos
Tablas (6)
Tabla 1. Estructura log de datos
Tabla 2. Relevancia de atributos
Tabla 3. Jugadas por Nivel
Tabla 4. Comparación de algoritmos
Tabla 5. Pruebas con otras instancias
Algoritmo 1. Heurística BLDA generada
Mostrar másMostrar menos
Resumen

La capacidad del ser humano para resolver problemas NP-Duro de forma manual no ha recibido la debida atención por la comunidad científica. Este artículo considera el problema del Strip Packing, que consiste en posicionar ortogonalmente un conjunto de piezas rectangulares dentro de un contenedor de ancho fijo y altura infinita, sin solaparlas, minimizando la altura alcanzada de las piezas dentro del contenedor. Se desarrolló un juego computacional que permite obtener soluciones manuales, propuestas por jugadores expertos, para distintas instancias del problema. La contribución del artículo consiste en presentar un algoritmo que se extrajo mediante patrones y minería de datos aplicada a soluciones encontradas por los jugadores expertos. El algoritmo generado se basa en elementos de árboles y heurísticas presentes en la literatura. Adicionalmente se presentan resultados computacionales, donde se logra encontrar la mejor solución conocida en 94.3% de un conjunto de instancias de la literatura y 79% para instancias generadas aleatoriamente.

Descriptores:
Strip Packing Problem
minería de algoritmos y patrones
habilidades de expertos
Abstract

The ability of the humans to manually solve NP-hard problems had not received much attention of the scientific community. This paper considers the Strip Packing Problem (SPP), in which a set of rectangular pieces has to be placed orthogonally in a container with a given width and an infinite length. The pieces are not allowed to overlap (i.e. be stacked one over the other). The aim of the SPP is to minimize the overall length of the strip. In this paper, we have developed a computational game to allow manual solutions by expert gamers for different instances of the problem. The main contribution of the paper is the presentation of an algorithm based on patterns and data mining retrieved from the results achieved by expert gamers. The proposed algorithm is based on decision-trees and heuristics proposed in literature. Finally, the proposed approach is able to find the best-known solutions for the 94.3% of a set of instances proposed in the literature, and 79% for instances generated randomly.

Keywords:
Strip Packing Problem
data mining of algorithms and patterns
skills of experts
Texto completo
Introducción

El problema del Strip Packing (SPP) se define a partir de una región rectangular de ancho W definido y alto infinito, en el cual se deben ubicar todas las piezas de un conjunto predefinido R = {r1, r2, ..., rn} que tienen dimensiones de ancho wi y alto hi, sin sobreponerlas, con el fin de minimizar la altura H utilizada en el contenedor (Gatica et al., 2015). En este artículo se analiza el SPP de dos dimensiones (2-SPP), con rotación de piezas en 90° y sin corte guillotina (Lodi et al., 2002). El SPP se deriva de la familia de problemas de corte y empaque, y pertenece a la clase NP-Duro; por ello la búsqueda de algoritmos eficientes es un área de constante evolución. Este tipo de problema es de gran interés en industrias tales como papeleras y madereras, debido a que está directamente asociado a la optimización del uso de materias primas, para así, reducir los costos de producción (Alvarez et al., 2008).

La solución de problemas NP-Duro mediante la utilización de la capacidad del cerebro humano recibe una baja atención, principalmente se analiza desde el punto de vista de la complejidad computacional. En la línea de la capacidad del cerebro humano, solo Acuña y Parada (2010) generan un algoritmo, que se obtuvo mediante la capacidad de 28 jugadores, quienes participa- ron en un torneo con un juego computacional del vendedor viajero. En tanto, desde el punto de la complejidad computacional, se han presentado muchos juegos del tipo rompecabezas combinatorios tan o más difíciles que cualquier problema del mundo real. Más aún, una disciplina como la teoría de los juegos combinatorios se encarga de analizar conocidos juegos que envuelven complejas decisiones, y de clasificar su dificultad (Fraenkel, 1997).

El fanatismo es un factor a considerar por el nivel de especialización que logran los jugadores, como muestran los estudios de Russell y Norvig (1995), así como De Jong y Schultz (1988). El esfuerzo usual de dedicación se transforma en una adquisición de conocimiento progresivo que desencadena nuevas y mejores técnicas para juegos NP-Completo (Sunnucks, 1970) tales como: buscaminas (Stewart, 2005), tetris (Demaine et al., 2002), criptoaritmética (Epstein, 1987). Sólo resta imaginar todas las horas, días y años que invierten miles de jugadores alrededor del mundo en estos juegos obteniendo un conocimiento adquirido en el cerebro, lo que los convierte en expertos. Si los juegos son reflejo de bien conocidos problemas NP-Completo: ¿qué tan buenas son las heurísticas utilizadas por los seres humanos para resolver tales juegos?

En este artículo se analiza la capacidad humana para descubrir una heurística mediante la solución de un juego computacional. Se analizan las jugadas obtenidas y se identifican los patrones típicos de juegos para descubrir ¿Cuál es la heurística que utilizan los distintos jugadores? Para dicha labor se emplean técnicas de aprendizaje automático. Los resultados obtenidos proporcionan un algoritmo de solución basado en árboles de decisión, los cuales presentan elementos de algoritmos y heurísticas existentes en la literatura. Se puede concluir que la heurística generada es capaz de resolver dos conjuntos de instancias de evaluación comparativa de la literatura, igualando los mejores resultados conocidos en 94.3% de los casos y en 79% para instancias generadas aleatoriamente.

En la siguiente sección se presentan los materiales y métodos, donde se explica cómo se diseña un experimento que permita recuperar patrones típicos de jugadores. Después se realiza un análisis de los resultados y finalmente algunas reflexiones.

Materiales y métodos

El desarrollo de este trabajo se puede dividir en dos etapas, la primera es desarrollar el juego computacional, y la segunda la aplicación de técnicas de descubrimiento de patrones a través de minera de datos.

Desarrollo del juego

La primera etapa consiste en desarrollar el software, denominado Strip Packing Problem Game (SPPG). El cual consiste en un rompecabezas que representa directamente una instancia del SPP y cumple con la condición de que todas las piezas del juego sean visibles desde el primer instante para poder analizar su complejidad y variabilidad, ya sea por la dimensión de las piezas o el número de ellas (Demaine, 2001). Como en un rompecabezas tradicional, las personas pueden jugar independientemente de los demás, no hay interacción entre ellos y las acciones de uno no afectan al otro. SPPG puede utilizar cualquier instancia del SPP; sin embargo se considerararon cinco instancias distintas en cinco niveles de dificultad, es decir, un total de 25 instancias. No se permite realizar retroceso de jugadas y se cuenta con un tiempo limitado de jugada. El software se desarrolló en C# usando .NET 3.5. La figura 1 muestra el diseño del juego, en donde en la parte izquierda se puede visualizar la grilla en donde se deben posicionar las piezas ubicadas en la parte derecha de la misma figura, se observa que todas son rectangulares y pueden rotarse por el jugador.

Figura 1.

Strip Packing Problem Game

Fuente: Elaboración propia.

(0.21MB).

SPPG se implementa siguiendo la metodología RAD (Rapid Application Development), bajo el paradigma orientado a objetos (Jaaksi, 1998), que integra dos componentes: un sitio web-módulo de interacción con la aplicación SPPG y una base de datos diseñada para capturar la trazabilidad de una partida de juego usando MySql 4.1, el cual posteriormente se analiza mediante árboles de decisión para la extracción de conocimiento. La figura 2 muestra la estructura usada para la implementación del juego.

Figura 2.

Implementación Strip Packing Problem Game

Fuente: Elaboración propia.

(0.16MB).
Aplicación del minado de datos

En esta segunda etapa se aplica el proceso de minado de datos a las soluciones de los juegos para una parte del algoritmo descrito por Klemettien (1999). Esta aplicación típicamente sigue los pasos descritos en la figura 3, la cual se conforma por cuatro etapas: la limpieza y selección de datos, la correspondiente transformación de datos, el reconocimiento de patrones, la interpretación, evaluación y finalmente la generación del algoritmo para resolver el SPPG.

Figura 3.

Descubrimiento de conocimiento en bases de datos

Fuente: Witten, 2000.

(0.22MB).

Para realizar un análisis de patrones es necesario contar con una buena representación del registro de las jugadas, el cual almacena las partidas realizadas por los jugadores. En la tabla 1 se observa el registro que contiene nueve columnas: idJugadas es el identificador correlativo del movimiento ejecutado, FK_idPartidas corresponde a la identificación de la partida realizada, Rotación, si la pieza está o no rotada; Posicion_X, la posición en el eje x donde la pieza se insertó respecto a la esquina inferior izquierda y Posicion_Y, la posición en el eje y dónde se insertó la pieza respecto a la esquina inferior izquierda, FK_idNivel corresponde al nivel de dificultad en el que se realiza la jugada, Numero_pieza, es el número de la pieza utilizada en la jugada; Largo, el largo de la pieza usada en la jugada; Ancho, el ancho de la pieza empleada en la jugada.

Tabla 1.

Estructura log de datos

IdJugadas  FK_idPartidas  Rotación  Posición_X  Posición_Y  FK_idNivel  Número_Pieza  Largo  Ancho 
399  138  40  16 
400  138  16  24  24 
401  138  39  20 
402  138  24  16 
403  138  31  16  10 
404  138  24  35  20 
405  139  24  22 
406  139  24  30 
407  139  31  22 

Fuente: Elaboración propia

A continuación se detalla lo que se realizó en cada una de las etapas del minado de datos:

Selección y limpieza de datos: como primera etapa dentro de minado de datos se seleccionan los datos correspondientes a las jugadas completas. Se cuenta con un total de 4.121 jugadas distribuidas entre las 25 instancias del SPPG, utilizadas en esta investigación. Dado que los datos almacenados corresponden a jugadas completas, no fue necesario realizar limpieza de datos, ya que la totalidad fueron jugadas completas.

Transformación de datos: se realiza una codificación de las jugadas para su correcto análisis, cada jugada se anexa a la jugada anterior y a la siguiente. Para obtener las partidas completas, se realiza una codificación piramidal para analizar todas las jugadas posibles, almacenando cada una de las jugadas intermedias desde el inicio del juego.

De esta manera, se pueden realizar comparaciones de jugadas, así como dos jugadores: jugador A, jugador B, pudieron realizar las mismas inserciones en los primeros 5 pasos, pero luego tomaron distintas decisiones.

Para mantener una uniformidad de los factores a utilizar independiente de la configuración del nivel, los valores de las variables se calculan en relación con el nivel, para ello se utilizan deciles, es decir, cada tramo representa 10% del total del nivel, y para las piezas insertadas, se utilizan cuartiles, es decir, cada tramo representa 25% del total del nivel. Los atributos de tamaño se calculan de acuerdo con el espacio disponible para inserción; los atributos relativos a la pieza actualmente insertada se calcula con base en el total de piezas restantes; y los atributos relativos a la jugada actual dentro del problema se calculan en relación con el número total de jugadas posibles (número de piezas).

Descubrimiento y análisis de atributos

Para descubrir los atributos es necesario un amplio conocimiento del campo en estudio. Es necesario identificar la mayor cantidad de atributos que potencialmente describan las clases o atributos clase. Una clase es la inducción que realiza un sistema de aprendizaje automático sobre un conjunto de ejemplos (Witten y Frank, 2000). Además, y aunque parezca una tarea trivial, es necesario describir qué se desea caracterizar, es decir, qué significa la clase en cada ejemplo. En este trabajo los atributos caracterizan la decisión que toman los jugadores cuando seleccionan la pieza a insertar dentro del contenedor. Los atributos se describen a continuación:

Atributo relacionado con la decisión: este atributo indica cuál heurística de inserción realiza el jugador. Las heurísticas consideradas son: inserción decreciente (comienza la inserción con la pieza de mayor tamaño y termina con la pieza de menor tamaño), inserción creciente (se inicia con la inserción de la pieza de menor tamaño y finaliza con la pieza de mayor tamaño), inserción inferior izquierda (comienza la inserción desde el lado inferior izquierdo), inserción mejor encaje (se realizan inserciones que solo completen líneas horizontales en la tira), inserción encaje inicial (realiza inserciones de la primera pieza que ocupe el espacio restante horizontal de la tira), inserción por mayor suma de áreas (realizar inserciones de manera decreciente en combinatoria de piezas, es decir, piezas que se encajan perfectamente se toman como una sola pieza, por ejemplo 2 piezas de 2x1, se toman como una sola pieza de 2x2). La figura 4 muestra los atributos relacionados con la decisión.

Figura 4.

Descubrimiento de conocimiento en bases de datos

Fuente: Elaboración propia.

(0.17MB).
Atributos relativos a las piezas no insertadas

El primer conjunto de atributos que aquí se describe están relacionados con algunas características de las piezas aún no insertadas. En el trabajo de Campitelli y Gobet (2005) se muestran algunos indicios de las diferencias entre jugadores expertos y novatos cuando juegan ajedrez, en el sentido de la percepción que tienen del tablero de juego. Por ejemplo, los jugadores expertos logran captar características globales del tablero que les permite recordar cierta jugada que realizaron con anterioridad. Esta percepción global se refleja en la agrupación de piezas que realizan los jugadores, en el caso del SPPG.

En los métodos de agrupación de puntos, generalmente se utiliza el concepto de tamaño promedio, máximo y mínimo. Los tres atributos siguientes implementan estos índices.

  • 1.

    Tamaño Promedio (SPP_Tamaño_Promedio): Calcula el área promedio entre todas las piezas que no se han insertado. Mientras mayor este atributo, mayor es el área que existe en las piezas no insertadas. Donde d (i,j) es la diferencia de área entre la pieza i y la pieza j. Si W es el conjunto de piezas no insertadas, la ecuación (1) calcula este atributo

  • 2.

    Tamaño Mínimo (SPP_Tamaño_Mínimo): Calcula el área mínimo que existe entre dos piezas no insertadas. Este atributo refleja cuál es la diferencia mínima de área que tiene la configuración actual de piezas insertadas, definida por la ecuación (2)

  • 3.

    Tamaño Máximo (SPP_Tamaño_Máximo): Calcula el área máximo que existe entre piezas no insertadas. Refleja el máximo área que existe entre las piezas no insertadas. Mientras más cercano este atributo a SPP_Tamaño_Mínimo, más homogéneas son las piezas no insertadas, definida por la ecuación (3)

Atributos relativos a la geometría y costos de inserción

La lista de piezas insertadas juegan un papel fundamental en el algoritmo, pues determinan la próxima pieza a insertar. Es por ello que resulta interesante reflejar en un atributo cuál es el costo asociado a la selección de una u otra pieza. Los tres atributos que a continuación se detallan reflejan el costo mínimo, máximo y promedio de inserción de las piezas del problema. En figura 5 se aprecian los distintos enfoques de estos atributos. Suponiendo que las piezas pueden insertarse en A y B, existen tres tipos de costos de acuerdo con cuál se seleccione, se describen a continuación:

  • 1.

    Costo mínimo de insertar pieza (SSP_pieza_Insertable_Barata): Calcula el costo mínimo de inserción dentro de las piezas de la lista de piezas marcadas. En este caso, PM corresponde a las piezas marcadas puestas en el contenedor, Ca corresponde a la pieza actual del problema y Cb representa la siguiente pieza. Este atributo, junto con el costo máximo y promedio de inserción, permite reflejar la dispersión que tienen las piezas a insertar en el sentido de su distancia. Mientras mayor es la diferencia entre el costo mínimo y máximo, es más complicado para el jugador seleccionar la próxima pieza a insertar, esto se define con la ecuación (4)

  • 2.

    Costo máximo de insertar pieza (SSP_pieza_Insertable_Cara): Calcula el costo máximo de inserción dentro de las piezas de la lista de piezas marcadas. Se asumen las mismas condiciones del atributo SSP_pieza_Insertable_Barata, se define en la ecuación (5).

  • 3.

    Costo promedio de insertar pieza marcada (SSP_pieza_Insertable_Proemedio): Calcula el costo promedio de insertar las piezas a la tira. Se asumen las mismas condiciones del atributo SSP_pieza_Insertable_Barata, se define en la ecuación (6)

  • 4.

    Costo actual de insertar pieza marcada (SSP_pieza_Insertable_Actual): Calcula el costo actual de insertar las piezas a la tira, se obtiene un valor positivo si la pieza a insertar es mayor al espacio horizontal y un valor negativo si la pieza a insertar es menor al espacio horizontal. Se asumen las mismas condiciones del atributo SSP_piezaInsertable_Barata, que se define en la ecuación (7)

Figura 5.

Ejemplo de posicionamiento durante la inserción

Fuente: Elaboración propia.

(0.08MB).
Atributos relativos al avance de las jugadas

Se entiende por jugada la operación de insertar una pieza en la tira. En relación con las jugadas existen atributos interesantes que permiten reflejar si estas corres- ponden al principio, al medio o al final de una partida. Generalmente, los logs reflejan que el jugador comienza con una estrategia al principio de una partida, intentando realizar buenas jugadas (realizar encajes de piezas grandes a lo largo completo de la tira), mientras tanto, en las jugadas finales se intenta solo “terminar el nivel”. Los dos atributos anteriores son:

  • 1.

    Número de piezas totales no insertadas (SPP_numero_Piezas_Totales): Calcula la cantidad de piezas que no se han insertado aún. Si este atributo es grande, indica que está en el comienzo de la partida y que los movimientos son los primeros. Además, puede reflejar cuál es la proporción de piezas PP versus las que están insertadas.

  • 2.

    Número de piezas insertables (SPP_numero_Piezas_Insertables): Calcula el número de piezas que se pueden insertar. Este valor se establece después de comenzar el nivel y no se modifica durante las inserciones.

Aplicación de minería de datos

En esta transformación se considera el algoritmo BLDA (Bottom Left Decreasing Area) como modelo para el comportamiento que tiene el ser humano.

La idea básica es reproducir cada una de las 4.121 jugadas, movimiento a movimiento, generando un ejemplo para el entrenamiento del árbol de decisión. En cada movimiento se calculan todos los atributos y se compara la decisión del jugador con la decisión que toman las heurísticas de inserción. Si la decisión coincide, entonces se crea un nuevo ejemplo para la clase. Si no coincide con ninguna heurística, entonces se genera un ejemplo asumiendo que la heurística utilizada por el jugador es la inserción aleatoria. Luego se aplica un formato, que consiste en ingresar los datos a un archivo de texto plano, ordenados por partidas y serie de jugadas (figura 3), para su ingreso como parámetros en la herramienta de aprendizaje automático KNIME, cuya salida es el árbol completo de las decisiones realizadas por los jugadores, con un conteo de las repeticiones que se ejecutaron, ya sea por el mismo o más jugadores, divididas por nivel de dificultad (figura 6).

Figura 6.

Árbol completo de las decisiones realizadas por los jugadores

Fuente: Elaboración propia.

(0.49MB).
Selección de atributos

Se realiza una comprobación de la calidad de los atributos. Dentro de la herramienta KNIME, se ejecuta una prueba de selección de atributos considerando los algoritmos ExhaustiveSearch (Nievergelt, 2000) y CfsSubsetEval (Pereira, 2007). Al final de este proceso, se obtiene la tabla 2 que refleja la relevancia de los atributos según los algoritmos mencionados. Los atributos que aparentemente guardan mayor relación con la clase son SP_numero_Piezas_Totales y SPP_pieza_Insertable_Promedio. Estos atributos no se pueden deducir a partir de la combinación de otros atributos. De forma intuitiva se puede observar que el atributo SPP_numero_Piezas_Insertables es totalmente imprescindible para caracterizar las heurísticas a seguir. Esto tiene sentido, dado que al analizar los registros, la estrategia del jugador cambia dependiendo si las jugadas corresponden al principio o al final de estas.

Tabla 2.

Relevancia de atributos

Atributo  Porcentaje de relevancia 
SSP_numero_Piezas_Totales  100% 
SPP_pieza_Insertable_Promedio  100% 
SPP_pieza_Insertable_Actual  100% 
SPP_Tamaño_Promedio  30% 
SPP_Tamaño_Maximo  30% 
SPP_pieza_Insertable_Barata  30% 
SPP_pieza_Insertable_cara  30% 
SPP_Tamaño_Minimo  20% 
Spp_numero_Piezas_Insertables  0% 

Fuente: Elaboración propia

Otro atributo preponderante es SPP_pieza_Insertable_Promedio, el cual refleja el costo promedio de inserción de las piezas, es decir, las heurísticas a utilizar dependen de este costo. Finalmente, el tercer atributo imprescindible según este método es SPP_pieza_Insertable_Actual, el cual indica si las jugadas actuales son las primeras o las últimas en la lista de piezas. Esto también se corrobora empíricamente, ya que la estrategia cambia de acuerdo con qué sección de la lista de piezas se inserta actualmente. Sin embargo, existen atributos que al parecer son irrelevantes para caracterizar las decisiones del jugador. Este es el caso del atributo SPP_numero_Piezas_Insertables. Su eliminación indica que no es relevante el tamaño de la lista de piezas a la hora de seleccionar la estrategia a seguir.

Árbol de decisión

Se deben reproducir las 4121 jugadas, movimiento a movimiento, generando un ejemplo para el entrenamiento del árbol de decisión, en cada movimiento se calculan todos los atributos y se compara la decisión del jugador con la decisión de los atributos seleccionados. Si la decisión coincide, entonces se crea un nuevo ejemplo para la clase, en caso contrario, se crea un nuevo ejemplo asumiendo que la decisión es aleatoria. El árbol generado clasifica correctamente 87.03% de los casos las decisiones de los jugadores. A pesar que el árbol tenga más de 500 hojas, es necesario revisar en general los patrones obtenidos, donde se advierte que el nodo raíz hace referencia al atributo SPP_Tamaño_Maximo. El significado de este atributo se relaciona con la inserción de la pieza de mayor tamaño. La bifurcación de este atributo separa al árbol en las decisiones tomadas después de la segunda mitad de la lista de piezas. Esto puede parecer lógico dado que la lista de piezas, en un principio, se va insertando de mayor tamaño, para luego volver hacia las más pequeñas en las inserciones posteriores.

Resultados y discusión

El experimento se realizó con 20 jugadores en un rango etario de 22 y 34 años, que en sus actividades diarias deben realizar operaciones con características del Strip Packing Problem. En la tabla 4 se puede observar el número total de jugadas realizadas y el detalle de cada uno de los 5 niveles definidos para el experimento. El análisis de los resultados se realiza bajo la cantidad de jugadas y calidad de solución, dada por P, el valor de la mejor solución conocida, P* el valor del área obtenida por el jugador y CR la calidad de respuesta obtenida por el jugador, luego CR = 100 [1 – (P* /P – 1)], donde P* es siempre mayor o igual a P.

Tabla 4.

Comparación de algoritmos

Algoritmo  Ordenamiento  División de la tira 
BLDA (este estudio)  Realiza un ordenamiento de áreas no crecientes  Genera una división en función de la pieza encajada, la subárea superior y la sub área lateral 
FFDH (Lodi, 2002)  Realiza un ordenamiento de rotación de piezas para que todas tengan la altura máxima y luego realiza un ordenamiento de altura no creciente para insertar la primera pieza que encaje y luego reordena nuevamente  Genera una nueva división cada vez que una pieza no encaja en ningún nivel anterior 
NFDH (Lodi, 2002)  Realiza un ordenamiento de rotación de piezas para que todas tengan la altura máxima y luego realiza un ordenamiento de altura no creciente; después de encajar la primera pieza, intenta con las restantes sin reordenar  Genera una nueva división cada vez que una pieza no encaja en el nivel actual 
Wang (Wang, 1983No realiza ordenamiento
Aunque es posible agregar la variación ya sea por área o por altura 
Genera una división en función de la pieza encajada y su porcentaje de pérdida asociado, la sub área superior y la sub área lateral 

Fuente: Elaboración propia

Adicionalmente, en la tabla 3 se puede observar que ninguno de los jugadores logró obtener en el último nivel una calidad de jugada por sobre 90%, en cambio, en los niveles 1, 2, 3 y 4 se alcanzó 9.3, 9.16, 6.14 y 0.70% respectivamente, es decir, el descenso del porcentaje de efectividad tiene una directa relación con la complejidad y combinatoria del SPP. En el nivel 5, donde el óptimo tiene pérdida interna, los jugadores no lograron resolver el nivel, principalmente porque el algoritmo utilizado buscó eliminar la pérdida interna, pero la mejor distribución conocida tiene una disposición diferente a los demás.

Tabla 3.

Jugadas por Nivel

  Total jugadas  Jugadas sobre 90% de calidad  % de jugadas sobre 90% de calidad 
Nivel 1  677  63  9.30% 
Nivel 2  1484  136  9.16% 
Nivel 3  976  60  6.14% 
Nivel 4  852  0.70% 
Nivel 5  132  0.00% 
Total  4121  265  6.43% 

Fuente: Elaboración propia

Patrones y procedimientos

El procedimiento utilizado por los jugadores se divide en dos etapas. La primera se compone por el proceso de construcción de la solución inicial, la cual se construye sin el conocimiento previo del problema, es decir, el jugador ha estructurado este proceso a través de todas las jugadas anteriores, como parte de su experiencia. La segunda, consiste en rescatar el posicionamiento de la jugada actual basado en dos criterios para seleccionar buenas configuraciones: a) este criterio se produce en el ordenamiento decreciente de área de las piezas, manteniéndose en la solución final; b) este criterio se produce en jugadas donde las piezas se ordenan según agrupamiento de piezas, formando figuras cuadradas y ordenadas en forma decreciente.

La solución más recurrente es formar áreas decrecientes insertadas de izquierda a derecha y de abajo hacia arriba, la cual es muy similar a la heurística Bottom Left Decreacing Height (Lodi, 2002). A nivel procedimental el algoritmo se describe en los 5 pasos siguientes:

  • 1.

    Ordenar todas las piezas por tamaño de área en orden decreciente.

  • 2.

    Insertar de izquierda a derecha y de abajo hacia arriba las piezas previamente ordenadas.

  • 3.

    Cuando una pieza no es posible de insertar sin sobreponer, esta se gira y se prueba insertar, si no es posible se prueba con la pieza siguiente en el orden no creciente.

  • 4.

    Si una pieza se omite porque no puede insertarse, y se colocó la siguiente, entonces se ordenan nuevamente en orden no creciente.

  • 5.

    Al completar toda la fila, se comienza nuevamente de izquierda a derecha.

Algoritmo de solución obtenido

Mediante minería de datos y árboles de decisión se establece el algoritmo de jugadores para solucionar los problemas, este se denomina BLDA (Bottom Left Decreasing Area). La implementación del algoritmo se detalla en el Algoritmo 1. En el peor caso, en cada ingreso de una pieza se utiliza el espacio vertical. Por lo tanto, existen tantas iteraciones como piezas, lo cual conduce a una complejidad computacional de O(n2).

Algoritmo 1.

Heurística BLDA generada

Comparación de algoritmos

Para realizar un análisis comparativo con algoritmos existentes en la literatura, en la tabla 4 se presentan similitudes entre los distintos algoritmos, donde la primera fila ubica al autor, después la técnica utilizada para ordenar y la división de tira, respectivamente. Se destaca la similitud obtenida por BLDA con FFDH (First Fit Decreasing Height), al igual que la división de la tira es semejante a lo realizado por Wang (1983) para el corte guillotina de piezas regulares. Se observó semejanza en la forma de división de espacios con el algoritmo de Wang (1983), ya que realizan divisiones laterales y superiores, penalizando las divisiones superiores y priorizando las divisiones laterales. Una diferencia importante con Wang (1983), es no calcular el porcentaje de pérdida interna, por lo cual el algoritmo de jugadores no resuelve de manera adecuada diseños con espacio entre piezas.

En la tabla 5, se presentan pruebas del algoritmo con instancias de Burke (2003) e instancias generadas de manera aleatoria, en la primera y segunda columna, respectivamente. Se obtiene 94.3% promedio para las tres instancias de Burke (2003) y 79% para las generadas de manera aleatoria considerando pérdidas internas. Obteniendo 88.2% del óptimo para todas las instancias extras. Además, en la figura 7 se observa el diseño de la instancia B1 de Burke, donde en el sector izquierdo se detallan las cantidades y los tamaños de piezas dados por la forma [ancho] x [largo].

Tabla 5.

Pruebas con otras instancias

Instancias de Burke (2003)Generadas aleatorias
Nombre  Calidad (%)  Nombre  Calidad (%) 
B1  100  Aleatorio1  78 
B2  100  Aleatorio2  80 
B3  83     
Promedio  94.3  Promedio  79.0 
Promedio final: 88.2%

Fuente: Elaboración propia

Figura 7.

Solución de instancia B1

Fuente: Elaboración propia.

(0.19MB).
Conclusiones

En este artículo se obtuvo un algoritmo a partir de las jugadas sobre un juego NP-Completo. Además, se verificó la validez del algoritmo y se probó con instancias nuevas, no presentes en la etapa de identificación de patrones de juego.

Los jugadores expertos entregan en cantidad y calidad jugadas suficientes para permitir identificar patrones. Encontrar estos patrones requiere de un análisis exhaustivo de las jugadas en un proceso de minado de datos. Una parte importante del algoritmo propuesto se extrae mediante árboles de decisión, una técnica utilizada en minado de datos con el objeto de representar el conocimiento o patrones.

El algoritmo obtenido valida la hipótesis de trabajo que afirma la posibilidad de identificar patrones de juego a partir de las jugadas. Aparte de verificar la hipótesis de trabajo se presentan pruebas que dan mayor soporte a esta afirmación: el algoritmo que representa los niveles de SPPG se ajusta 87.03% en promedio de los casos al comportamiento humano.

Como ejercicio adicional, se prueba el algoritmo sobre nuevas instancias, no resueltos por los jugadores, con la finalidad de demostrar que es un modelo general de resolución de Strip Packing Problem. La calidad promedio de la solución para problemas de 10 a 40 piezas alcanzó 88.2% de la mejor solución conocida.

Agradecimientos

Los autores agradecen el soporte de sus respectivas universidades. R.L. fue parcialmente financiado por el proyecto FONDECYT 11150370. G.G. fue parcialmente financiado por el grupo SEPRO de la Universidad Nacional de Colombia.

[De Jong y Schultz, 1998]
K. De Jong, A.C. Schultz.
Using experience-based learning in game playing.
Proceedings of the Fifth International Conference on Machine Learning, pp. 284-290
[Gatica et al., 2016a]
G. Gatica, G. Villagran, C. Contreras-Bolton, R. Linfati, J.W. Escobar.
A new genotype-phenotype genetic algorithm for the two-dimensional Strip Packing problem with rotation of 90° degrees.
Ingeniería y Universidad, 20 (2016), pp. 177-196
[Garey y Johnson, 1979]
M. Garey, D.S. Johnson.
Computers and intractability: a guide to the theory of NP-completeness.
W.H. Freeman, (1979),
Este artículo se cita:

Citación estilo Chicago

[Gatica et al., 2016b]
Gustavo Gatica, Pablo Reyes, Carlos Contreras-Bolton, Rodrigo Linfati, John Willmer Escobar.
Un algoritmo para el Strip Packing Problem obtenido mediante la extraccion de habilidades de expertos usando minería de datos.
Ingeniería Investigación y Tecnología, XVII (2016), pp. 179-190

Citación estilo ISO 690

[Gatica et al., 2016c]
G. Gatica, P. Reyes, C. Contreras-Bolton, R. Linfati, J.W. Escobar.
Un algoritmo para el Strip Packing Problem obtenido mediante la extraccion de habilidades de expertos usando minería de datos.
Ingeniería Investigación y Tecnología, XVII (2016, abril-junio), pp. 179-190
Referencias
[Acuña y Parada, 2010]
D.E. Acuña, V. Parada.
People efficiently explore the solution space of the computationally intractable traveling salesman problem to find near-optimal tours.
PLoS ONE, 5 (2010), pp. 10
[Alvarez-Valdés y Parreño, 2008]
R. Alvarez-Valdés, F. Parreño.
Reactive GRASP for the strip-packing problem.
Computer Operation Research, 4 (2008), pp. 1065-1083
[Burke et al., 2003]
E. Burke, G. Kendall, E. Soubeiga.
A tabu-search hyperheuristic for timetabling and rostering.
Journal of Heuristics, 9 (2003), pp. 451-470
[Campitelli y Gobet, 2005]
G. Campitelli, F. Gobet.
Structure and stimulus familiarity: a study of memory in chess-players with functional magnetic resonance imaging.
The Spanish Journal of Psychology, 2 (2005), pp. 238-245
[Demaine, 2001]
E. Demaine.
Playing games with algorithms algorithmic combinatorial game theory, en: Proceedings of the 26th Symposium on Mathematical Foundations in Computer Science.
Czech Republic: Lecture Notes in Computer Science, (2001), pp. 18-32
[Demaine et al., 2002]
E. Demaine, S. Hohenberger, D. Liben-Nowell.
Tetris is hard, even to approximate, en: Proceedings of the 9th annual international conference on Computing and combinatorics.
Springer-Verlag, (2002), pp. 351-363
[Epstein, 1987]
D. Epstein.
On the NP-completeness of cryptarithms.
ACM SIGACT News, 18 (1987), pp. 38-40
[Fraenkel, 1997]
A. Fraenkel.
Combinatorial game theory foundations applied to digraph kernels.
Electronic Journal of Combinatoric, (1997), pp. 13-42
[Jaaksi, 1998]
A. Jaaksi.
A method for your object-oriented project.
Journal of Object-Oriented, 10 (1998), pp. 17-25
[Klemettien, 1999]
M. Klemettien.
A knowledge discovery methodology for telecommunication network.
Proceedings of the twelfth international conference on data engineering, Finlandia, University of Helsinkin, pp. 115-122
[Lodi et al., 2002]
A. Lodi, S. Martello, D. Vigo.
Recent advances on two-dimensional bin packing problems.
Discrete Applied Mathematics, 1,2,3 (2002), pp. 379-396
[Nievergelt, 2000]
J. Nievergelt.
Exhaustive search, combinatorial optimization and enumeration: exploring the potential of raw computing power.
Proceedings of the 27th Conference on current trends in theory and practice of informatics (SOFSEM ‹00), pp. 18-35
[Pereira et al., 2007]
J. Pereira, M. Domínguez, J. Ocejo.
Sáez. Modelos de Previsão do Fracasso Empresarial: Aspectos a considerar.
Revista de Estudos Politécnicos Polytechnical Studies Review, IV (2007), pp. 111-148
[Russell y Norvig, 1995]
S. Russell, P. Norvig.
Artificial intelligence: A modern approach.
Prentice-Hall, Inc., Upper Saddle River, (1995),
[Stewart, 2005]
I. Stewart.
Minesweeper as an NP-complete problem.
ACM SIGCSE Bulletin, (2005), pp. 39-40
[Sunnucks, 1970]
A. Sunnucks.
Encyclopaedia of Chess.
Robert Hale Ltd, (1970),
[Wang, 1983]
P.Y. Wang.
Two algorithms for constrained two-dimensional cutting stock problem.
Computers & Industrial Engineering, 31 (1983), pp. 109-115
[Witten y Frank, 2000]
I.H. Witten, E. Frank.
Data mining: practical machine learning tools and techniques.
Morgan Kaufmann, (2000),

Gustavo Gatica. Doctor en ciencias de la ingeniería con mención automática por la Universidad de Santiago de Chile. Actualmente es profesor en las facultades de ingeniería de la Universidad de Andrés Bello y Santiago de Chile. Sus intereses de investigación consideran el diseño e implementación de algoritmos exactos y heurísticos para problemas de optimización combinatoria y desarrollo de aplicaciones computacionales para empresas chilenas.

Pablo Reyes. Ingeniero civil informático de la Universidad Andrés Bello. Actualmente se desempeña en la empresa privada en el área de las telecomunicaciones.

Carlos Contreras-Bolton. Magíster en ciencias de la ingeniería informática por la Universidad de Santiago de Chile. Actualmente es profesor en las facultades de ingeniería de la Universidad de Andrés Bello y Santiago de Chile. Sus intereses de investigación consideran el diseño e implementación de algoritmos exactos y heurísticos para problemas de optimización combinatoria.

Rodrigo Linfati. Doctor en automatización e investigación de operaciones por la Universidad de Bologna (Italia). Actualmente es profesor en el departamento de ingeniería industrial de la Universidad del Bío-Bío, Chile. Sus intereses de investigación incluyen el diseño e implementación de efectivos algoritmos exactos y heurísticos para problemas de optimización combinatoria y sus aplicaciones en problemas reales.

John Willmer Escobar. Doctor en investigación de operaciones por la Universidad de Bologna (Italia). Es docente de programas de pregrado y posgrado de la Pontificia Universidad Javeriana y Universidad del Valle. Sus intereses de investigación incluyen el diseño e implementación de efectivos algoritmos exactos y heurísticos para problemas de optimización combinatoria y sus aplicaciones en problemas reales.

Descargar PDF
Opciones de artículo