Sistema de recuento de productos

Conteo rápido y preciso de utensilios: cucharas, tenedores y cuchillos

Resumen

Cliente. La empresa alquila equipamiento para eventos y, en sus 12 años de operación, ha realizado más de 70.000 proyectos que van desde celebraciones familiares hasta festivales a gran escala con 5.000 invitados. Su catálogo incluye equipamiento profesional de hostelería, vajilla, cubertería, mobiliario y textiles.

Tarea. Después del evento, es necesario recibir rápidamente varios miles de piezas de cubertería, contarlas con precisión y asegurarse de que no haya desacuerdos con el cliente.

Resultado. El contador por vídeo CamContador permitió contar de manera rápida y precisa la cantidad de tenedores, cucharas y cuchillos devueltos. El programa redujo a la mitad el tiempo necesario para la recepción del equipamiento.

Situación

Tras el evento, es necesario aceptar rápida y precisamente el equipamiento devuelto del alquiler. Después de grandes eventos, la cantidad de cubertería (cucharas, tenedores, cuchillos) puede alcanzar varios miles. Debido al factor humano, surgen errores y disputas con el cliente.

A veces se requería un recuento adicional para aclaraciones. Todo esto consumía tiempo tanto de los empleados como del cliente.

Para resolver este problema, la dirección de la empresa decidió invertir en un conteo automático mediante visión artificial.

Para comenzar, decidieron centrarse en los artículos más comunes, es decir, 40 tipos de cubertería: cuchillos, tenedores y cucharas.

Solución

Instalación del equipamiento

El cliente compró e instaló un transportador de cinta.

Un empleado coloca la cubertería en la cinta, y al otro lado cae en una caja.

Se monta una cámara de videovigilancia estándar encima del transportador.

Recopilación del dataset y entrenamiento de la red neuronal

Necesitábamos incluir todos los tipos posibles de cuchillos, cucharas y tenedores en diferentes posiciones sobre la cinta en el conjunto de entrenamiento de la red neuronal.

Para ello, el cliente colocó la cubertería sobre la cinta y grabamos un vídeo.

Simulamos junto al cliente diversas situaciones que podrían ocurrir en el trabajo real.

Por ejemplo, la cubertería podía estar mojada y reflejar la luz, o la cinta podía mojarse dejando manchas y rayas.

La cubertería podía llegar sucia, por ejemplo, con restos de tarta u otros alimentos. Los platos sucios podían dejar suciedad en la cinta.

Así que cuanto más variadas fueran las imágenes, mejor. No es necesario crear situaciones artificiales; el objetivo es reproducir el flujo de trabajo real.

El empleado del cliente dispuso los cubiertos en diferentes posiciones: en algunos lugares, el tenedor estaba horizontal, en otros, vertical y en otros, inclinado. Lo mismo ocurrió con los cuchillos y las cucharas. Hicimos funcionar el sistema varias veces por la cinta transportadora.

Este fue el primer vídeo, un caso poco realista, ya que en la práctica no lo colocarían así.

Y esta disposición es demasiado difícil de reconocer y contar:

La cubertería está apilada una encima de otra.

Se acordó con el cliente no amontonarla, sino colocarla con una separación mínima:

Buena colocación para un conteo preciso.

Desafíos

Uso de Oriented Bounding Boxes (OBB)

Una Oriented Bounding Box (OBB) es un rectángulo que puede rotarse para ajustarse a la orientación del objeto, mientras que una Horizontal Bounding Box (HBB) tiene lados fijos verticales y horizontales. Las OBB proporcionan un ajuste más preciso para objetos girados o inclinados, siendo más exactas en áreas como vigilancia aérea o robótica, mientras que las HBB son más simples pero incluyen más fondo innecesario cuando el objeto no está alineado.

Durante el proyecto nos dimos cuenta de que los empleados no siempre podrían colocar tenedores, cucharas y cuchillos lo suficientemente separados como para usar cajas delimitadoras horizontales estándar (HBB). La cubertería puede colocarse aleatoriamente, a veces muy cerca o cruzada. En estos casos, las HBB no funcionaban bien, así que optamos por OBB.

HBB: las áreas se superponen demasiado, lo cual es problemático para la detección.
OBB: no hay solapamiento o es mínimo.

Gracias al nuevo etiquetado logramos una precisión excelente.

Tarjeta gráfica dedicada

Etiquetamos el dataset, entrenamos la red neuronal y la ejecutamos en un ordenador. Descubrimos que a veces el procesador no podía procesar todos los fotogramas. El cliente había asignado un ordenador antiguo con un i5 10400, un modelo con seis años en el mercado.

Para este proyecto no podíamos usar baja resolución ni redes ligeras porque la cinta tenía líneas y flechas dibujadas, además de aparecer manchas húmedas que debíamos diferenciar de cuchillos y tenedores reales.

Por ejemplo, un cuchillo mojado dejaba una marca oscura en el caucho:

Y aquí hay un cuchillo negro real:

Después de una serie de experimentos, nos dimos cuenta de que necesitábamos un procesador más moderno o una tarjeta de vídeo.

Las GPU son económicas hoy en día, por lo que recomendamos al cliente una GTX 1060 (100 €) o una RTX 3050 (160 €).

El cliente adquirió una Nvidia GeForce GTX 1060 6GB y el problema de carga del procesador desapareció.

Flechas pintadas en el transportador

Otro detalle interesante fue que a veces el contador confundía las rayas verticales blancas de la cinta con cuchillos y tenedores.

El cliente simplemente las borró y el problema se solucionó.

Las flechas horizontales no causaban problemas, así que se dejaron.

Tras eliminar todos los obstáculos mencionados, logramos un 100% de precisión en el conteo.

El proceso actual de recepción de equipamiento es el siguiente:

1. Antes de comenzar la recepción, el empleado inicia el programa y activa la grabación de vídeo.

2. Tras finalizar, el empleado detiene el programa y genera un informe de cantidades.

3. Si el cliente tiene dudas, revisan juntos el vídeo grabado con el conteo.

Resultados

El tiempo del procedimiento de recepción se redujo a la mitad.

Aunque la recepción la realizan dos empleados, no ocurre todos los días ni a tiempo completo, por lo que el tiempo real dedicado es de unas 120 horas al mes.

Con un salario de 1.500 € al mes y un tiempo laboral de 150 horas, la tarifa es de 10 €/hora. Por lo tanto, el coste mensual de la recepción es 120 * 10 = 1.200 €.

Tras implementar el sistema, el ahorro fue del 50%, es decir, 600 € al mes.

Costes del proyecto:

  • Cámara e instalación: 100 €
  • Ordenador: 600 €
  • Tarjeta gráfica: 100 €
  • Transportador de cinta horizontal: 1000 €
  • Licencia del programa CamContador: 800 €

Total: 2600 €

El proyecto se amortizó en 5 meses.

Pero no solo importa el ahorro económico; lo más importante es que disminuyeron los errores y disputas con clientes. En consecuencia, aumentó la satisfacción del cliente y el índice NPS.

Ejemplo en vídeo del procedimiento de conteo:

Plazos. El proyecto duró dos meses (septiembre–octubre 2025), incluyendo instalación del equipamiento, entrenamiento de la red neuronal y pruebas.

Equipo. Por parte de CamContador trabajó un especialista — un ingeniero. Por parte del cliente: dos empleados, un gestor del proyecto y un especialista en IT.

Leer más