¿Qué es mejor para una IA?. ¿Un razonamiento directo o indirecto?. 🤔
Los LLMs han demostrado capacidades increíbles en tareas complejas como la comprensión del lenguaje, el razonamiento lógico y el razonamiento matemático. El éxito de estos modelos es aún más increíble si se tiene en cuenta que lo hicieron con cero o pocos disparos
Pero volviendo al tema, esto ha provocado que varias investigaciones se centren en tratar de entender cómo aumentar estas capacidades de los modelos, por lo que han surgido técnicas como la Cadena de Pensamiento (CoT)
CoT siguen lo que se llama el marco de razonamiento directo (RD), donde se crean cadenas lógicas desde hechos dados hasta el resultado final. El problema es que no todos los problemas pueden resolverse de esta manera.
✅ ¿Qué es CoT?
Es una técnica que fomenta al modelo a desglosar su proceso de razonamiento en pasos intermedios claros y explícitos antes de llegar a una solución final. En lugar de saltar directamente a la respuesta, el modelo genera una secuencia de pensamientos o razonamientos que conducen lógicamente a la conclusión. Esto no solo ayuda a mejorar la precisión de las respuestas del modelo sino que también hace que el proceso de razonamiento sea transparente y comprensible para los humanos.
Pero, todo esto es Razonamiento Directo, ¿dónde esta el indirecto?.
Pues aquí os traigo la investigación de hace unos días titulada “Large Language Models as an Indirect Reasoner” la cual introduce un método de Razonamiento Indirecto (IR) para LLMs usando la lógica de los contrapositivos y contradicciones, con el objetivo de mejorar el razonamiento en tareas.
https://arxiv.org/abs/2402.03667
El Razonamiento Indirecto (RI) permite a los LLMs abordar problemas complejos de una manera no lineal, buscando soluciones a través de caminos que no son inmediatamente evidentes.
✅ ¿Y que ventaja tiene sobre el RD?
Imagina que estás tratando de resolver un laberinto. El enfoque directo sería tratar de ir del punto A al punto B de la manera más recta posible, lo que puede resultar difícil si hay muchos obstáculos o caminos sin salida. El RI, en este contexto, sería como si en lugar de intentar ir directamente al objetivo, utilizas pistas y deducciones sobre lo que no funciona para encontrar caminos alternativos, como saber que ciertas rutas te llevan a un callejón sin salida y por lo tanto deben evitarse. Este método no solo puede hacerte encontrar la salida más eficientemente sino que también te ayuda a entender mejor la estructura del laberinto, lo que mejora tu capacidad para navegar por problemas complejos de manera más efectiva.
Experimentos realizados con modelos como GPT-3.5-turbo y Gemini-Pro demuestran que el método IR mejora notablemente el desempeño general de los LLMs en tareas comunes. Además, cuando se combina el IR con el DR, el rendimiento supera a los métodos que utilizan solo IR o DR.
¿Nosotros razonamos igual?