Las matemáticas y las búsquedas en Internet

Tenía ganas de contar esta relación que existe entre las matemáticas que podemos empezar a estudiar en 4º de la ESO y un concepto tan cercano y usado a diario como son las búsquedas de Internet. Me encanta escribir estos artículos porque puedo acercar a mis alumnos a conceptos muy complicados basándome en teorías o…


Tenía ganas de contar esta relación que existe entre las matemáticas que podemos empezar a estudiar en 4º de la ESO y un concepto tan cercano y usado a diario como son las búsquedas de Internet. Me encanta escribir estos artículos porque puedo acercar a mis alumnos a conceptos muy complicados basándome en teorías o practicas que estamos dando en clase actualmente, de esta manera les hace ver y entender la utilidad de las matemáticas en la vida real.

El álgebra y la matemática discreta permiten combinar conceptos tangibles del mundo real con el cálculo computacional. Los computadores operan con reglas que son algoritmos, que se crean gracias a las leyes de la matemática discreta (álgebra de boole, matrices, grafos, árboles, …).

La matemática discreta permite, entre otras cosas, extrapolar problemas cotidianos al lenguaje matemático que, a su vez, es el que entiende el computador.

Las matemáticas son un pilar fundamental para la informática. Directamente aplicables en áreas tan importantes como la seguridad informática, comprobación de errores, estadística, diseño gráfico, compresión,  optimización de redes, algoritmos de búsqueda y ordenación, ingeniería, robótica, geotecnia, mecánica de fluidos, entre otras.

En este caso destacaremos una de las muchas disciplinas informáticas que utilizan directamente el álgebra, los motores de búsqueda de Internet

Para explicar la relación que podemos encontrar entre los buscadores de Internet y las matemáticas tenemos que enfocarlo en un concepto de Matemáticas Discreta conocido como Grafo, como mi objetivo de este articulo es que se pueda llevar al aula, no quiero integrar conceptos que se escapen a la asignatura de un Colegio, realmente buscamos que los alumnos entiendan la idea y su aplicación al proyecto real.

¿Que es un Grafo?

Un grafo G es una estructura matemática que consta de un par ordenado de conjuntos de vértices y otro de aristas (V, E).

  • Un vértice es cada uno de los objetos que representa el grafo.
  • Una arista es la unión o relación que existe entre dos vértices. Es un par no ordenado, por lo que V1V2 es lo mismo que V2V1

Un grafo se define como G= (V, E) donde:

  • V es el conjunto de vértices V= {V1, V2, V3, V4…Vn}
  • E es el conjunto de aristas E= {V1V2, V1V3, V2V3…VnVm}

Definimos como vértices adyacentes dos vértices unidos por una arista.

Definimos camino como una sucesión de aristas V1V2, V2V3, V3V4 que representa una sucesión de vértices

Ahora que sabemos que es un Grafo vamos a intentar explicar como este «dibujo» de vértices y aristas ha podido ser tan relevante en algo tan importante en nuestros días. Algoritmos tan famosos como el PageRank de Google nacen de esta teoría.

Hay muchos tipos de grafos pero solo nos centraremos en uno de ellos para explicar los Motores de Búsqueda, los “Grafos Orientados”.

¿Que es un Grafo Orientado?

Un grafo Orientado o dígrafo D = (V, A) está formado por un conjunto de vértices V y un conjunto de arcos A que unen pares ordenados de elementos de V.

En un grafo orientado, las aristas se denominan arcos, y están representados por flechas que indican la dirección de las mismas.

La aplicación de estos conceptos expuestos a la red de páginas web que conocemos hoy en día es totalmente directa. En este caso los nodos son las páginas web y los vínculos entre ellas son los hipervínculos que dirigen al usuario desde una página hacia otra.

Por las características propias de las páginas web necesariamente el vínculo entre páginas tiene una orientación definida ya que se parte desde la página x y se dirige hacia la página y. En consecuencia el grafo es orientado. Aún más, al considerar la totalidad de vínculos existentes en una página hacia cualquier otro conjunto de páginas, fácilmente se puede asignar la ponderación correspondiente a cada vínculo.

La forma más común, cuya justificación se realizará en la subsección siguiente, es realizarlo de la manera equitativa, aunque nada impide que existan casos en los cuales existan otros factores que inciden en las ponderaciones, y por lo tanto éstas no sean iguales.

Habiendo presentado la utilidad de la teoría de grafos para representar la red de páginas web, ahora es preciso indagar en el accionar de la persona que va recorriendo este conjunto de páginas para encontrar lo que desea.

Al empezar a buscar algo en las páginas web, necesariamente se debe comenzar por alguna página. En caso de no encontrar lo deseado allí uno puede probar suerte eligiendo una nueva página al azar o seleccionar algunos de los hipervínculos presentes en la actual página. Pero para ir introduciendo a los motores de búsqueda consideremos el caso en el cual el individuo elige los vínculos de manera aleatoria.

En este caso, al estar en una determinada página la elección de cualquiera de los vínculos depende de la cantidad de vínculos existentes. Al modelar la búsqueda como un random walk la probabilidad de elegir cualquiera de los vínculos es igual para cada uno de ellos.

Considerando a la red de páginas web como un Grafo y a la búsqueda en ella como un fenómeno aleatorio, queda así justificado el motivo por el cual se trabaja con ponderaciones equitativas para los vínculos.

Es importante aclarar que tanto el razonamiento como el método presentados solo son válidos para situaciones “normales”, donde todas las páginas se entrelazan entre sí y pueden ser representadas por grafos fuertemente conectados. Para aquellos casos en los que esto no suceda, el algoritmo tiene fórmulas de corrección que permiten su correcto funcionamiento.

Dos inconvenientes comunes son:

  • Páginas sin links de salida (páginas colgantes), correspondientes a Grafos conectados.
  • Presencia de componentes desligados, es decir, grupos de páginas que no estén relacionados entre sí y que sin embargo sean relevantes uno para con el otro.

En el siguiente artículo voy a intentar profundizar más en las ponderaciones de los Grafos que es donde realmente está el significado del algoritmo, pero creo que con este primer articulo he conseguido llegar a mi objetivo, que es como siempre buscar proyectos reales y darles su significado en el aula por medio de las asignaturas. De esta manera cuando los alumnos vean un Grafo Orientado ó directamente se les hable de Algebra o Matemáticas Discreta una parte de su cabeza se irá hacia buscadores como Google, Yahoo, Bing, etc.. y no para buscar información, si no para entender el funcionamiento de su motor.