Ex-Googler Dice PageRank Reemplazado en el 2006 – Motor de Búsqueda de Diario

image_pdfimage_print

Un Ex-ingeniero de software de Google, comentó en un Hacker News discusión, discutiendo la forma de trabajar de Google. A lo largo de la manera mencionó que Google ya no se usa el original algoritmo PageRank.

Google No Utiliza Original PageRank?

El Hacker News discusión se bifurcaban en un lado de la discusión acerca de la creación de una competencia motor de búsqueda y un ex-Googler caído en discutir Google PageRank.

Esto es lo que el ex-Googler dijo sobre el PageRank ya no está en uso:

“Los comentarios de aquí que el PageRank de Google salsa secreta también no son verdad – Google no ha utilizado el PageRank desde el año 2006. El sobre el search & click-through de los datos importantes están más cerca…”

luego siguió con:

“Se sustituyó en 2006 con un algoritmo que da aproximadamente-resultados similares, pero es significativamente más rápido de calcular. El algoritmo de reemplazo es el número que se ha reportado en la barra de herramientas, y lo que Google afirma como PageRank (que incluso tiene un nombre similar, y así de Google reclamo no es técnicamente incorrecta).

Ambos algoritmos O(N log N), pero el cambio es mucho más pequeña constante en el log N factor, debido a que elimina la necesidad de iterar hasta que el algoritmo converge. Que es bastante importante como la web creció de ~1-10M páginas 150B+.”

PageRank y Nuevo PageRank

Hamlet Batista twitter acerca de la revelación contenida en el Hacker News discusión.

Búsqueda de patentes de expertos Bill Slawski respondió por twitter:

“de Google a la versión más reciente de PageRank fue concedida una patente en 2006. Coincidencia?”

En la que el 2015 en el artículo, Bill escribió:

“en Virtud de esta nueva patente, Google añade un conjunto diversificado de confianza páginas para actuar como semilla de sitios. A la hora de calcular los rankings para las páginas. Google podría calcular una distancia a partir de la semilla de las páginas a las páginas de la clasificación.”

Aquí es lo que Bill señaló sobre el nuevo PageRank en un seguimiento posterior de abril de 2018:

“El original PageRank de patentes, asignado a la Universidad de Stanford, ha caducado. Google tenía una licencia exclusiva para utilizar el PageRank. Google presentó una actualización de PageRank, con un algoritmo diferente detrás de él. “

proyecto de Ley, a continuación, citado de la patente:

“Un popular motor de búsqueda desarrollado por Google Inc. de Mountain View, Calif. usa el PageRank.RTM. como una página de métricas de calidad para guiar de manera eficiente los procesos de rastreo web, selección de índice y la página web de la clasificación.”

Es Nuevo PageRank de la Distancia del Enlace Algoritmo de Clasificación?

El Google patentes que Bill Slawski de la cites se centran en el ranking de los enlaces comienzo con una confianza de un conjunto de semillas. No es una confianza algoritmo. El nombre de la patente está Produciendo un Ranking de las Páginas Utilizando las Distancias en un enlace Web Gráfico.

es evidente por el título que este es un enlace de distancia algoritmo de clasificación, que utiliza las distancias de una confianza de un conjunto de semillas para calcular una forma de PageRank. No es una confianza algoritmo.

Original Algoritmo PageRank Ya No está en Uso?

Si este ingeniero de software es que se cree, el original del algoritmo PageRank ya no está en uso. Es posible que haya sido reemplazado por un algoritmo más eficiente con un nombre similar, como Bill Slawski sugirió.

¿Es esto Realmente un ex-Googler?

creo que esto es un ex-Googler. De acuerdo a su Hacker News perfil, su nombre es Jonathan Tang.

el nombre corresponde a un perfil de LinkedIn con el mismo nombre con la siguiente información:

“Ingeniero de Software Senior
Nombre de la Empresa: Google
las Fechas de Empleo: enero de 2009 – Mayo de 2014

me incorporé como una interfaz de usuario ingeniero de software en Buscar y, a continuación, poco a poco se trasladó más hacia el backend de trabajo, finalmente el trabajo con la Búsqueda de la pila. También ayudó a Google+ y GFiber lanzamiento.”

Ingeniero de Google Revela Más acerca de Google

El ingeniero compartido que una razón por la que algunos pueden encontrar los resultados de búsqueda de Google es insatisfactoria porque es personalizar para satisfacer a las masas y no el individuo. Llamé a que los Fruit Loops efecto, en la que Google, como un supermercado de cereales pasillo, va a mostrar a los usuarios lo que ellos esperan, que en algunos casos es Fruto de Bucles.

Aquí su explicación de por qué Google SERPs podría no ser satisfactoria para algunos:

“La razón de esto es porque Google edificio para un público general, debido a que la corriente principal (por definición) es mucho más grande que cualquier nicho. Aumentan agregado de la felicidad (aunque no específicos de su felicidad) mucho más por hacerlo.”

Comercial Busca Subsidiar no Comercial Búsquedas

El Googler también se discuten los porcentajes de los ingresos que proviene de comercial búsquedas, a pesar de que permitió que sus números puede ser de fecha.

“Google hace básicamente el 80% de sus ingresos a partir de búsquedas de productos o servicios comerciales (seguros, abogados, terapeutas, SaaS, flores, etc.) El resto se divide entre AdSense, Nube, Android, Google Play, GFiber, YouTube, DoubleClick, etc. (puede ser un poco más alto ahora).”

Cómo Google Documento de Recuperación de Obras

a continuación, Se examinaron cómo se recuperan los documentos para cada consulta:

“Recuerde, la búsqueda de toques (casi) cada documento indexado en cada consulta – si usted lanza en 200ms solicitud de latencia para la 4B de los documentos de su solicitud llevará aproximadamente 25 años.

…se utiliza un índice y toca sólo los documentos que aparecen en uno de los pertinentes de la publicación de las listas. Sin embargo, después de derivados de ortografía, corrección, sinónimos y un número de otras expansiones no estoy en libertad para discutir, puede haber una gran cantidad de términos de la consulta que se tiene que mirar a través, cubriendo una porción significativa del índice.

Cada uno de estos debe ser anotado (bueno, sorta – hay varios trucos que puede utilizar para evitar anotando algunos docs, que repito, no estoy en libertad para discutir), y por lo general es beneficioso para la combinación de los puntajes, sólo después de que se han calculado para todos los términos de la consulta, porque tiene más información acerca del contexto de que se disponía entonces.”

¿Es Posible que el Original PageRank Ya No está en Uso?

Si uno piensa en ello, tiene sentido que la original algoritmo PageRank no esté en uso. Es posible que se ha desarrollado o revisado. El ex-Googler afirma que ha sido completamente reemplazado. Esa afirmación coincide con la evidencia visible en los últimos Google patente actualizaciones, donde una nueva forma de PageRank se reivindica.

Leer el Hacker News discusión aquí:

This content was originally published here.

Dejá un comentario