Nous en avons parlé sur le site Abondance (http://actu.abondance.com/2003-09/google-brevet.html), Google a dernièrement obtenu un brevet auprès de l'ESPTO, organisme gérant les brevets aux Etats-Unis. L'occasion nous a semblé intéressante de faire le point, mois après mois, sur les différents brevets détenus par les acteurs importants de la recherche d'information sur le Web, car ceux-ci pourraient s'avérer très importants, stratégiquement parlant, à l'avenir. A tout seigneur tout honneur, nous commençons donc ce mois-ci avec Google. Selon nos recherches, la base de données de l'USPTO contient deux brevets spécifiquement au nom de Google :

"Ranking search results by reranking the results based on local inter-connectivity"

Brevet # 6,526,440

Appl. No.: 771677

30 janvier 2001

URL : http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=/netahtml/search-bool.html&r=2&f=G&l=50&co1=AND&d=ptxt&s1=google.ASNM.&OS=AN/google&RS=AN/google

Ce brevet présente un concept venant compléter celui du PageRank, utilisé actuellement par le moteur de recherche comme critère majeur de "ranking", par une pondération du classement initial des pages (qui est effectué indépendamment de la requête, en combinant des informations lexicales et le PageRank), par un deuxième classement local, dans le contexte de la requête. Il s'agit d'améliorer le score de pertinence d'un document en analysant l'inter-connectivité de ce dernier à l'intérieur d'un sous-index de documents reconnus eux-mêmes comme pertinents.

Dans un premier temps, un sous-index "local" est créé, regroupant des documents répondant globalement à une requête par la présence du mot demandé dans leur texte. A l'intérieur de cet index local, un "score local" est calculé pour chaque page en tenant compte de l'interconnectivité des pages entre elles. Le score de pertinence, par rapport à la requête demandée intialement, est alors recalculé en fonction du "score local" obtenu par l'analyse de l'interconnexion des liens. Pour simplifier, la méthode proposée utilise 2 "PageRank" : l'un est calculé au niveau de l'index global, l'autre au niveau d'un index local, regroupant les pages répondant à la requête. Le classement final utilise une combinaison des 2 PageRank.

"Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query"

Brevet # 6,529,903

Appl. No.: 748833

26 décembre 2000

URL : http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/search-adv.htm&r=1&p=1&f=G&l=50&d=ptxt&S1=google.ASNM.&OS=an/google&RS=AN/google

Ce brevet a trait notamment aux interrogations d'un index à l'aide d'un terminal "non adapté" à une interrogation alphanumérique. Exemple : un clavier de téléphone portable. Actuellement, pour saisir une phrase (par exemple, pour taper un SMS), l'utilisateur doit éventuellement frapper successivement la même touche pour arriver à la bonne lettre. Exemple donné par le brevet : pour taper "ben smith", le possesseur d'un téléphone GSM doit taper :

b : 22

e : 33

n : 66

espace : 0

s : 7777

m : 6

i : 444

t : 8

h : 44

Le but du brevet est de décrire une solution qui permettrait de décrire, au prix de quelques approximations, chaque lettre uniquement par le chiffre qui la représente, et donc ici :

b : 2

e : 3

n : 6

espace : 0

s : 7

m : 6

i : 4

t : 8

h : 4

L'avantage est qu'on ne saisit que 9 chiffres (236076484) au lieu de 18 (223366077776444844) dans le cas précédent.

Le but est de faire en sorte que, statistiquement, le mot ainsi obtenu, même s'il est imprécis ("car" est défini, de façon numérique, de la même façon que "bar"), soit comparé à un index, transformé d'alphanumérique en numérique de la même façon, afin de pouvoir effectuer des recherches sur le Web rapidement. Si "bar" et "car" sont décrits de la même façon et donneront des résultats approximatifs, "wine", par exemple, ne propose aucune ambiguïté (9463) selon Google. Le moteur de recherche indique, dans le brevet, que cette méthode de recherche peut être étendu à d'autres formats, notamment phonétique et audiovisuel.

Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).