Отсканированные документы в поисковиках Google и применение единой учётной записи

Ещё совсем недавно прошло обновление поисковой системы по блогам от компании Google, но уже сегодня стало известно, что поисковая система Google выходит на новый уровень. Тперь искать можно не только среди блогов, в Интернете, в новостях и т.д., но и в отсканированных документах. Для того чтобы осуществить такие новшества в Google Search, компании необходимо позаботиться о дополнительных вычислительных мощностях и о применении наиболее совершенных распознающих изображение программ.

Сложность новой поисковой функциональности заключается в том, что отсканированный текстовый документ в отличие от обычного текстового документа для «пауков» Google совершающих поиск не несет никакой текстовой информации. Поэтому для того, чтобы извлечь необходимые сведения, компания применила специальную технологию, которая направлена на оптическое распознавание символов. Данная функция называется Optical Character Recognition Technology и направлена на то, чтобы превращать в текстовые файлы, те документы, которые были сфотографированы.

Если раньше поисковик Google ориентировался исключительно в названиях файлов и метаданным, включённым в него и никак не в его содержании. То в современном поисковике Google в результатах поиска будут представлены сканированные тексты, в которых есть содержание запроса. У всех желающих будет возможность посмотреть найденный текст уже отконвертированным в текстовый документ или же в оригинальном виде.

Про систему распознавания текстов оптическим методом известно очень давно, но данную систему ещё никто не применял. Исходя из вычислительных мощностей Google их целенаправленности, результат может вполне превзойти все ожидания.

Ещё одной не менее интересной новостью от Google становится новшества по поддержке единой учётной записи. С 29 октября компания Google открыла для своих пользователей новую возможность, теперь пользователям на многих сайтах не придётся регистрироваться и вводить при этом новые логины и пароли, которые лишний раз «забивают голову». При помощи протокола OpenID 2.0. и своей учетной записи Google пользователи могут проходить автоматическую авторизацию на сайтах. Происходит это примерно следующим образом: заходя на сайт, который поддерживает OpenID и вводя в нужном поле свой аккаунт и логин на Google (хотя пользователь на данном сайте не зарегистрирован), будет осуществляться перенаправление пользователя на сайт Google, где ему необходимо будет подтвердить своё согласие на авторизацию под учётной записью как на Google. После этой операции пользователя вновь направляют на страницу нужного сайта, где он уже является полноценным зарегистрированным пользователем.

Ноябрь 3, 2008 — Рубрика: Новости
Метки: , ,
Реклама: рулонные жалюзи купить недорого в Москве