Отсканированные документы в поисковиках Google и применение единой учётной записи

Ещё совсем недавно прошло обновление поисковой системы по блогам от компании Google, но уже сегодня стало известно, что поисковая система Google выходит на новый уровень. Тперь искать можно не только среди блогов, в Интернете, в новостях и т.д., но и в отсканированных документах. Для того чтобы осуществить такие новшества в Google Search, компании необходимо позаботиться о дополнительных вычислительных мощностях и о применении наиболее совершенных распознающих изображение программ.

Сложность новой поисковой функциональности заключается в том, что отсканированный текстовый документ в отличие от обычного текстового документа для «пауков» Google совершающих поиск не несет никакой текстовой информации. Поэтому для того, чтобы извлечь необходимые сведения, компания применила специальную технологию, которая направлена на оптическое распознавание символов. Данная функция называется Optical Character Recognition Technology и направлена на то, чтобы превращать в текстовые файлы, те документы, которые были сфотографированы.

Если раньше поисковик Google ориентировался исключительно в названиях файлов и метаданным, включённым в него и никак не в его содержании. То в современном поисковике Google в результатах поиска будут представлены сканированные тексты, в которых есть содержание запроса. У всех желающих будет возможность посмотреть найденный текст уже отконвертированным в текстовый документ или же в оригинальном виде.

Про систему распознавания текстов оптическим методом известно очень давно, но данную систему ещё никто не применял. Исходя из вычислительных мощностей Google их целенаправленности, результат может вполне превзойти все ожидания.

Ещё одной не менее интересной новостью от Google становится новшества по поддержке единой учётной записи. С 29 октября компания Google открыла для своих пользователей новую возможность, теперь пользователям на многих сайтах не придётся регистрироваться и вводить при этом новые логины и пароли, которые лишний раз «забивают голову». При помощи протокола OpenID 2.0. и своей учетной записи Google пользователи могут проходить автоматическую авторизацию на сайтах. Происходит это примерно следующим образом: заходя на сайт, который поддерживает OpenID и вводя в нужном поле свой аккаунт и логин на Google (хотя пользователь на данном сайте не зарегистрирован), будет осуществляться перенаправление пользователя на сайт Google, где ему необходимо будет подтвердить своё согласие на авторизацию под учётной записью как на Google. После этой операции пользователя вновь направляют на страницу нужного сайта, где он уже является полноценным зарегистрированным пользователем.

Ноябрь 3, 2008 — Рубрика: Новости
Метки: , ,
Реклама: PrestigeBaby - домашний персонал - няни, гувернантки, домработница

Microsoft предупредила о появлении “кризисных” спамеров

В ближайшее время интернет-мошенники попытаются при помощи спама заработать на мировом финансовом кризисе, передает Reuters слова эксперта Microsoft по интернет-безопасности Тим Крэнтон (Tim Cranton).

Август 31, 2008 — Рубрика: Новости
Метки: , , ,
Реклама: Удобный заказ авто с водителем для корпоративных поездок

Домашняя установка Apache, Perl, PHP, MySql без проблем

Для кодеров/дизайнеров будет вполне достаточно установить только сервер (а без него невозможно работать с SSI, и использовать абсолютные адреса).

Для программистов: нужен сервер и интерпретатор языка Perl или PHP ( зачем вам CGI? Естественно для динамического генерирования содержимого сайта. В ручную создавать сотни и тысячи страниц конечно можно ( с точки зрения индексации поисковиками это даже лучше, а шаблоны DW серьезно облегчат вам в этом жизнь ), но что если вы хотите сортировать материалы, или выдавать их на одной странице по разному, в зависимости от потребностей пользователя? ). Тем, у кого еще осталась возможность выбора я советую Perl.

Август 19, 2008 — Рубрика: Теория
Метки: , , ,
Реклама: купить часы быстро

Как стать шареварщиком, или как заработать деньги своим умом.

Все, так или иначе, пользуются шареварными (условно-бесплатными) программами. Достаточно вспомнить такие программы как Far, WinRar, Windows Commander и много других. А почему же так мало российских программ, что мешает программистам-одиночкам зарабатывать достойные деньги - незнание английского языка, нежелание или что-то еще? В этой статье я поделюсь своим опытом и постараюсь помочь (oleg@duskline.com) стать разработчиком шареварных программ. Итак…

Август 10, 2008 — Рубрика: Теория
Метки: , , , ,

Особенности создания Web-приложений

Процесс разработки приложений для Web

Процесс разработки приложения для работы в Internet/Intranet мало отличается от процесса создания обычной программы. Если брать такие процессы разработки как RUP, то необходимо подходить к созданию любой программы, будь то настольное приложение или распределенные Web сервисы – одинаково. Этапы процесса практически не отличаются, лишь в зависимости от объема реализуемых функций они могут незначительно сокращаться, пропуская создание отдельных артефактов проекта.

Август 1, 2008 — Рубрика: Теория
Метки: , ,

Web-приложения: “информация на кончиках пальцев”

Сегодня доступ к актуальной информации ведения бизнеса имеет колоссальное значение, поскольку именно от ее наличия или отсутствия зависят управленческие решения. Неверные или же устаревшие данные могут привести не только к упущенной выгоде, но и к значительным материальным потерям.

Июль 30, 2008 — Рубрика: Теория
Метки: , , ,

Средства Rational и сопровождение программных систем

Я не открою Америку, если скажу, что сопровождение программ — это трудоемкий и длительный процесс. Для программистов он означает копание в чужом, плохо структурированном коде, латание “дыр” и постепенное отставание от современных технологий. Для руководителей — это постоянная головная боль от звонков пользователей, напоминание об ошибках, требовавших исправления еще в прошлой версии, трудности с оценкой текущего состояния дел и прогнозом на будущее.

Июль 21, 2008 — Рубрика: Теория
Метки: , , ,

Стоимость разработки базы данных

База данных или программа?

Меня часто спрашивают, а сколько стоит создать базу данных? Сразу возникает встречный вопрос, а что вы понимаете под базой данных? И что нужно в каждом конкретном случае: база данных или все-таки программа? Многие ответят, на секунду задумавшись, что в первую очередь - программа.

Июль 16, 2008 — Рубрика: Новости
Метки: , , ,

OpenGL: раскрой глаза на трехмерную графику

Современный мир уже немыслим без трехмерной графики - в том числе интерактивной. В свое время было предпринято множество попыток создать универсальный язык описания трехмерных сцен. Самой удачной оказалась попытка компании Silicon Graphics - ее язык OpenGL получил всемирное признание

Июль 7, 2008 — Рубрика: Теория
Метки: , , , ,

Достойная замена Visual Studio .NET. SharpDevelop

Если раньше Visual Studio .NET была единственной средой программирования для написания .NET-приложений, то в настоящее время появилось достаточное количество альтернативных разработок. Я буду останавливаться лишь на полноценных IDE, т.к. продвинутые редакторы, обладающие лишь функцией подсветки синтаксиса, в данном случае просто неконкурентоспособны.

Июнь 30, 2008 — Рубрика: Теория
Метки: , , ,