Кстати, про эту передачу. Она существует с 1964 года, ведет ее c 1984 года интеллигентный канадец франко-украинского происхождения Alex Trebek, и она, между прочим, прославляет, поощряет и обогащает многосторонне начитанных людей, то есть людей, которые читают много разных книг. (Насколько сильно обогащает? Как насчет 3 миллионов для чемпиона?) Тем самым эта передача сильно выбивается из распространенного стереотипа о бездумности и убогости американского телевидения.
Суть соревнования состоит в том, что участникам предлагается намек на какой-то культурный, исторический, научный и т.п. факт, а они должны этот факт назвать. Например, самой последней задачей, которую решали два человека и компьютер Watson, было следующее утверждение:
Книга автора William Wilkinson "Сообщение о княжествах Валлахия и Молдавия" вдохновила этого писателя весьма прославленного романа.
Говорящие телевизионные головы начали говорить о том, какие перспективы сулит развитие такого компьютерного подхода к медицинской диагностике и т.п. По существу, это всё тот же разговор о так называемых "экспертных системах" или, более общо, об искусственном интеллекте -- разговор, которому не один десяток лет.
Компьютер нашел правильный ответ на вопрос, но то же самое сделал Гуголь за 0,32 сек: я написал в поле поиска "Валахия знаменитый роман", и второй строчкой Гуголь дал мне ссылку на Лукоморье с упоминанием названия романа и имени автора. Как видно, никакого интеллекта для такого сорта вопросов не требуется вообще.
Впрочем, интеллектом и не пахнет и во всех прочих ответах; интеллект предполагает знание контекста и понимание смысла, а не просто сравнение двух слов на совпадение. В общем, пока что компьютер всё еще занимается тупым перебором страниц.
Тем не менее, компьютер продемонстрировал возможности, которые очень ценны и которых всем нам так не хватает.
Пора уже уточнить: дело, конечно, не в компьютере Watson -- дело в алгоритмах и структуре баз данных, которые для него создали. Последние содержат 15 террабайт, включая миллион книг и 200 миллионов страниц. В большинстве случаев компьютер не смог бы пользоваться Интернетом: время поиска слишком велико, а нажать на кнопку нужно было в течение долей секунды, иначе опередят.
В чем же отличие работы этих алгоритмов от Гуголя? Вы можете дать Гуголю фразу, и он найдет страницы, в которых встречаются все слова из этой фразы. Проблема в том, что часто поиск приходится вести так, что часть слов находится на одних страницах, а часть -- на других, то есть надо найти разные страницы по разным запросам и скомбинировать информацию из всех них. Гуголю это совершенно не по силам. Грубо говоря, если нужно проводить одновременно два поиска с разными ключевыми словами, касающимися одной и той же темы, объем поиска возрастает в квадрате; чем больше независимых поисков, тем больше объем -- рост по степенному закону.
Как бы там ни было, если бы Watsonа подсоединили к Интернету с возможностью задавать ему вопросы, он бы очень помог большому числу людей. Сейчас это, очевидно, слишком дорого для массового применения.
Еще один интересный вопрос на злобу дня: у Watsonа на дисках -- миллион книг. Но копирайт на книги обычно включает в себя запрет на использование книги в коммерческих целях. А Watson использовал и заработал миллион долларов! Не потянут ли правовладельцы его в суд за нарушение авторских прав? Я почти уверен, что они были нарушены.
Разумеется, я не имею в виду, что нехорошо нарушать авторские права; я имею в виду, что нехорошо их давать, по крайней мере, в существующей форме.