Коммик (stalinist) wrote,
Коммик
stalinist

Categories:

Компьютер Watson победил; что дальше?

IBM еще раз посрамила человеков своим компьютером: сначала это была победа над Гарри Каспаровым (меньше политиканством надо заниматься, дружок!), а вчера компьютер по имени Watson (так звали товарища Холмса) выиграл с большим отрывом в телепередаче-соревновании с идиотским названием Jeopardy!.

Кстати, про эту передачу. Она существует с 1964 года, ведет ее c 1984 года интеллигентный канадец франко-украинского происхождения Alex Trebek, и она, между прочим, прославляет, поощряет и обогащает многосторонне начитанных людей, то есть людей, которые читают много разных книг. (Насколько сильно обогащает? Как насчет 3 миллионов для чемпиона?) Тем самым эта передача сильно выбивается из распространенного стереотипа о бездумности и убогости американского телевидения.

Суть соревнования состоит в том, что участникам предлагается намек на какой-то культурный, исторический, научный и т.п. факт, а они должны этот факт назвать. Например, самой последней задачей, которую решали два человека и компьютер Watson, было следующее утверждение:

Книга автора William Wilkinson "Сообщение о княжествах Валлахия и Молдавия" вдохновила этого писателя весьма прославленного романа.
 
Подразумевается вопрос: "Кто этот писатель?" (На самом деле по каким-то дурным причинам от участника ожидается вопрос, ответом на который будет представленное утверждение; в данном случае участник должен сказать: "Кто Брем Стокер?")

Говорящие телевизионные головы начали говорить о том, какие перспективы сулит развитие такого компьютерного подхода к медицинской диагностике и т.п. По существу, это всё тот же разговор о так называемых "экспертных системах" или, более общо, об искусственном интеллекте -- разговор, которому не один десяток лет.

Компьютер нашел правильный ответ на вопрос, но то же самое сделал Гуголь за 0,32 сек: я написал в поле поиска "Валахия знаменитый роман", и второй строчкой Гуголь дал мне ссылку на Лукоморье с упоминанием названия романа и имени автора. Как видно, никакого интеллекта для такого сорта вопросов не требуется вообще.

Впрочем, интеллектом и не пахнет и во всех прочих ответах; интеллект предполагает знание контекста и понимание смысла, а не просто сравнение двух слов на совпадение. В общем, пока что компьютер всё еще занимается тупым перебором страниц.

Тем не менее, компьютер продемонстрировал возможности, которые очень ценны и которых всем нам так не хватает.

Пора уже уточнить: дело, конечно, не в компьютере Watson -- дело в алгоритмах и структуре баз данных, которые для него создали. Последние содержат 15 террабайт, включая миллион книг и 200 миллионов страниц. В большинстве случаев компьютер не смог бы пользоваться Интернетом: время поиска слишком велико, а нажать на кнопку нужно было в течение долей секунды, иначе опередят.

В чем же отличие работы этих алгоритмов от Гуголя? Вы можете дать Гуголю фразу, и он найдет страницы, в которых встречаются все слова из этой фразы. Проблема в том, что часто поиск приходится вести так, что часть слов находится на одних страницах, а часть -- на других, то есть надо найти разные страницы по разным запросам и скомбинировать информацию из всех них. Гуголю это совершенно не по силам. Грубо говоря, если нужно проводить одновременно два поиска с разными ключевыми словами, касающимися одной и той же темы, объем поиска возрастает в квадрате; чем больше независимых поисков, тем больше объем -- рост по степенному закону.

Как бы там ни было, если бы Watsonа подсоединили к Интернету с возможностью задавать ему вопросы, он бы очень помог большому числу людей. Сейчас это, очевидно, слишком дорого для массового применения.

Еще один интересный вопрос на злобу дня: у Watsonа на дисках -- миллион книг. Но копирайт на книги обычно включает в себя запрет на использование книги в коммерческих целях. А Watson использовал и заработал миллион долларов! Не потянут ли правовладельцы его в суд за нарушение авторских прав? Я почти уверен, что они были нарушены.

Разумеется, я не имею в виду, что нехорошо нарушать авторские права; я имею в виду, что нехорошо их давать, по крайней мере, в существующей форме.
Tags: computers, internet, mass_media
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic
  • 4 comments