Обратная связь
crowdsourcing DARPA Enterprise 2.0 facilitator Gartner Google IBM idea management Imaginatik knowledge management open innovation social business Social Organization Social Platforms Spigit tacit knowledge wit-проект Witology Агенство стратегических инициатив бизнес-лига Деятельное сообщество инвестиции инновации кейсы коллективный интеллект команда Witology краудрекрутинг краудсорсеры краудсорсинг краудсорсинг-проект краудсорсинг-проекты краудфандинг менеджмент идей метаразум методология мотивация Национальная предпринимательская инициатива НПИ облачное предприятие облачные предприятия общественное благо открытые инновации отчеты предсказания приз производство знаний публикации краудсорсеров рынки предсказаний Сбербанк семинар синтеллектуальный краудсорсинг Социально-семантические сети Социальное предприятие социальные платформы социальные сети социальные технологии Социальный бизнес социо-семантическая сеть ТеМП фасилитатор футбол эпоха социализации и коллаборативизации

Как живет «трубкозуб»?

Просмотров2506
Комментариев0

94800f611838b44b22d5e066a6e1eaed.jpg
Трубкозуб (Aardvark) - в переводе с африкаанса - «земляная свинья». Источник: http://www.animalfactguide.com

9 июня в нашей компании прошел очередной семинар, в рамках которого стажером Александром Воробьевым были рассмотрены алгоритмы работы платформы Aardvark — яркого примера реализации концепции социального поиска, приобретающей популярность в последние годы, которая призвана дополнить, а в чем-то и заменить традиционный контекстный.

Компания Aardvark была основана в 2007 году Натаном Столлом, Максом Вентиллой (выходцы из Google), Дэймоном Хоровицем и Робом Спиро, а в феврале 2010 года была приобретена Google примерно за 50 миллионов долларов.

Тогда же Дэймон Хоровиц и Сепандар Камвар (профессор Стэнфорда, стоявший у истоков гугловской поисковой машины — Kaltix), вдохновленные работой The Anatomy of a Large- Scale Hypertextual Web Search Engine (1998) Сергея Брина и Лари Пейджа, опубликовали статью The Anatomy of a Large-Scale Social Search Engine. Эта статья послужила основой для анализа в рамках семинара.

Авторы статьи постарались изложить концепцию социального поиска в целом, в сравнении с контекстным, а также описать структуру и некоторые модели, лежащие в основе платформы Aardvark — яркого примера реализации этой концепции.

Для парадигмы, лежащей в основе контекстного поиска, авторы предложили название «парадигма Библиотеки», а для лежащей в основе социального — «парадигма Деревни». Так, Библиотека представляет собой структурированную базу данных, и, при возникновении вопроса происходит поиск ключевых слов по «картотеке» Библиотеки. А в Деревне есть люди. И, находясь там, мы будем задавать вопрос людям, причем тем из них, кого считаем наиболее компетентным в данном вопросе и с кем нам удобно общаться. Давайте рассмотрим подробнее разницу в этих двух подходах.

Во-первых, в концепции Библиотеки подразумевается, что поиск идет по ключевым словам, и чтобы что-то найти, пользователю нужно правильным образом подобрать слова, тогда как в Деревне можно сформулировать вопрос в естественной форме разговорной речи. Далее, в Деревне, получив ответ, мы можем задавать уточняющие вопросы (а в Библиотеке так не получится). И, наконец, жители Деревни обладают большим количеством предметных знаний, которые не могут быть формализованы, и соответственно, не занесены в библиотеку.

Таким образом, указанные концепции подразумевают различные области применения: точную, общую, объективную информацию проще и быстрее найти в Библиотеке, не тратя, к тому же, чужого времени, а более предметную или субъективную (опыт, советы в спорных ситуациях) информацию больше шансов получить в Деревне.

Итак, для разрешения вопросов второго плана необходима большая аудитория из компетентных в разных вопросах и мотивированных делиться своими знаниями людей, а также эффективные способы отбора людей, наиболее подходящих для ответа на заданный вопрос.

И все это у Aardvark уже есть! Как же именно построен этот механизм? Существует база данных, в которую входит социо-семантическая сеть, то есть пользователи, между которыми существуют социальные связи, и контент: а именно, вопросы, ответы и комментарии, созданные пользователями, структура тем (тегов), на которые могут поступать вопросы.

Для каждого пользователя определяются теги (читай, области), в которых он компетентен, с весами, отвечающими за степень компетентности. Делается это с использованием, в первую очередь, статистики активности пользователя на платформе: сколько и насколько качественно он отвечал на вопросы из той или иной области. Также здесь используется анализ заполненного пользователем личного профайла, различных блогов и страниц пользователя (например, на Facebook), к которым он дал доступ системе. Также для каждой пары пользователей определяется их способность эффективно взаимодействовать. Для этого оценивается схожесть их профайлов, манеры общения, степени активности на платформе.

Когда в систему поступает вопрос, специальный модуль проверяет, действительно ли это вопрос, не спам ли это, не содержится ли там нецензурная лексика. Далее проверяется, не является ли вопрос тривиальным, т.е. ответ на него легко можно найти с помощью контекстного поиска. В этом случае пользователю будет предложен такой ответ.

Если вопрос прошел все проверки, то с помощью различных алгоритмов для него будут найдены теги, которым вопрос соответствует, с весами, отвечающими за степень соответствия. И теперь из всех членов сообщества выбираются те, у которых одновременно наиболее высокая степень компетентности в отношении выбранных для вопроса тегов и которые способны наиболее эффективно взаимодействовать с пользователем, задавшим вопрос. И, наконец, им отправляется предложение ответить на этот вопрос. И это действительно работает!

Источник:
Оригинальная статья «The Anatomy of a Large-Scale Social Search Engine»

  • Опубликовать в Facebook
avatar

Darya Goncharova

Senior Analyst, Project Department