Обратная связь
crowdsourcing DARPA Enterprise 2.0 facilitator Gartner Google IBM idea management Imaginatik knowledge management open innovation social business Social Organization Social Platforms Spigit tacit knowledge wit-проект Witology Агенство стратегических инициатив бизнес-лига Деятельное сообщество инвестиции инновации кейсы коллективный интеллект команда Witology краудрекрутинг краудсорсеры краудсорсинг краудсорсинг-проект краудсорсинг-проекты краудфандинг менеджмент идей метаразум методология мотивация Национальная предпринимательская инициатива НПИ облачное предприятие облачные предприятия общественное благо открытые инновации отчеты предсказания приз производство знаний публикации краудсорсеров рынки предсказаний Сбербанк семинар синтеллектуальный краудсорсинг Социально-семантические сети Социальное предприятие социальные платформы социальные сети социальные технологии Социальный бизнес социо-семантическая сеть ТеМП фасилитатор футбол эпоха социализации и коллаборативизации

От ученья к проектам

Просмотров3009
Комментариев10

9d8993b4d45491b2121274258b183974.jpg
Участники проектно-учебной группы

Не так давно завершился совместный полугодовой проект Witology и Высшей Школы Экономики – проектно-учебная группа «Алгоритмы интеллектуального анализа данных (Data Mining) для интернет-форумов обсуждения инновационных проектов». В рамках работы группы студенты факультета Бизнес-информатики и Отделения прикладной математики и информатики НИУ ВШЭ применяли различные методы анализа данных, изученные ими в университете, на данных Witology.

По итогам проекта была организована финальная встреча с присутствием руководителей проекта со стороны Witology (Ростислав Яворский) и НИУ ВШЭ (Дмитрий Игнатов). На этом мероприятии каждый из студентов вкратце рассказал о своей роли в проекте и о полученных им результатах. Список докладов с аннотациями представлен ниже.

P.S. Если вам интересен какой-либо конкретный доклад или тема, оставьте в комментариях к этому посту заявку – и мы вышлем вам материалы презентации.

UPD.  Архив с докладами семинара теперь доступен по ссылке.
Программа семинара
Утренняя сессия (12:00-14:00)
1. Ростислав Яворский (Witology). Интеллектуальный краудсорсинг и деятельные сообщества.
В докладе перечи слены слабые и  си льные стороны и спользовани я краудсорсинг а в би знесе и  сформули рованы некоторые релевантные задачи , которые и меют четкую математи ческую формули ровку.

2. Алексей Друца (Witology, МГУ). Визуализация данных социосемантической сети.
Рассматривается пакет программ социально-сетевого анализа WitoAnalytics, позволяющий анализировать и визуализировать данные социосемантической сети платформы Witology. На текущий момент он включает более 10 визуализаций социосемантической сети, а также алгоритмы кластеризации и анализа текстовых данных.

3. Александр Воробьев (Witology, МГУ). Определение компетенций участников конкурса и уровня представленных ими проектов.
Рассмотрим некоторый конкурс проектов. В рамках этого конкурса его участники предлагают проекты и оценивают качество проектов, предложенных другими участниками.  Важным условием является возможность участника представить на конкурс любое количество проектов. На основе всех оценок, выставленных участниками проектам, нам необходимо оценить качество проектов и характеристики участников как оценщиков проектов и как авторов (создателей) проектов. Предлагается модель такого конкурса — байесовская сеть, в которой применимы стандартные методы оценки параметров.

4. Алексей Трегубов (Witology, МГУ). Алгоритмы рейтингования участников социальной сети, основанные на марковской модели.
Рассматриваются различные алгоритмы рейтингования участников социальной сети, основанные на марковской модели. Выбираются алгоритмы, наиболее соответствующие  составу и специфике данных с проектов компании Витология, и применяются к этим данным. Сопоставляются результаты их применения .

5. Дмитрий Игнатов, Александра Каминская (ВШЭ, Witology). Цели создания ПУГ. Система анализа данных Witology.
В докладе освящены основные цели создания проектно-учебной группы «Алгоритмы интеллектуального анализа данных ( Data Mining ) для Интернет-форумов обсуждения инновационных проектов». Кроме того, будет  описана система анализа данных коллаборативной платформы компании Witology и результаты некоторых экспериментов. В основу системы положен ряд моделей и методов современного анализа объектно-признаковых и неструктурированных данных (текстов), таких как Анализ Формальных Понятий, спектральная кластеризация, извлечение ключевых словосочетаний и слов из текстов.

6. Константин Блинкин, Никита Ромашкин (ВШЭ). Прототип системы анализа данных CrowDM.
Для достижения ряда задач, стоящих перед проектно-учебной группой,, разрабатывается система анализа данных  CrowDM на основе решеток формальных понятий. В докладе описываются основные возможности, уже реализованные в системе, процесс работы с программой и выдаваемые результаты. Приведены примеры построения решеток понятий, выделения устойчивых понятий и бикластеров по данным проекта Сбербанк-21. Обозначены функциональные возможности, которые планируется реализовать в системе в будущем.

Вечерняя сессия (15:00-17:00)

7. Екатерина Черняк, Даниил Недумов (ВШЭ). Извлечение ключевых слов (ключевых выражений). Реализация алгоритма выделения ключевых слов и словосочетаний. Сравнительный анализ подходов к вычислению сходства тегов. Важной промежуточной задачей в рамках проекта «Алгоритмы интеллектуального анализа данных (Data Mining) для Интернет-форумов обсуждения инновационных проектов» является извлечение ключевых слов и ключевых выражений из текстов сообщений форумов. В докладе освещены общие подходы к проблеме выделения ключевых слов, рассказано о принципах, примененных в проекте. Также представлены два подхода к вычислению сходств тегов и показаны результаты сравнительного анализа эффективности их работы.
Кроме того, в докладе рассмотрены практические аспекты задачи выделения ключевых слов и словосочетаний. Особое внимание уделено использованию внешних приложений для морфологического анализа и программной реализации других этапов алгоритма. Представлены некоторые результаты,
полученные для текстов проекта Сбербанк-21.


8. Ольга Чугунова (ВШЭ). Спектральная и иерархическая кластеризация пользователей по активности и ключевым словам.
В докладе представлен отчет по анализу данных по пользователям проекта методами кластер-анализа. В работе применялись два метода: аддитивно-спектральный метод нечеткого кластер-анализа и иерархический метод кластер-анализа. Первый метод использовался для анализа активности пользователей (по матрице человек-человек-комментарий), второй – для выявления связей между пользователями на основе используемых ими слов (по матрице человек-ключевое слово). Полученные обоими методами результаты, к сожалению, не оправдали ожиданий: интерпретация найденных кластеров оказалась затруднительной.

9. Федор Строк (ВШЭ). Анализ социальных сетей. Результаты экспериментов на данных  Witology.
В данном докладе рассмотрены подходы к анализу данных проекта Сбербанк-21 с точки зрения социальных сетей. Основное внимание уделяется вопросам индексов центральности, отдельного внимание заслуживает изучение взаимосвязи рейтингов, предложенных Witology , и индексов центральности агентов. Так же затрагиваются вопросы визуализации мер центральностей для больших сетей.

10. Андрей Константинов (ВШЭ). Модель рекомендательной системы для внедрения на платформу Witology.
В докладе кратко рассказано о существующих алгоритмах рекомендательных систем, а также о возможностях внедрения рекомендательной системы в платформу Witology в трёх аспектах: рекомендация интересных идей, рекомендация интересных людей, поиск антагонистов.

11. Анастасия Беззубцева (ВШЭ, Witology). Анализ распределений по данным проекта Сбербанк-21: в погоне за power law. О типологиях пользователей коллаборативной платформы.
Одной из задач, поставленных в рамках работы проектно-учебной группы CrowDM, является базовый статистический анализ данных одного из проектов краудсорсинговой платформы Witology. Этой частью исследований в надежде найти интересные закономерности занималась Анастасия Беззубцева. Поскольку деятельность участников сетевых сообществ чаще всего подчиняется степенному закону, именно его Анастасия и пыталась найти, что даже отчасти получилось.  Анализ распределений активности на проекте также требовался для еще одной части исследования – построения типологии пользователей коллаборативной платформы Witology. Полученная типология далека от совершенства, полноты и универсальности, однако уже можно сказать, что на проекте «Сбербанк-21» наблюдались шесть классов пользователей (неактивные, прохожие, критики, создатели, спорщики и звезды), а их активность примерно соответствует близкому к закону Парето правилу Нильсена «90 – 9 – 1»: большая часть сообщества только потребляет и ничего не создает, и лишь на активных единицах держится все сообщество.

  • Опубликовать в Facebook
avatar

Alexandra Kaminskaya

Analyst, Models & Algorithms
0
Alexandra Kaminskaya
26 Ноябрь 2013
доклады можно найти тут:
witology.com/files/FromStudingToProjects_docs.rar
Ответить Ссылка 0
0
Oleg Vostrikov
26 Ноябрь 2013
Спасибо!
Ответить Родитель Ссылка 0
0
Андрей Кривоносов
26 Ноябрь 2013
Все доклады интересные!
Ответить Ссылка 0
0
Oleg Vostrikov
26 Ноябрь 2013
Так тут все доклады интересные!

Можно все посмотреть? :-)
Ответить Ссылка 0
0
Наталия
26 Ноябрь 2013
Особенно заинтересовал доклад Александра Воробьева "Определение компетенций участников конкурса и уровня представленных ими проектов".
Хотелось бы также получить возможность лучше узнать содержание других докладов. Нельзя ли опубликовать их хотя бы тезисно?
Ответить Ссылка 0
0
Evgeny Varkin
26 Ноябрь 2013
Здравствуйте!

Мне очень интересны доклады № 4, 7, 8, 9, 10. Вышлите, пожалуйста, их мне на почту. Спасибо
Ответить Ссылка 0
0
Alexandra Kaminskaya
26 Ноябрь 2013
Ого! Спасибо за такое внимание! В ближайшем времени постараемся все выложить :)
Ответить Ссылка 0
0
Vladimir
26 Ноябрь 2013
Офтопик, но косвенно навеяно этим постом: компания Witology функционирует как традиционная организация. А быть может могла бы как краудсорсинговая :)
Ответить Ссылка 0
0
Vladimir
26 Ноябрь 2013
По пунктам 3, 4, 9 хотелось бы иметь максимально подробную информацию. А также 7. Для остального было бы здорово иметь просто более подробный пост по каждому докладу. В частности по 8, 10, 11.
Ответить Ссылка 0
0
Kadimov Mansur
26 Ноябрь 2013
Я бы тоже хотел иметь доступ ко всем докладам :)
Ответить Ссылка 0