среда, 7 декабря 2016 г.

Немного БигДата: сила в лайках.

За победой Трампа и положительным решением по BrExit стоят большие данные, психометрический метод OCEAN по профилированию пользователей соц.сетей и небольшая британская компания, удачно стянувшая реализовавшая идею белых-пушистых ученых в очередной раз из лучших побуждений опубликовавших чертежи очередной ядерной бомбы

Детальной человеко-читаемое описание возможностей по анализу БД, интересно, что метод довольно точен, быстро обучается, данные легко доступны:
В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель ... смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков — лучше, чем друг. После 150 лайков — лучше, чем родители. После 300 лайков — лучше, чем партнер. С еще большим количеством изученных действий можно было бы узнать о человеке лучше, чем он сам. В день, когда Козинский опубликовал статью о своей модели, он получил два звонка: жалобу и предложение работы. Оба звонка были из компании Facebook.
А что у нас? Не видел публикаций по успешной аналитике VK или Одноклассников, да и нет наверное смысла этим заниматься - данные изымут, на всякий случай:
"Большие пользовательские данные" россиян в интернете должны быть признаны собственностью государства. Об этом заявила ТАСС гендиректор InfoWatch Наталья Касперская, которая также возглавляет подгруппу "Интернет + Общество" при рабочей группе помощника президента РФ Игоря Щеголева.
И очень логично в свете первых двух публикаций - воззвание, опубликованное вскоре после заявления Касперской Евгением Чернышевым:
Нежелание и неспособность создавать революционные инновационные технологии, меняющие глобальную парадигму управления частной собственностью на цифровой ДНК, - не оправдывает популистских слоганов и призывов отдать данные в государственную собственность.
Ну и какие видит купечество варианты развития ситуации? Очевидно самый провальный и катастрофический - не дергаться и впоследствии тушить пожары, а поджигатели найдутся. Другая крайность - действовать по давнишней практике благо у нас не так много стартапов, зато много успешных сатрапов и всё запрещать - данные изъять, фейсбуки наглухо закрыть, вконтактики - тоже поприжать. Но правильный путь всё же в разумном регулировании, сочетании превентивных и реактивных мер и мониторинге атак и угроз.